La friandise dans l’éducation des animaux de compagnie rencontre de nombreux adeptes et opposants. Cet article vise à éclaircir la théorie qui se cache derrière ce stimulus pour en comprendre les différents avantages, les réticences à son utilisation, ainsi que les techniques pour l’introduire.
Avant de pouvoir aborder le sujet en profondeur, commençons par quelques définitions.
Qu’est-ce qu’un renforçateur ?
Un renforçateur est un stimulus qui augmente la probabilité d’apparition d’un comportement et qui rend ce comportement plus fréquent (ou plus rapide, plus haut, par exemple, selon le type de comportement). Ainsi, si les individus sont « récompensés », les comportements eux, sont « renforcés ».
Il existe plusieurs types de renforçateurs. Les connaître peut nous aider à prendre la mesure de leur importance dans un processus de création ou de modification comportementale.
Les renforçateurs primaires
Les renforçateurs primaires ne dépendent pas d’une association avec un autre renforçateur et nous n’avons pas besoin d’y avoir été préalablement exposé pour qu’ils trouvent leur valeur renforçatrice : la nourriture quand on a faim, l’eau quand on a soif, le chaud quand on a froid, le froid quand on a chaud, la stimulation sexuelle et le contact humain sont différents renforçateurs primaires.
John Baldwin (2007) a défini la stimulation sensorielle comme un renforçateur primaire. Biederman & Vessel (2006) ont identifié le fait même d’apprendre comme un renforçateur primaire (d’ailleurs nous parlons souvent de « dévorer un livre ou de l’information »).
Avoir du contrôle sur son environnement est un renforçateur primaire pour tout individu, au même titre que la nourriture, l’eau, le sexe, etc.
Les renforçateurs secondaires
Les renforçateurs secondaires dépendent d’une association avec un renforçateur primaire (ou avec un autre renforçateur secondaire) : les félicitations, la reconnaissance ou les compliments sont de possibles renforçateurs secondaires. Les renforçateurs secondaires sont partout, tout le temps et les mener à satiété est beaucoup plus difficile que les renforçateurs primaires. On ne se lasse que rarement d’être félicité pour qui nous sommes ou ce que nous faisons (particulièrement quand la forme change ; par exemple, bravo-bravo-bravo pourrait mener plus vite à une satiété que bravo-c’est super-je suis fière de toi).
Les renforçateurs généralisés
Les renforçateurs secondaires qui auront été associé avec plusieurs autres renforçateurs sont des renforçateurs généralisés.
L’association qu’il a avec la quasi intégralité des renforçateurs primaires fait de l’argent l’un des renforçateurs généralisés des plus puissants. L’argent achète la nourriture, la climatisation, le chauffage, et parfois même le contact humain et la sexualité également.
Il est également associé à des renforçateurs secondaires car il peut aussi acheter des consoles de jeu, des téléviseurs, des voitures, etc.
Mais pour que les euros que nous avons dans nos poches continuent à être des renforçateurs généralisés, ils doivent être régulièrement associés à des renforçateurs primaires. Si je vous tends mille billets de 500, ils ne seront renforçateurs que si la monnaie en question existe encore.
Si je vous offre mille billets de 500 anciens francs, ce sera tout de suite bien moins renforçateur que s’il s’agit de mille billets de 500 euros.
Les renforçateurs naturels ou artificiels
Les renforçateurs primaires et secondaires peuvent être classés dans deux catégories : renforçateurs naturels ou renforçateurs artificiels.
Les renforçateurs artificiels sont ceux qui sont mis en place par une personne pour modifier la fréquence d’un comportement.
Les renforçateurs naturels sont ceux qui ont un pouvoir renforçateur « automatique » et naturel après l’émission d’un comportement.
Renforçateurs primaires ou secondaires peuvent donc entrer dans l’une ou l’autre des catégories selon qu’on les ait placés là pour modifier la fréquence d’un comportement ou que le renforçateur soit spontanément une conséquence à un comportement.
Par exemple, si vous regardez un film comique qui vous fait rire, l’amusement sera un renforçateur naturel. A contrario, si votre conjoint.e vous dit à quel point vous êtes joli.e quand vous riez, dans le but de vous voir sourire plus souvent, c’est un renforçateur artificiel.
Il y a quelques années, une question (pas vraiment existentielle pourtant) me turlupinait : lorsqu’un perroquet lisse les plumes d’un autre (les perroquets ayant une forte relation amicale ou amoureuse se grattent mutuellement les particules de kératine entourant les nouvelles plumes en période de mue), est-ce un renforçateur primaire ou secondaire ?
Après avoir lu et étudié une tonne de littérature au sujet des renforçateurs, je n’étais malgré tout pas capable de statuer sur ce renforçateur. Je me disais que c’était forcément primaire puisque le comportement existe même chez les perroquets qui ont été retirés du nid de leur parent et élevés à la main par les humains. Mais en même temps il ne s’agit pas d’un renforçateur lié à la « survie » tel qu’on classifie les renforçateurs primaires, donc il doit être secondaire.
C’est forcément un renforçateur naturel puisque le comportement semble auto-renforcé mais en même temps, il s’agit peut-être aussi d’un renforçateur artificiel pour voir le comportement de lissage de plumes de l’autre perroquet augmenter (il semblerait que les perroquets le fassent chacun leur tour).
Complètement perdue puisque j’étais finalement en train de classer ce renforçateur dans toutes les catégories, j’ai écrit et posé cette question au Dr Susan G. Friedman, professeur émérite en psychologie et pionnière dans l’utilisation de l’analyse appliquée du comportement chez les animaux de compagnie et captif, et je vous partage ici sa réponse :
« Je pense que cette dichotomie stricte entre les renforçateurs primaires et secondaires n’est pas utile dans la pensée contemporaine.
Les renforçateurs primaires sont des conséquences qui renforcent naturellement le comportement – ils n’ont pas besoin d’un historique pour acquérir leur fonction de renforcement du comportement. Donc, j’imagine que les perroquets naissent avec la tendance à utiliser leur bec de cette façon, mais il doit y avoir beaucoup d’apprentissage impliqué dans le comportement aussi.
Nous savons que si le comportement se répète, c’est qu’il y a un effet renforçateur.
Mais, qu’importe, finalement, quelle étiquette nous lui donnons ? »
Qu’importe finalement l’étiquette, ce qui nous intéresse, c’est de savoir si ce stimulus particulier va augmenter le comportement désiré ou non.
On espère que nos nouveaux comportements apporteront des renforçateurs naturels rapidement mais au début, la meilleure stratégie est certainement d’apporter des renforçateurs artificiels.
Comment fonctionne un renforçateur ?
La manière dont un renforçateur est délivré affecte considérablement son efficacité. Le renforcement d’un comportement sera le plus efficace lorsque le renforçateur sera délivré de manière contingente et contigu.
Cela signifie que le renforçateur Y doit dépendre du comportement X et ce, dans un intervalle de temps très court voire immédiat.
Si je performe le comportement X, je sais que le renforçateur Y va arriver tout de suite après, et c’est pour ça que je vais répéter mon comportement.
Exemple : si je mets un euro dans la machine à café et que j’appuie sur le bouton (comportement), je sais qu’un gobelet et mon café vont en sortir (renforçateur contingent) tout de suite après (contigu) ce qui fait que la prochaine fois que je voudrai un café, mon comportement va se répéter.
Plus le délai d’attente entre le comportement et la conséquence (le renforçateur) est long, moins le renforçateur est efficace.
Nous avons donc tous besoin de voir nos comportements renforcés immédiatement et en adéquation, pour pouvoir les répéter de plus en plus souvent.
D’autres caractéristiques affectent l’(in)efficacité d’un renforçateur : la satiété, la privation, le type de renforçateur, la variété, les préférences individuelles, etc.
Même si l’argent est considéré comme étant un renforçateur de grande importance pour les humains, son efficacité sur les comportements des personnes travaillant bénévolement est amoindrie. La valorisation, l’estime de soi, le bonheur des autres, la reconnaissance, et le succès d’une mission sont par contre eux des renforçateurs bien plus efficaces dans ce type de scénario.
Plus nous aurons de renforçateurs disponibles et plus nos « bons » comportements augmenteront.
Quel renforçateur pour mon animal ?
Une grande partie du succès de la création ou de la modification comportementale repose sur le fait de trouver ce qui motive le plus l’apprenant.
Thorndike, précurseur du béhaviorisme, a développé le principe de « La loi de l’effet » en 1898, qui stipule qu’un comportement qui produit un effet satisfaisant dans une situation sera plus susceptible de se reproduire dans cette même situation. A l’inverse, un comportement qui produit un effet inconfortable dans une situation sera moins susceptible de se reproduire dans cette même situation.
En d’autres termes, mon chien sera plus susceptible de répéter le comportement « assis » lorsque je lui donne le signal « assis » si ce comportement produit un effet satisfaisant… pour mon chien.
Les études scientifiques tendent à démontrer que l’utilisation de procédure de renforcement positif est la plus efficace pour l’apprentissage d’un nouveau comportement (Blackwell et al, 2008 ; Ziv, 2017 ; Mills et al, 2020). Cela signifie que pour voir augmenter la fréquence d’apparition d’un comportement, la méthode la plus efficace sera d’ajouter un stimulus apprécié par l’animal après l’émission de son comportement.
Chaque individu est différent.
Chaque individu a ses propres préférences.
Chaque situation est différente.
Cela signifie qu’en fonction de l’individu et du contexte dans lequel on souhaite lui apprendre un comportement, le renforçateur pourra prendre énormément de formes différentes.
Parfois le plus adapté sera peut-être la nourriture, parfois une caresse, parfois des félicitations, parfois le choix, etc.
Le plus important à retenir lorsque l’on doit choisir un renforçateur pour notre animal, c’est que ce n’est pas à nous de le choisir !
Si on souhaite que le comportement de notre chien, de notre chat, de notre perroquet ou de notre cheval augmente, il faut que l’individu lui-même trouve *ce* stimulus dans *cette* situation renforçateur.
Pour définir ce que cela pourrait être pour notre apprenant, nous pouvons mener des tests et vérifier tant dans la fréquence future du comportement que dans le langage corporel de l’individu lequel a le plus de valeur.
Les friandises comme renforçateurs
Si la légende dit que les chiens écoutent leur maître pour leur faire plaisir, la réalité, elle, est toute autre.
N’en déplaise à notre égo, les chiens semblent plus attirés par les renforçateurs primaires alimentaires que par notre attention et nos félicitations (Feuerbacher & Winne, 2013, 2014), et il en serait de même pour les chats (Willson et al, 2017).
Les friandises ont donc l’avantage de permettre un apprentissage plus efficace et plus rapide que l’interaction avec l’humain (félicitations et/ou caresses).
Bien que scientifiquement étudiée, documentée et plébiscitée, l’utilisation de friandises dans l’éducation des animaux de compagnie rencontre encore aujourd’hui des réticences.
*L’une des principales est la prise de poids que pourrait engendrer la prise alimentaire lors de séances d’entraînements.
Afin de creuser cette réticence, il faut avant tout en revenir à ce que nous savons de l’utilisation de nourriture dans l’apprentissage d’un comportement. Si nous cherchons effectivement à délivrer un stimulus apprécié par l’animal après l’émission de son comportement, c’est la qualité du renforçateur qui primera au-delà de la quantité (Riemer et al, 2018). Cela signifie qu’en utilisant une friandise particulièrement appréciée par le chien, une petite quantité permettra un apprentissage et des performances plus efficaces et plus rapides qu’une grande quantité d’un renforçateur moins apprécié.
Dans un second temps, lors de l’apprentissage d’un nouveau comportement, nous recherchons une fluidité dans la session avec un haut de renforcement, rapide, ce qui ne serait pas permis avec de grosses friandises que l’animal devrait alors mâcher/mastiquer pendant plus longtemps.
Si la prise de poids peut aujourd’hui être une réticence à l’utilisation de renforçateurs primaires alimentaires, nous pouvons alors suggérer :
- D’utiliser des renforçateurs alimentaires faibles en matières grasses
- D’utiliser des renforçateurs alimentaires en très petits morceaux
- De diminuer la ration des repas quotidiens
- D’utiliser une partie de la ration des repas quotidien en renforçateur
- D’augmenter l’activité physique du chien
- D’utiliser des renforçateurs alimentaires naturels, sans sous-produits, sans conservateurs, sans sucres ajoutés
*Une autre réticence provient parfois du fait que l’humain pense que son animal n’est pas motivé par la nourriture.
Je ne sais plus à qui revient cette phrase mais je la garde en tête depuis que je l’ai entendu il y a des années :
« Un animal qui n’est pas motivé par la nourriture est un animal mort »
Du moment qu’un individu se nourrit, il est alors motivé par la nourriture. Mais peut-être ne l’est-il par la nourriture qu’ON lui offre.
Plusieurs questions peuvent alors se poser pour améliorer la situation :
- Est-ce que l’animal pourrait avoir un problème de santé ?
- Est-ce que des friandises plus intéressantes ont été proposées ?
- Est-ce que les friandises sont proposées dans des contextes où l’animal est en inconfort ?
- Est-ce que la friandise est délivrée d’une manière qui met le chien en inconfort ?
- Est-ce que les friandises sont variées ?
La variété est l’épice de la vie. Tout comme les humains, les animaux peuvent avoir des goûts variés et ces goûts ne sont pas figés dans le temps.
Si on me propose de l’avocat au déjeuner, au dîner et au souper tous les jours pendant une semaine, même si j’adore l’avocat, au 8ème jour, je n’en voudrais plus une seule bouchée.
Chez les chiens, l’effet de variabilité propose d’utiliser plusieurs friandises différentes lors des sessions d’entraînement en renforcement positif plutôt que la même friandise au cours des répétitions (Bremhorst, A., Bütler, S., Würbel, H. et al., 2018).
Qui plus est, si l’animal ne sait pas sur quelle friandise il va tomber après l’émission de son comportement, il en sera d’autant plus motivé.
Le neuroscientifique Michael Platt a suggéré que les neurones s’activaient plus rapidement pour des renforçateurs systématiquement élevés que pour des gains plus faibles. Il a également découvert que les neurones étaient particulièrement actifs pour les renforçateurs « surprise ».
La surprise créée la motivation !
Pour les animaux les plus timides avec la nourriture, nous pouvons renforcer le comportement de manger avec un renforçateur apprécié (un jouet, des félicitations, des caresses, …), comme tout autre comportement, avec un renforçateur apprécié par l’apprenant pour voir la fréquence du comportement de manger des friandises augmenter au fur et à mesure des séances.
*Une des principales réticences que l’on peut retrouver quant à l’utilisation de friandises dans l’éducation d’un animal de compagnie est que ce dernier devrait obéir sans avoir à user de stratagèmes pour ça.
Ces réticences émanent souvent de la théorie de la dominance, selon laquelle l’humain devrait avoir un statut hiérarchique plus élevé que le chien. Cette perspective propose que le comportement des chiens reflète la hiérarchie rigide et structurée qui a été décrite chez les meutes de loups et recommande que l’humain applique une dominance solide envers son compagnon pour une relation stable.
La dominance chez le chien est un concept ambigu car il peut avoir deux définitions selon les connaissances éthologiques de l’interlocuteur.
Si la dominance, d’un point de vue éthologique, est bien documentée chez le chien, la plupart des conseils injustement donnés en son nom reflètent plutôt des procédures de punition. Ces interventions punitives peuvent pourtant faire place à des effets secondaires mettant en péril la santé physique et psychologique de l’animal ainsi que la sécurité des personnes interagissant avec (Herron, Reisner & Shofer 2009 ; Arhant et al 2010 ; Casey et al 2010 ; Azrin, Hutchinson & Heck 1966 ; Rilling & Caplan 1973).
Aucun être vivant ne se comporte par bonté inconditionnelle.
Le chien, le chat, le perroquet, le cheval, la tortue ou n’importe quelle autre espèce animale est soumise aux mêmes lois et principes fondamentaux de l’analyse du comportement que chaque humain. Cela signifie que n’importe quelle espèce, n’importe quel individu, va répéter les comportements qui « fonctionnent » et diminuer les comportements qui « ne fonctionnent pas ».
Afin de préserver notre relation de confiance avec notre animal, limiter les effets secondaires indésirables de certaines procédures, et être en accord avec ce que la science nous offre, l’utilisation d’une friandise après l’émission d’un comportement pour en voir augmenter la fréquence est donc non seulement tout à fait valable et valide, mais correspond également aux lois de l’apprentissage d’un animal de compagnie.
Une meilleure compréhension du terme « dominance » et de la dynamique qui en découle pourrait nous aider à mieux comprendre et à améliorer notre relation avec nos chiens. Clive Wynne (2021) a récemment proposé un article regroupant une multitude de recherches sur la dominance chez les chiens et conclut s’ils en font bien l’expérience, elle est pourtant très différente entre chiens et entre chiens et humains.
*D’autres réticences à l’utilisation de friandises en renforçateurs peuvent être constatées, comme par exemple le fait que ce soit de la manipulation.
Il existe une différence importante entre corruption, manipulation, chantage et renforcement.
Les trois premiers sont des conditions qui arrivent avant l’émission d’un comportement.
Le renforçateur, lui, arrive après l’émission d’un comportement, en récompensant l’apprenant, pour :
– voir le comportement se répéter plus souvent dans des situations similaires
– augmenter la réponse émotionnelle positive de l’apprenant dans cette situation
La nourriture n’agit donc pas ici comme une monnaie d’échange mais comme un outil d’apprentissage.
*La dernière réticence dont je voudrais parler est la peur de devoir utiliser des friandises toute la vie pour chaque comportement demandé à son animal.
S’il est exact de dire qu’un comportement doit régulièrement être renforcé pour qu’il se maintienne dans le temps, les renforçateurs peuvent être variés.
L’utilisation de friandises dans la création et la modification comportementale comporte de très nombreux bienfaits :
- C’est simple (et la facilité c’est quelque chose de vraiment génial dans la vie contrairement à la complexité qui est quelque chose de vraiment peu chouette dans la vie)
- C’est rapide
- C’est instinctif
- Ça fait plaisir à l’animal
Je démarre quasiment tous mes protocoles de training avec des friandises, au moins 5 sortes de différentes valeurs, tailles, formes, goûts.
Quand le comportement de mon animal devient fluide, qu’il répond à mon signal sans latence, que son langage corporel est digne des chiens heureux de Disney, je vais alors commencer à varier mes renforçateurs voire parfois à diminuer l’apport de renforçateurs.
Par exemple, quand j’ai appris à Marley, mon chien-loup tchécoslovaque à rentrer du jardin pour revenir à la maison quand je l’appelais, il obtenait systématiquement une friandise de très haute valeur à son retour. Puis lorsqu’il revenait dès que je l’appelais, j’ai commencé à parfois lui donner une friandise de très haute valeur, parfois une friandise plus « standard », puis parfois je l’ai félicité grandement avec une voix très aigue et chantante, parfois je lui ai gratté les fesses, puis parfois je refermais juste la porte derrière et parfois je le laissais repartir.
L’utilisation de renforçateurs de façon très régulière est impérative pour maintenir la fréquence d’un comportement, mais le rythme auquel ces renforçateurs sont délivrés peut varier.
Les différents rythmes de renforcement
Nous avons vu que pour qu’un comportement se maintienne ou augmente, il doit être renforcé. Il existe différents rythmes auxquels on peut renforcer un comportement, appelés programmes de renforcement, qui apportent une différence dans la fréquence de distribution de renforçateurs.
Le plus simple programme de renforcement est le renforcement continu. Chaque occurrence du comportement est renforcée.
A chaque fois que mon perroquet fait X, renforçateur Y est là.
Par exemple, à chaque fois que mon perroquet atterrit sur mon bras quand je dis « Hop », je lui donne un bonbon.
Lorsque le renforcement n’est plus systématique et continu, il est alors intermittent.
Il existe plusieurs programmes de renforcements intermittents, dont voici quelques exemples :
- Ratio fixe
Dans un ratio fixe, on renforce seulement un certain nombre de réponses au lieu de renforcer toutes les occurrences du comportement comme le fait le renforcement continu.
Le nombre de réponse est le même entre chaque renforcement.
Exemple : je donne une friandise à mon chien après qu’il se soit mis assis trois fois.
Un des effets à surveiller lorsqu’on utilise ce type de renforcement intermittent est la pause qui suit le renforcement (« pause post-renforcement»), avant de reprendre la série de comportements nécessaires avant un autre renforçateur. Cette pause peut parfois ressembler à de la fatigue mais elle aurait en fait comme principale fonction d’échapper à l’aspect aversif du rythme de renforcement (Perone, 2003). Plus le ratio fixe est élevé (par exemple le renforcement arrive tous les 50 assis) et plus le renforçateur est faible (après 50 assis, avoir une friandise puis je dois reprendre une série de 50 pour en avoir une autre), plus la pause sera longue.
En définitive, plus on doit travailler dur pour obtenir un renforçateur et moins on aura envie de travailler.
- Ratio variable
Le programme de renforcement à ratio variable consiste à varier le nombre de réponses avant renforcement mais en restant dans une moyenne.
Par exemple, si je souhaite voir mon comportement de faire des pompes renforcées en moyenne toutes les 5 pompes, je vais générer plusieurs chiffres dans cette moyenne de 5 et le renforcement arrivera, par exemple, après une série de 2 la première fois, puis une série de 3 puis une autre série de 3, puis une série de 7 et enfin une série de 10.
Dans ce type de renforcement intermittent, la pause post-renforcement peut apparaître mais sera en général de plus faible durée et moins souvent présente après les renforcements.
- Durée fixe
Un autre type de renforcement est le programme de renforcement à durée fixe.
Ici, le comportement doit avoir lieu durant tout le temps préalablement défini pour être renforcé.
Par exemple, mon cochon doit rester sur place pendant 20 secondes exactement pour obtenir une gratouille sur le dos.
- Durée variable
Dans un renforcement à durée variable, la quantité de temps varie de manière aléatoire avant renforcement mais en restant dans une moyenne.
Par exemple, si vous souhaitez voir le comportement de jouer du piano de votre enfant renforcé toutes les 10 minutes en moyenne, vous allez lui délivrer un renforçateur à différentes variables entre 5 et 15 minutes. Cela permettra d’être récompensé après 11 minutes pour la première série, puis 8, puis 5 puis 11 et ainsi de suite. On acceptera parfois plus facilement le « travail » (jouer du piano ici) si on sait qu’on peut effectivement en faire 15 minutes mais aussi n’en faire que 5 minutes.
Donner une friandise, ce n’est pas si complexe !
Au final, si l’action de donner une friandise n’est peut-être pas complexe en soi, comprendre toute la théorie qui se cache derrière permet de mieux considérer ce stimulus comme un outil de communication plutôt que comme de la manipulation.
Réponses
Excellent article !! Merci beaucoup ❤️
Dernière petite chose qui me turlupine à propos de l’utilisation de la friandise (que j’utilise beaucoup). C’est le fait de l’utiliser régulièrement au cours de la journée (plusieurs sessions d’apprentissages-renforcement de bons comportements en balade…) et que le système digestif du chien a donc moins de temps de repos.
Quels sont tes éclairages à ce propos ?
Merci encore pour ce super article ☺️
Merci Lisa pour cette belle mise au point. Je m’empresse de partager cet article, car l’usage régulier de la friandise, et même de toute forme de récompense est souvent mal considéré même parmi des personnes bienveillantes.
Arrête-t-on de dire merci, parce que tous les jours notre voisin nous tient la porte?