Le clicker training

Principe :

vivaclicCette méthode consiste à renforcer les comportements souhaités du chien par une récompense qui n’est pas de la nourriture comme en méthode naturelle, mais le petit bruit « clic-clac » d’un clicker.

Mais comment ce bruit peut-il constituer une récompense? C’est que pendant un premier temps on apprend au chien que ce « clic-clac » est toujours suivi d’une friandise. Le chien associe bruit et récompense et ce petit bruit devient très motivant pour lui.

Mais quel est l’intérêt de remplacer la récompense directe sous forme de friandise par un bruit suivi d’une friandise? Nous trouvons la réponse en revenant à l’origine de cette méthode

vivcicouEn 1970, Karen PRIOR, dressait des dauphins. Il les récompensait en leur distribuant des petits poissons. Le problème est qu ‘il s’ écoulait un temps plus ou moins long entre le moment où le dauphin exécutait ce que le dresseur attendait et l’ arrivée de la récompense. D’ où la difficulté de bien faire comprendre au mammifère marin ce que l’ on attendait vraiment de lui. En effet l’animal reproduit l’action qui précède exactement la distribution de la gourmandise. Pas celle qu ‘il exécutait deux ou trois secondes avant. Le clicker apporte donc une grande précision. L’animal comprend exactement que c’est cette action qui déclenche le clicker. Il va la reproduire pour entendre à nouveau le « clic-clac » et avoir sa friandise.

Description de cette technique :

jigsaluConditionnement classique de PAVLOV : le chien répond à un stimulus B si ce dernier est associé assez longtemps à un stimulus A débouchant sur la satisfaction d’ une motivation primaire.

Le bruit de la boîte de nourriture (stimulus B) provoque l’arrivée du chien qui attend la gamelle (stimulus A) qui lui permet d’ assouvir sa faim.

Pendant quelques jours, à raison de trois à quatre séances de 10 à 15 répétitions, on conditionne le chien à associer clicker et friandise. Pour cela on jette une friandise au sol et on clique à chaque fois que le chien s’ apprête à la ramasser.

Conditionnement opérant de SKINNER : il met en évidence l’ influence de l’ environnement sur le comportement du chien.

  • Si la réponse est positive (récompense) le comportement sera reproduit (renforcement).
  • Si la réponse est neutre ou négative (punition), le comportement disparaît plus ou moins rapidement (extinction)

Le chien veut rentrer. Il saute sur la porte et par hasard appuie sur la poignée. Il peut rentrer (récompense). Ce comportement sera reproduit chaque fois qu ‘il voudra rentrer (renforcement). Si la réponse est neutre (la porte est fermée) ou négative (jet d’eau=punition), le comportement disparaît plus ou moins rapidement (extinction)
Le chien va rapidement constater que certaines de ses actions déclenchent le clicker, d’ autres non. Il va bien sûr reproduire celles qui déclenchent le clicker.
Quand le chien propose spontanément plusieurs fois de suite une action, on y associe un mot, puis on clique et on donne la friandise. Le chien va associer ce mot à son action et à la récompense. Il reproduira rapidement cette action dès qu ‘il entendra le mot que vous lui avez associé (qui devient l’ ordre) car il sait que cela déclenchera le clicker dont vous l’ avez rendu fou.

Comment obtenir un comportement voulu : trois solutions sont possibles.

  • Le modelage (shaping) : On guide, par des clics judicieux le chien vers le
  • Le ciblage (leurre) : On utilise une cible (baguette, main) pour guider le chien vers le comportement souhaité, puis on clique.
  • L’ action spontanée : On clique un comportement souhaité que le chien propose spontanément.

clicaniche1clicaniche2

Avantage de la méthode Clicker Training :

  • Méthode basée sur le renforcement positif.
  • C’est le chien qui propose. Il reste joyeux et confiant.
  • L’apprentissage et plus sûr car il n’ y a ni conflits ni doutes.
  • On respecte toujours le chien.
  • Le chien est demandeur et reste plus attentif.
  • La précision du clic garantit un meilleur apprentissage.

Voir aussi :