If you want to visit the English version of this blog, please click here.

viernes, 16 de noviembre de 2012

Refuerzos


La consecuencia que un animal obtiene inmediatamente después de un determinado comportamiento se denomina “refuerzo” si provoca que el comportamiento se repita con mayor frecuencia o intensidad, y “castigo” si causa que la conducta tienda a disminuir en frecuencia o intensidad.

Asimismo, y como ya hemos comentado en otras ocasiones, ese refuerzo será “positivo” si implica la adición de un estímulo y “negativo” si supone su eliminación.

El procedimiento más eficaz para modificar la conducta lo constituye el basado en el REFUERZO POSITIVO, ya que el sujeto generalmente estará dispuesto a trabajar duramente para conseguir ese refuerzo, mientras que para evitar un refuerzo negativo suele aplicarse la “ley del mínimo esfuerzo” para escapar del estímulo que produce aversión (además de que se ha demostrado que el empleo de estas medidas aumentan la agresividad y la apatía (Azrin&Holtz, 1966).

Por otra parte, los refuerzos pueden ser “primarios” o “secundarios”. Los primarios (o incondicionados) son aquéllos que tienen un valor intrínseco para el animal sin necesidad de ser asociados a algo percibido como positivo. Digamos que son refuerzos que no necesitan ser aprendidos por el animal como tales, a menudo asociados a elementos vitales, como la comida. Los refuerzos secundarios (o condicionados) son aquéllos que el animal, a priori, no percibe como refuerzo, pues son neutros. Es preciso asociarlos a un refuerzo primario para que el animal lo perciba como algo positivo. Un claro ejemplo son las caricias, los halagos, o la herramienta denominada clicker. Así, si hacemos sonar un clicker, que en principio no supone absolutamente nada para el loro, y simultáneamente le damos una pipa, que se percibe como algo bueno sin necesidad de aprenderlo, tras varias repeticiones, condicionaremos el sonido del clicker de modo que el animal lo percibirá como algo positivo, por lo que habremos convertido algo neutro en un refuerzo (secundario o condicionado).



Hay diversos factores que influyen en la eficacia del refuerzo:

-      CONSISTENCIA: para que algo sea considerado un refuerzo, debe proveerse de forma consistente tras una determinada conducta (al menos en las primeras fases del aprendizaje; más adelante estudiaremos los refuerzos variables). Si enseñas al loro a que diga su nombre tras preguntárselo pero sólo en algunas ocasiones le premias por ello, no entenderá la conexión entre el comportamiento y el premio, por lo que éste perderá parte de su valor como refuerzo.

-      CONTIGÜIDAD: el refuerzo debe proveerse tan pronto como sea posible tras realizarse la conducta. Si tras decir su nombre no premiamos al loro hasta pasados unos segundos (en los que varias conductas habrán ocurrido, aunque sea estar callado), la conducta premiada no se verá reforzada. Este fenómeno ha sido estudiado por Lattal (Lattal, 1995), quién documentó que dejando transcurrir 1 segundo después de coger un disco antes de premiar a un grupo de palomas adiestradas para ello, la conducta fue aprendida, mientras que dejando transcurrir 10 segundos entre la respuesta y el premio su aprendizaje se imposibilitó.

-      FRECUENCIA Y MAGNITUD: Schneider (Schneider, 1973) descubrió mediante diversos experimento realizados con ratas, que resultan más eficaces refuerzos más pequeños y frecuentes, que más grandes e infrecuentes.

Los refuerzos son, como los cepillos de dientes, personales e intransferibles. Lo que para un individuo supone un refuerzo, para otro puede ser un castigo o, al menos, algo que no le motive lo suficiente como para repetir la conducta que lo originó. Supongamos, por ejemplo, que ofrecemos a un niño un caramelo de menta tras haber hecho algo en particular. Si a ese niño en concreto le encanta la menta, disfrutará de su caramelo y lo verá como un premio, por lo que probablemente tenderá a repetir el comportamiento anterior para que le demos más caramelos de menta. Sin embargo, también es posible que al niño le gusten más los caramelos de fresa que los de menta, de modo que cabe la posibilidad  de que repita el comportamiento para obtener otro caramelo, aunque sin mucho esfuerzo o, incluso, que no lo repita pues no se sienta motivado para ello. Por supuesto también podría suceder que ese niño deteste los caramelos de menta, por lo que no lo verá como un premio en absoluto y no hará nada por favorecer el que le ofrezcamos otro caramelo.

La única prueba real que podemos hacer para averiguar si algo motiva, o no, y en qué medida a nuestro loro es verificar si, tras ofrecérselo como recompensa tras una conducta, ésta se repite o no.

En resumen, y siguiendo el trabajo experimental realizado por Sulzer-Azaroff y Mayer (1991) con niños (pero perfectamente aplicable a nuestros loros o a cualquier otro animal), las "reglas" que conviene tener en cuenta a la hora de administrar los refuerzos adecuadamente son las siguientes:

-      Al principio hay que ofrecer el refuerzo INMEDIATAMENTE después del comportamiento deseado. Posteriormente, cuando la conducta se repite con bastante frecuencia, podemos ser algo más flexibles e iremos introduciendo una cierta demora.

-      Al principio, hay que ofrecer el refuerzo SIEMPRE después del comportamiento deseado (proporción Respuesta:Refuerzo de 1:1). Posteriormente, cuando la conducta sea aprendida, podemos ser algo más flexibles y reforzaremos sólo algunas de las respuestas, de forma intermitente.

-      Debemos ser consistentes y tener muy claro el criterio que hará a un comportamiento merecedor de un premio (refuerzo). Dicho criterio podrá ser modificado (elevar el listón) paulatinamente, pero en cada sesión de entrenamiento debemos tener muy claro qué criterios debe reunir una conducta para ser premiada y actuar en consecuencia.

-      Debemos seleccionar cuidadosamente los refuerzos. No debemos dar por supuesto que una pipa de girasol motivará muchísimo a nuestro yaco. Quizás medio cacahuete le estimule mucho más. Del mismo modo, debemos ser cuidadosos con el tamaño del refuerzo, si se trata de comida, para evitar que el animal se sacie demasiado pronto y pierda su valor motivador en medio de la sesión (sin perjuicio de la incidencia que dichos refuerzos puedan tener en la dieta del animal, que estudiaremos en otra ocasión).

-      Es preferible usar una cierta variedad de refuerzos (pipas, caricias, halagos, juegos, cacahuetes, frutas, otras conductas en base al Principio de Premack, etc).

Finalmente, es fundamental recordar que la misión principal del adiestrador es doble: en primer lugar, encontrar aquéllos refuerzos que verdaderamente lo son para el animal con el que estemos trabajando y, en segundo lugar, saber fomentar el máximo número posible de oportunidades para ofrecer esos refuerzos. Aquí radica el verdadero arte de adiestrar.

Para saber más:

Azrin, N. H. & Holz, W. C. (1966). Punishment. In W. K. Honig (Ed.), Operant behavior: Areas of research and application. New York: Appleton-Century-Crofts.

Friedman, S. G., Martin, S. & Brinker, B., (in press, 2005). Behavior analysis and parrot learning. In A. Luescher (Eds.), Manual of Parrot Behavior, (pp. xx). Ames, NY: Blackwell Publishing. http://www.behaviorworks.org/files/text_chapters/DRAFT%20Chapter%20BA%20and%20Parrot%20Learning.pdf

Lattal, K. A. (1995). Contingency and behavior analysis. The Behavior Analyst, 24, 147-161.

Schneider, J. W. (1973). Reinforcer effectiveness as a function or reinforcer rate and magnitude: A comparison of concurrent performance. Journal of Experimental Analysis of Behavior, 20, 461-471.

Sulzer-Azroff, B., & Mayer, G. R. (1991). Behavior analysis for Lasting Change. Orlando, FL: Harcourt, Brace, Jovanovich.

No hay comentarios:

Publicar un comentario

Agradezco que dejes tu opinión en este blog.