PUBLICIDAD

Actualidad y Artículos | Neuropsiquiatría y Neurología   Seguir 49   Favorito

Me Gusta   2 2 Comentar  2 2

La información de los códigos de corteza orbitofrontal de primates es relevante para gestionar las compensaciones de exploración-explotación

  • Autor/autores: Vincent D. Costa y Bruno B. Averbeck



0%
Artículo | Fecha de publicación: 19/05/2020
Artículo revisado por nuestra redacción

El aprendizaje de refuerzo (RL) se refiere al proceso de aprendizaje conductual para obtener recompensas y evitar el castigo. Un componente importante de RL es la compensación explorar-explotar, que se refiere al problema de elegir entre explotar opciones con valores conocidos y explorar opciones desconocidas. Examinamos correlatos de esta compensación, así como otras variabl...



PUBLICIDAD


Este contenido es exclusivo para suscriptores.

Crea tu cuenta gratis y léelo completo ahora.

¿Ya estás registrado? Inicia sesión aquí.

Regístrate gratis Iniciar sesión

El aprendizaje de refuerzo (RL) se refiere al proceso de aprendizaje conductual para obtener recompensas y evitar el castigo. Un componente importante de RL es la compensación explorar-explotar, que se refiere al problema de elegir entre explotar opciones con valores conocidos y explorar opciones desconocidas.


Examinamos correlatos de esta compensación, así como otras variables relacionadas con RL, en la corteza orbito-frontal (OFC), mientras que tres monos machos realizaron una tarea de aprendizaje de bandidos de 3 brazos. Durante la tarea, las nuevas opciones de elección reemplazan periódicamente las opciones familiares.


Los valores de las nuevas opciones eran desconocidos, y los monos tuvieron que explorarlos para ver si eran mejores que otras opciones disponibles actualmente. La identidad del estímulo elegido y el resultado de la recompensa estaban fuertemente codificados en las respuestas de las neuronas OFC individuales. Estas dos variables definen los estados y las transiciones de estado en nuestro modelo que son relevantes para la toma de decisiones. El valor elegido de la opción y el valor relativo de explorar esa opción se codificaron en niveles intermedios. También encontramos que la codificación del valor OFC era específica del estímulo, en oposición al valor de codificación independiente de la identidad de la opción. La ubicación de la opción y el valor del entorno actual se codificaron en niveles bajos.


Por lo tanto, encontramos la codificación de las variables relevantes para el aprendizaje y la mediación de la compensación de exploración-explotación en OFC. Estos resultados son consistentes con los hallazgos en el estriado ventral y la amígdala y muestran que esta red conectada mono-sinápticamente juega un papel importante en el aprendizaje basado en las consecuencias inmediatas y futuras de las elecciones.


Para acceder al texto completo consulte las características de suscripción de la fuente original:https://www.jneurosci.org

Comentarios de los usuarios



No hay ningun comentario, se el primero en comentar


Publicidad

Recomendamos

Stahl. Casos Clínicos Volumen 4 niños y adolescentes. Psicofarmacología Esencial

...

VER MÁS
VER TODO
Daridrexant
Publicidad

Próximos cursos

CFC Solicitado créditos

Actualización en el tratamiento de la dependencia a la cocaína

Inicio: 10/06/2026 |Precio: 120€