neurociencia, dopamina
![]() |
| Animación: Fabio Buonocore |
Desde hace mucho tiempo se la conoce como la reguladora de la recompensa en el cerebro, pero hallazgos recientes podrían dar un vuelco a esta teoría clásica sobre la función de la dopamina.
18 marzo 2026.- La dopamina es uno de los neurotransmisores más estudiados, sustancias químicas que transmiten señales de célula a célula. Es el que goza de mayor reconocimiento fuera de la neurociencia: a menudo se la conoce como la "sustancia química del placer" y se la asocia con la sensación de recompensa que se obtiene al consumir drogas recreativas o navegar por las redes sociales.
Eso es una simplificación excesiva de la función de la dopamina; en eso, los investigadores coinciden. Pero más allá de eso, donde antes existía un modelo sencillo que explicaba cómo funciona la dopamina en el cerebro, ahora hay desafíos que buscan enmendar la teoría, o incluso refutarla .
Esto podría tener implicaciones no solo para la neurociencia básica, sino también para los clínicos que intentan explicar y tratar afecciones como el trastorno por déficit de atención con hiperactividad (TDAH) y la adicción . Si el modelo es erróneo o necesita modificaciones, es posible que también lo sean algunas de las suposiciones sobre las causas de estos trastornos y la mejor manera de tratarlos.
El gran debate sobre
la dopamina
Un neurotransmisor al que se creyó comprender durante décadas está revelando una complejidad que sacude los fundamentos de la neurociencia moderna.
Investigación de Síntesis · Neurociencia Cognitiva y Molecular
La hipótesis que dominó la neurociencia del aprendizaje durante más de veinticinco años se enfrenta hoy a su mayor crisis de credibilidad: la dopamina hace mucho más —y algo diferente— de lo que se pensaba.
Desde 1997, la denominada hipótesis del error de predicción de recompensa (RPE, por sus siglas en inglés) ha gobernado la comprensión científica de la dopamina. Propuesta originalmente por Wolfram Schultz y sus colegas, la teoría sostenía que las neuronas dopaminérgicas del área tegmental ventral (ATV) del cerebro disparan señales cuando la realidad supera las expectativas —y se silencian cuando la recompensa anticipada no llega. Un sistema elegante, cuantificable, y perfectamente alineado con los modelos computacionales de aprendizaje por refuerzo.
Hoy, ese edificio no está derrumbado, pero muestra grietas profundas. Una oleada de investigaciones entre 2020 y 2025 ha demostrado que la dopamina opera en dominios que la hipótesis RPE no puede explicar con comodidad: el control motor, la motivación, los comportamientos sociales y la detección de errores en información no relacionada con la recompensa.
El veredicto de 2025
En octubre de 2025, un estudio publicado en Nature Communications por investigadores de múltiples instituciones ofreció uno de los golpes más directos a la hipótesis canónica. Usando sensores de fuerza y registro simultáneo de la actividad dopaminérgica en ratones, el equipo identificó distintas poblaciones de neuronas del ATV sintonizadas con la dirección y la intensidad del movimiento —activas tanto en comportamiento espontáneo como condicionado, independientemente de la predicción de recompensa.
La conclusión fue radical: las variaciones en la fuerza ejercida y en el comportamiento de lameteo explicaban completamente las dinámicas dopaminérgicas que la literatura atribuía al RPE. En lugar de un señal de enseñanza, la dopamina estaría regulando el gain —la ganancia— de los comportamientos motivados, controlando su latencia, dirección e intensidad durante la ejecución.
La actividad dopaminérgica del ATV controla el rendimiento relacionado con el movimiento, no los errores de predicción de recompensa. Los cambios conductuales durante el aprendizaje explican la actividad dopaminérgica independientemente de la predicción de recompensa o la valencia.
Nature Communications, octubre 2025Más allá de la recompensa: nuevas funciones documentadas
Neuronas dopaminérgicas específicas modulan la fuerza, dirección y latencia del movimiento en tiempo real, sin implicar aprendizaje por recompensa.
La dopamina estriatal señaliza errores de predicción en información sin valor (estímulos neutros), desafiando la centralidad de la recompensa en la teoría.
Un sistema paralelo de errores de predicción de acción (APE) en la cola del estriado refuerza asociaciones repetitivas sin considerar el valor de la recompensa.
Proyecciones del ATV hacia el septo lateral regulan interacciones afiliativas sociales, añadiendo una dimensión interpersonal a la función dopaminérgica.
Cronología del debate
Schultz, Dayan y Montague publican el estudio fundacional que propone que las neuronas dopaminérgicas codifican el error de predicción de recompensa, sentando las bases del RPE.
Steinberg et al. establecen causalidad formal usando el paradigma de "bloqueo" con optogenética, confirmando que la estimulación de neuronas dopaminérgicas desbloquea el aprendizaje.
Primeras evidencias serias de que la dopamina exhibe una "rampa" de activación en tareas de aproximación a la recompensa, difícil de reconciliar con el modelo RPE puro.
Nature Neuroscience publica el modelo de "RPE específico por características", admitiendo la heterogeneidad de las neuronas dopaminérgicas como desafío central a la teoría clásica.
Múltiples estudios en Nature, Nature Communications y Science Advances documentan señales dopaminérgicas de errores de predicción de acción y sensorial, consolidando la imagen de un sistema de múltiples funciones.
¿Modificar o abandonar la hipótesis?
La comunidad científica no presenta un frente unido. Una corriente, liderada por investigadores como Samuel Gershman (Harvard), propone una "generalización" de la hipótesis RPE que la amplíe para incluir errores de predicción sensorial y cognitiva —un marco unificador que preserve el valor explicativo de la teoría original sin descartarla.
Frente a ello, otros grupos defienden que la acumulación de evidencias incompatibles exige reemplazar el modelo con uno centrado en el control del rendimiento conductual: la dopamina no enseñaría al cerebro qué recompensas esperar, sino que ajustaría en tiempo real la intensidad y el estilo de la acción en curso.
Un tercer enfoque, respaldado por los hallazgos de 2025 en Nature sobre errores de predicción de acción, sugiere que ambos sistemas coexisten: neuronas del ATV clásicas codificando RPE para aprendizaje basado en valor, y neuronas del estriado posterior codificando APE para consolidar hábitos sin componente de valor. Un mapa dopaminérgico más rico, distribuido y especializado de lo que la teoría original permitía imaginar.
Implicaciones clínicas y traslacionales
El debate no es puramente académico. La hipótesis RPE sustenta décadas de modelos sobre adicción, depresión, esquizofrenia y enfermedad de Parkinson. Si la dopamina controla el vigor del movimiento tanto como el aprendizaje por recompensa, los modelos de disfunción dopaminérgica en el Parkinson y los tratamientos farmacológicos que los acompañan necesitarán revisión. Del mismo modo, los modelos computacionales de adicción que asumen que la dopamina únicamente refuerza asociaciones recompensa-estímulo quedan incompletos ante evidencias de su papel en compulsión y control motor.
La investigación en curso apunta hacia una arquitectura donde distintas poblaciones de neuronas dopaminérgicas —diferenciadas por sus proyecciones, propiedades moleculares y patrones de activación— operan como subsistemas semi-independientes. La dopamina no sería un único neurotransmisor con una única función, sino un lenguaje con múltiples dialectos cerebrales.
