Neurobiologie des comportements motivés – Notes détaillées
I – Conditionnement instrumental et contrôle de l’action
- Contingence (relation "si … alors")
- Force prédictive : positive, négative ou nulle.
- SRC de Skinner : Stimulus → Réponse → Conséquence.
- Renforçateur : stimulus doté d’une valence (positive / négative) et d’une intensité.
- Cartographie des contingences
- Renforcement : présence d’un renforçateur positif ou absence d’un renforçateur négatif.
- Punition : présence d’un renforçateur négatif ou absence d’un renforçateur positif.
- Focus : renforcement positif (« entraînement de récompense »).
I.2 – Protocole expérimental chez le rongeur
- Motivation endogène : faim / soif contrôlées par privation partielle.
- Action opérationnalisée : levier, chaînette, orifice.
- Renforçateur : eau ou nourriture parfumée (phase d’habituation « gratuite »).
- Programmes de renforcement
- Continu (CRF) : un renforçateur par réponse.
- Intermittent :
- Rapport fixe FRn : FR5 → 1 renforçateur / 5 appuis.
- Rapport variable VRn : VR5 → moyenne 5 appuis.
- Intervalle fixe FIt : FI1′ → premier appui après 1 min.
- Intervalle variable VIt : VI1′ → ≃ 1 min.
- Effets :
- Programme fixe → rythme constant.
- Programme variable → « spam » de l’action.
I.3 – Contrôle de l’action
- Deux déterminants : valeur et contingence du renforçateur.
I.3.1 – Contrôle par la valeur
- Dévaluation gustative (LiCl) en 3 phases : entraînement, dévaluation, test (tel quel ou extinction).
- Adams & Dickinson 1981 : dévaluation ↓ nombre d’appuis.
- Colwill & Rescorla 1985 : dévaluation spécifique à chaque renforçateur.
- Dickinson et al. 1995 : satiété spécifique module la sensibilité à la valeur.
I.3.2 – Contrôle par la contingence
- Balleine et al. 2003 : ajout d’un renforçateur « gratuit » → abandon de l’action partiellement contingente.
I.4 – Action dirigée vers un but vs habitude
- Tableau comparatif :
- Action Aext−O : sensible à dévaluation, contingence, flexible, coûteuse cognitivement, peu sensible au contexte.
- Habitude Sext−R : inverse.
- DeRusso et al. 2010 : surentraînement (4 jours) → passage à l’habitude.
- Tricomi et al. 2009 (humains) : 16 séances → insensibilité à la dévaluation.
- Schwabe & Wolf 2009 : stress (cortisol salivaire) bascule vers habitude.
- Sensibilité au contexte : habitudes dépendantes, actions A-O guidées par le but.
I.4.4 – Substrats neurobiologiques
- Boucles cortico-striées :
- Action A-O : cortex préfrontal médian + striatum dorsomédian / noyau caudé antérieur.
- Habitude : cortex sensorimoteur + striatum dorsolatéral / putamen postérieur.
- Yin et al. 2004 : lésion striatum dorsolatéral bloque le passage à l’habitude.
I.5 – Stimulus pavlovien (saillance incitatrice)
- Phase pavlovienne → Phase instrumentale → Test en extinction : transfert pavlovien-instrumental (PIT).
- Transfert général vs spécifique.
- Propriétés : attractif, renforçateur conditionné, énergisant.
I.6 – Trois composantes du renforcement positif (Berridge)
- Apprentissage ; ’Wanting’ (motivation) ; ’Liking’ (émotion).
- Mesures : micro-structure du léchage, réactions orofaciales.
II – Circuit de la récompense
- Régions : noyau accumbens (NAc), aire tegmentale ventrale (ATV), pallidum ventral, amygdale, cortex préfrontal, hypothalamus latéral.
- Olds & Milner 1954 : autostimulation intracérébrale.
- Méta-analyse Sescousse et al. 2013 : réseau commun (insula, NAc, amygdale, thalamus, cortex vmPFC) + spécificités selon le renforçateur.
- Kringelbach et al. 2003 : cortex orbitofrontal code la valeur, activité ↓ après dévaluation.
II.2 – Réseau hédonique
- Points chauds / froids reliés ; opioïdes & endocannabinoïdes.
- Pecina & Berridge 2000 : micro-injection de morphine dans le shell → ↑ ‘liking’ et prise alimentaire.
II.3 – Dopamine
II.3.1 – Système dopaminergique
- Voie nigrostriée (motricité) ; voie mésocorticolimbique → ATV→NAc et cortex.
- Antagonistes dopaminergiques ↓ autostimulation.
II.3.2 – Apprentissage
- Schultz et al. 1997 : neurones ATV codent l’erreur de prédiction :
- Renforçateur inattendu → bouffée phasique.
- CS → transfert du pic.
- Renforçateur omis → pause.
- Tobler et al. 2005 : réponse phasique proportionnelle à la quantité, modulée par predictions.
- Optogénétique :
- Tsai et al. 2009 : stimulation phasique ATV ↑ [DA]NAc.
- Prus et al. 2009 : préférence de place induite seulement par stimulation phasique.
- Witten et al. 2011 : autostimulation via « nose-poke ».
- Steinberg et al. 2013 : stimulation contingentée restaure l’apprentissage bloqué.
II.3.3 – Autres rôles de la dopamine (NAc)
- Antagonistes / lésions →
- Maintien de la prise alimentaire intact.
- ↓ comportements d’approche et transfert PIT.
- ↓ effort (Farrar et al. 2010).
- Lex & Hauber 2008 : suppression de l’effet énergisant d’un stimulus prédictif.
II.3.4 – Action sur le noyau accumbens
- Afférences ATV : activité tonique (libération lente) vs phasique (pic DA).
- Récepteurs : D1 (↑ excitabilité), D2 (↓ excitabilité).
- Modulation de la sensibilité aux afférences glutamatergiques (cortex PFC, amygdale, hippocampe).
- Efférences :
- Shell → ATV & pallidum ventral (boucle limbique).
- Core → noyaux moteurs (boucles motrices / associatives).
III – Troubles liés à l’usage de substances psychoactives
III.1 – Cibles pharmacologiques
- Psychodysleptiques : opiacés (agonistes μ), cannabinoïdes (CB1).
- Psychostimulants : nicotine (nAChR), amphétamines (inverseurs/MAO ↓), MDMA, cocaïne (blocage recaptage monoamines).
III.2 – Effets neurobiologiques
- Aigus : ↑ DANAc (Di Chiara & Imperato 1988) pour amphétamines, cocaïne, nicotine, morphine, éthanol.
- Chroniques : neuro-adaptations structurelles, moléculaires, épigénomiques, électrophysiologiques ; dépend de la substance, durée, patron, facteurs individuels.
III.3 – Addiction
- Définition : comportement procurant plaisir / soulagement mais incontrôlable malgré conséquences négatives.
- Triptyque : symptômes pharmacologiques (tolérance / sevrage), symptômes comportementaux (craving, perte de contrôle), répercussions médico-sociales.
- DSM-V : 11 critères → léger 2–3, modéré 4–5, sévère ≥6.
III.3.3 – Modèles animaux
- Rechute (Grimm & See 2000) : stimulus associé ou drogue elle-même relance la réponse ; rôle clé du NAc et de l’amygdale basolatérale.
- Escalade (Ahmed & Koob 1998) : accès 6 h / séance → consommation ↑ (tolérance).
- Sensibilité du système de récompense mesurée par seuil d’autostimulation intracérébrale : accès long ↑ seuil (Ahmed et al. 2002) → hypo-sensibilité durable.