Neurobiologie des comportements motivés – Notes détaillées

I – Conditionnement instrumental et contrôle de l’action

  • Contingence (relation "si … alors")
    • Force prédictive : positive, négative ou nulle.
    • SRCSRC de Skinner : Stimulus → Réponse → Conséquence.
    • Renforçateur : stimulus doté d’une valence (positive / négative) et d’une intensité.
  • Cartographie des contingences
    • Renforcement : présence d’un renforçateur positif ou absence d’un renforçateur négatif.
    • Punition : présence d’un renforçateur négatif ou absence d’un renforçateur positif.
  • Focus : renforcement positif (« entraînement de récompense »).
I.2 – Protocole expérimental chez le rongeur
  • Motivation endogène : faim / soif contrôlées par privation partielle.
  • Action opérationnalisée : levier, chaînette, orifice.
  • Renforçateur : eau ou nourriture parfumée (phase d’habituation « gratuite »).
  • Programmes de renforcement
    • Continu (CRFCRF) : un renforçateur par réponse.
    • Intermittent :
    • Rapport fixe FRnFRn : FR5FR511 renforçateur / 55 appuis.
    • Rapport variable VRnVRn : VR5VR5 → moyenne 55 appuis.
    • Intervalle fixe FItFIt : FI1FI1' → premier appui après 11 min.
    • Intervalle variable VItVIt : VI1VI1' → ≃ 11 min.
  • Effets :
    • Programme fixe → rythme constant.
    • Programme variable → « spam » de l’action.
I.3 – Contrôle de l’action
  • Deux déterminants : valeur et contingence du renforçateur.
I.3.1 – Contrôle par la valeur
  • Dévaluation gustative (LiCl) en 33 phases : entraînement, dévaluation, test (tel quel ou extinction).
  • Adams & Dickinson 19811981 : dévaluation ↓ nombre d’appuis.
  • Colwill & Rescorla 19851985 : dévaluation spécifique à chaque renforçateur.
  • Dickinson et al. 19951995 : satiété spécifique module la sensibilité à la valeur.
I.3.2 – Contrôle par la contingence
  • Balleine et al. 20032003 : ajout d’un renforçateur « gratuit » → abandon de l’action partiellement contingente.
I.4 – Action dirigée vers un but vs habitude
  • Tableau comparatif :
    • Action AextOA ext{-}O : sensible à dévaluation, contingence, flexible, coûteuse cognitivement, peu sensible au contexte.
    • Habitude SextRS ext{-}R : inverse.
  • DeRusso et al. 20102010 : surentraînement (44 jours) → passage à l’habitude.
  • Tricomi et al. 20092009 (humains) : 1616 séances → insensibilité à la dévaluation.
  • Schwabe & Wolf 20092009 : stress (cortisol salivaire) bascule vers habitude.
  • Sensibilité au contexte : habitudes dépendantes, actions A-O guidées par le but.
I.4.4 – Substrats neurobiologiques
  • Boucles cortico-striées :
    • Action A-O : cortex préfrontal médian + striatum dorsomédian / noyau caudé antérieur.
    • Habitude : cortex sensorimoteur + striatum dorsolatéral / putamen postérieur.
  • Yin et al. 20042004 : lésion striatum dorsolatéral bloque le passage à l’habitude.
I.5 – Stimulus pavlovien (saillance incitatrice)
  • Phase pavlovienne → Phase instrumentale → Test en extinction : transfert pavlovien-instrumental (PIT).
    • Transfert général vs spécifique.
  • Propriétés : attractif, renforçateur conditionné, énergisant.
I.6 – Trois composantes du renforcement positif (Berridge)
  • Apprentissage\text{Apprentissage} ; ’Wanting’\text{'Wanting'} (motivation) ; ’Liking’\text{'Liking'} (émotion).
  • Mesures : micro-structure du léchage, réactions orofaciales.

II – Circuit de la récompense

  • Régions : noyau accumbens (NAc), aire tegmentale ventrale (ATV), pallidum ventral, amygdale, cortex préfrontal, hypothalamus latéral.
  • Olds & Milner 19541954 : autostimulation intracérébrale.
  • Méta-analyse Sescousse et al. 20132013 : réseau commun (insula, NAc, amygdale, thalamus, cortex vmPFC) + spécificités selon le renforçateur.
  • Kringelbach et al. 20032003 : cortex orbitofrontal code la valeur, activité ↓ après dévaluation.
II.2 – Réseau hédonique
  • Points chauds / froids reliés ; opioïdes & endocannabinoïdes.
  • Pecina & Berridge 20002000 : micro-injection de morphine dans le shell → ↑ ‘liking’ et prise alimentaire.
II.3 – Dopamine
II.3.1 – Système dopaminergique
  • Voie nigrostriée (motricité) ; voie mésocorticolimbique → ATVNAc\text{ATV} \rightarrow NAc et cortex.
  • Antagonistes dopaminergiques ↓ autostimulation.
II.3.2 – Apprentissage
  • Schultz et al. 19971997 : neurones ATV codent l’erreur de prédiction :
    • Renforçateur inattendu → bouffée phasique.
    • CS → transfert du pic.
    • Renforçateur omis → pause.
  • Tobler et al. 20052005 : réponse phasique proportionnelle à la quantité, modulée par predictions.
  • Optogénétique :
    • Tsai et al. 20092009 : stimulation phasique ATV ↑ [DA]NAc[DA]_{NAc}.
    • Prus et al. 20092009 : préférence de place induite seulement par stimulation phasique.
    • Witten et al. 20112011 : autostimulation via « nose-poke ».
    • Steinberg et al. 20132013 : stimulation contingentée restaure l’apprentissage bloqué.
II.3.3 – Autres rôles de la dopamine (NAc)
  • Antagonistes / lésions →
    • Maintien de la prise alimentaire intact.
    • ↓ comportements d’approche et transfert PIT.
    • ↓ effort (Farrar et al. 20102010).
  • Lex & Hauber 20082008 : suppression de l’effet énergisant d’un stimulus prédictif.
II.3.4 – Action sur le noyau accumbens
  • Afférences ATV : activité tonique (libération lente) vs phasique (pic DADA).
  • Récepteurs : D1D1 (↑ excitabilité), D2D2 (↓ excitabilité).
  • Modulation de la sensibilité aux afférences glutamatergiques (cortex PFC, amygdale, hippocampe).
  • Efférences :
    • Shell → ATV & pallidum ventral (boucle limbique).
    • Core → noyaux moteurs (boucles motrices / associatives).

III – Troubles liés à l’usage de substances psychoactives

III.1 – Cibles pharmacologiques
  • Psychodysleptiques : opiacés (agonistes μ\mu), cannabinoïdes (CB1CB1).
  • Psychostimulants : nicotine (nAChR), amphétamines (inverseurs/MAO \downarrow), MDMA, cocaïne (blocage recaptage monoamines).
III.2 – Effets neurobiologiques
  • Aigus : \uparrow DANAcDA_{NAc} (Di Chiara & Imperato 19881988) pour amphétamines, cocaïne, nicotine, morphine, éthanol.
  • Chroniques : neuro-adaptations structurelles, moléculaires, épigénomiques, électrophysiologiques ; dépend de la substance, durée, patron, facteurs individuels.
III.3 – Addiction
  • Définition : comportement procurant plaisir / soulagement mais incontrôlable malgré conséquences négatives.
  • Triptyque : symptômes pharmacologiques (tolérance / sevrage), symptômes comportementaux (craving, perte de contrôle), répercussions médico-sociales.
  • DSM-V : 1111 critères → léger 2233, modéré 4455, sévère 6≥6.
III.3.3 – Modèles animaux
  • Rechute (Grimm & See 20002000) : stimulus associé ou drogue elle-même relance la réponse ; rôle clé du NAc et de l’amygdale basolatérale.
  • Escalade (Ahmed & Koob 19981998) : accès 66 h / séance → consommation ↑ (tolérance).
    • Sensibilité du système de récompense mesurée par seuil d’autostimulation intracérébrale : accès long ↑ seuil (Ahmed et al. 20022002) → hypo-sensibilité durable.