Apprendre à apprendre

Cet article est la traduction d’un article de Max Anisimov. Il y compile différentes méthodes d’apprentissage et traite de leur efficacité:1L’article a été légèrement modifié. La partie « plus de ressources » a été enlevée, tout comme la partie « Physiology and Brain’s Health ».

Les sciences cognitives et l’apprentissage sont des sujets qui m’intéressent depuis des années. J’ai lu plusieurs livres, pleins d’articles et mis beaucoup d’idées au banc d’essais. Ceci est donc la synthèse de mes notes, avec les références scientifiques adéquates.

Résumé

Méthodes d’apprentissage efficaces

  • L’apprentissage distribué: étudier moins pendant chaque session, mais plus fréquemment.
  • Remémoration active: tester activement ses connaissances et compétences.
  • Remémoration distribuée: espacer les tests dans l’espace et ajuster les intervalles en fonction des performances.
  • Enchevêtrement: s’entraîner en même temps sur des compétences et concepts différents, mais liés entre eux.
  • S’interroger: se poser des questions et utiliser le matériel acquis pour y répondre.
  • Auto-explication et technique de Feynman: expliquer ce qu’on a appris dans des termes simples.

Disclaimer et introduction

Je n’ai pas d’expérience en science cognitive ou en neuroscience; ce sont des centres d’intérêt. Ma compréhension des phénomènes en jeu est limitée et je suis toujours en train d’apprendre comment appliquer ces idées.

Cela dit, j’ai trouvé les méthodes présentées utiles. J’ai pu les mettre à contribution pour apprendre des langues, les bases de la programmation et durant un MBA de deux ans.

Stratégie d’apprentissage efficace

Stratégie #1: L’apprentissage distribué

En bref, il vaut mieux répartir ses entraînements sur une certaine période plutôt que de tout faire dans une seule journée.

Dans une étude, on a demandé à des élèves d’école primaire d’étudier de l’une des trois façons suivantes : massées, regroupé et espacé.

Massées = quatre leçons à la fois
Regroupés = deux leçons un jour et deux leçons le lendemain
Espacées = une leçon par jour pendant quatre jours
Le groupe « espacé » a obtenu les meilleurs résultats, suivi par le groupe « regroupé » :

Une autre étude a comparé les scores de compréhension dans trois conditions différentes :

  • Lire un texte une fois (« simple »)
  • Lire un texte deux fois (« massed »)
  • Lire un texte deux fois avec un intervalle d’une semaine (« distributed »)


Lorsqu’il a été testé immédiatement, le deuxième groupe a obtenu les meilleurs résultats. Mais lorsqu’il a été testé deux jours plus tard, c’est le troisième groupe qui a obtenu les meilleurs résultats.

Cette méthode est aussi efficace pour l’apprentissage de compétences motrices.

Comment l’appliquer dans la pratique :

Créez un calendrier d’apprentissage ou trouvez le temps de vous exercer un peu tous les jours ou tous les quelques jours au lieu de vous entasser sur un seul ou quelques jours.

Si vous souhaitez en savoir plus, lisez l’article de Wikipedia sur la pratique distribuée.

Stratégie #2: Mémorisation active

Il peut être plus efficace de se rappeler activement des informations que vous avez déjà apprises que de les relire passivement ou d’essayer de les réapprendre.

Une étude a comparé une méthode qui mettait l’accent sur des séances d’étude avec une méthode qui mettait l’accent sur les tests et a constaté que cette dernière était plus efficace pour se rappeler du contenu appris.

  • SSSS = Quatre sessions d’étude
  • SSST = Trois sessions d’étude, suivies d’un test
  • STTT = une session d’étude, suivie de trois tests

Le simple fait d’imaginer que vous pourriez être testé sur le contenu que vous apprenez pourrait aider à améliorer vos capacités de mémoires.

En pratique:

Si vous avez appris il y a quelques jours comment fonctionne le passé en espagnol, essayez de vous rappeler les règles ou même de tester vos connaissances – au lieu de simplement relire le même matériel.

Vous pouvez en savoir plus sur la pratique du rappel actif sur Wikipédia.

Stratégie #3: Mémorisation espacée

La pratique du rappel distribué est essentiellement une combinaison des deux idées ci-dessus. Vous vous testez fréquemment et modifiez les intervalles de test en fonction de votre connaissance du matériel ou de vos compétences.

En pratique:

De nombreuses applications simplifient le processus d’apprentissage en proposant un suivi des performances et en ajustant automatiquement les intervalles. Anki est une application open-source populaire qui peut être utilisé pour faciliter, par exemple, l’apprentissage du vocabulaire des langues étrangères.

Stratégie #4: Pratique combinée

Contrairement aux méthodes présentées au-dessus, celle-ci n’est pas encore aussi répandue. L’idée est pourtant simple : pratiquer plusieurs compétences en même temps. Cela peut complique l’entraînement, mais se révèle généralement payant.

Une étude de 2010 a montré que la pratique combinée prépare mieux les enfants aux tâches complexes (problèmes complets) – celles que vous êtes plus susceptible de rencontrer dans le monde réel – même s’ils font plus d’erreurs en s’entraînant.

Une étude de 2007 a montré que les élèves qui mélangent différentes tâches réussissent moins bien pendant la séance d’entraînement, mais mieux lors du test final de leurs compétences; c’est-à-dire quand ils doivent mettre en pratique ce qu’ils ont appris.

Ces deux études se sont concentrées sur des tâches mathématiques – trouver le volume de divers solides géométriques – mais des effets similaires ont été constatés dans d’autres domaines, tels que le badminton, le basket-ball et la médecine.

En pratique:

Intercaler les compétences qui sont liées – par exemple, différentes progressions d’accords
Mélanger les anciennes et les nouvelles compétences pour les intégrer


Vous pouvez en savoir plus sur les techniques de combinaison en lisant cet article de Scientific American et l’article de Wikipedia.

Stratégie #5: Questionnement permanent

C’est un terme pompeux pour parler de se poser des questions pendant le temps passé à étudier un sujet.

Une étude a montré que poser des questions était utile pour étudier des concepts scientifiques. Une autre a montré que cette méthode est particulièrement efficace lorsque vous possédez déjà certaines connaissances préalables sur un sujet. Mais même si vous n’en avez pas, l’interrogation élaborée semble toujours plus efficace que la simple lecture pour améliorer sa compréhension d’un sujet.

En pratique:

  • Posez-vous une question qui commence par « Pourquoi » ou « Comment » et essayez d’y répondre en vous basant sur les éléments que vous avez appris.

Stratégie #6: L’auto-explication et la technique Feynman

Cette stratégie est basée sur une idée similaire et est assez connue. Après avoir appris quelque chose de nouveau, essayez de l’expliquer avec vos propres mots. Si vous avez un partenaire ou quelqu’un qui est prêt à écouter vos explications, vous pouvez vous entraîner avec lui, mais vous expliquer à vous-même fonctionne aussi.

Cette méthode est similaire à la « technique Feynman » attribuée au physicien Richard Feynman, lauréat du prix Nobel. En plus de l’auto-explication, Feynman a également souligné qu’il fallait expliquer les choses simplement pour que même un élève de sixième année puisse les comprendre.

Une étude a évalué le pourcentage de réponses correctes; cette méthode est assez efficace :

Comme le font remarquer certains professeurs-chercheurs, ils n’enseignent pas seulement pour partager des connaissances, mais aussi pour mieux comprendre le sujet.

En pratique:

Choisissez le sujet que vous souhaitez apprendre
Imaginez que vous l’enseignez à un élève de sixième année
Notez les lacunes dans votre compréhension et utilisez-les pour orienter votre apprentissage ultérieur

Une simple heuristique tirée de mon expérience:

J’ai remarqué que tout ce que j’apprenais pouvait être mis en pratique, et que la pratique est supérieure au rappel/explications, lui-même supérieur à l’apprentissage passif.

  • En programmation : écrire du code pour résoudre des problèmes > expliquer comment quelque chose fonctionne > apprendre passivement.
  • De même, avec les langues étrangères : parler ou écrire > se rappeler/expliquer ce que l’on a appris > apprentissage passif.

Autres stratégies:

Biohacking

Je suis mitigé quant au terme « biohacking », mais je l’utiliserai ici faute de meilleur mot. La vraie question est de savoir si nous pouvons faire quelque chose pour rendre l’apprentissage plus facile et plus efficace en changeant notre physiologie.

Il n’est pas surprenant que les « biohacks » les plus étudiés, les plus sûrs et les plus efficaces rappellent les conseils que certains d’entre nous ont reçus de leurs grands-mères.

Biohack #1: Bien dormir

Ce n’est un secret pour personne. Il existe des dizaines, voire des centaines d’études sur les effets de la privation de sommeil sur les performances cognitives et la mémoire. Et elles pointent toutes dans la même direction. Le sommeil prend du temps, mais c’est une arme redoutable.

Une étude a examiné les effets de la privation de sommeil sur l’attention, la mémoire, la vitesse de traitement et l’humeur. Vous pouvez probablement deviner ce qui s’est passé, mais ces graphiques permettent de tirer les conclusions qui s’imposent :

Vous pouvez en apprendre davantage sur les effets du sommeil et de la privation profonde de sommeil sur la cognition et la santé dans l’épisode du podcast avec Matthew Walker, professeur à l’université de Berkeley.

Biohack #2: Exercice

Après le sommeil, il y a une autre arme secrète, gratuite, très efficace et bien étudiée. Oui, l’exercice.

Cette étude publiée dans Nature n’est que l’une des nombreuses études qui ont conclu que l’exercice peut améliorer la cognition dans de multiples types de tâches.

Même la marche peut être efficace. Voici comment marcher affecte la créativité :

L’exercice augmente également le facteur neurotrophique dérivé du cerveau (BDNF), qui est important pour l’apprentissage :

Enfin, l’exercice a des effets bénéfiques sur la neuroprotection et pourrait même aider à prévenir la maladie d’Alzheimer.

Différents types d’exercices ont des effets différents, de sorte qu’il est préférable de faire un bon mélange d’entraînement de résistance (musculation), d’entraînement cardio par intervalles à haute intensité (HIIT) et d’entraînement cardio en régime permanent à basse intensité (LISS).

Si vous souhaitez en savoir plus sur les effets de l’exercice sur les performances cognitives, consultez l’article de Wikipedia sur les effets neurobiologiques de l’exercice physique.

Biohack #3: Bien manger

Tout comme le sommeil et l’exercice, la nutrition peut sembler ennuyeuse, mais elle est incroyablement efficace. L’examen des principes d’une alimentation saine dépasse le cadre de cet article, mais voici quelques études qui pourraient vous inciter à manger sainement.

Des approches diététiques complètes et des aliments individuels ont été étudiés sous l’angle de leurs effets sur la cognition.

Les aliments et les nutriments qui ont été associés à de meilleures performances cognitives comprennent le thé vert, le poisson, les myrtilles, les noix, l’huile d’olive et bien d’autres encore.

Voici quelques extraits d’études pour piquer votre curiosité.

Il a été démontré que les myrtilles améliorent le temps de réaction et la mémoire :

Les oméga-3 présents dans l’huile de poisson – et en particulier l’acide docosahexaénoïque (DHA) – pourraient améliorer la cognition et retarder le déclin cognitif lié à l’âge. Cet essai contrôlé et randomisé a mis en évidence les effets bénéfiques du DHA sur les scores de la mémoire de travail :

Pour en savoir plus sur le lien entre nutrition et cognition, consultez l’article de Wikipedia sur la nutrition et la cognition, le résumé du régime MIND, l’article de Chris Kresser et le podcast de Rhonda Patrick.

Autres « biohacks »

Ce qui ne marche pas

  • Multitâche: Concentrez-vous plutôt sur une chose à la fois.
  • Relecture passive et surlignage: Pratiquez plutôt le rappel actif.
  • Trouvez votre « style d’apprentissage » unique – la théorie des différents types de mémoire (auditif, visuel, etc..) n‘est pas étayée par des preuves solides.

Digressions sur l’hypothèse de la sphère blanche

« Imagine que la seule perspective que tu aies eue durant ta vie ait été celle de l’intérieur d’une sphère blanche. Dans cette sphère blanche, tu n’as pas de corps physique, et il n’y a rien d’autre que toi. Tu n’existes dans la sphère qu’en tant que cerveau, avec des yeux parfaitement fonctionnels. La gravité à l’intérieur crée un équilibre parfait qui t’oblige à flotter en un seul point. Tu peux te tourner vers n’importe quelle direction. Tu ne peux évidemment pas voir ton propre cerveau, ni ce qui l’alimente. Ton cerveau dort 8 heures par jour et est capable de rêver. À quoi penses-tu à l’intérieur de la sphère, et à quoi rêves-tu? »

L’auteur de ce texte, James S. Eerie, pense que la personne coincée dans la sphère blanche ne pourrait pas « penser » au sens où nous l’entendons. Elle ne pourrait pas se demander « où suis-je », car elle n’aura ni le langage ni les représentations mentales nécessaires pour le faire.

L’auteur en conclut donc qu’elle aurait les capacités d’un fœtus. Là où, à mon sens, il a tort, c’est que même un fœtus reçoit un grand nombre de stimulis, et ce dès le deuxième mois de grossesse. Le liquide amniotique est un milieu extrêmement. À mesure que le placenta gagne en perméabilité, le fœtus commence à y expérimenter le goût et l’odorat.1Source (Campus de Maïeutique Francophone)

Parallèlement, le cerveau d’un fœtus se construit au rythme de 5000 neurones par secondes. Je me demande comment il se développerait dans la sphère blanche, en absence totale de stimulation. Pour un computationnaliste, un de ceux qui pensent que le cerveau fonctionne comme un ordinateur, rien ne se formerait dans le cerveau de la personne coincée dans la sphère; or ce rien nous semble hors de portée tant il est opaque et abstrait.

Il semblerait que, en absence de stimulis, nous en inventions. Pour reprendre l’image de l’Institut Weizmann de Neurosciences, en l’absence de stimulations, notre cerveau est comme un ordinateur qui lance un économiseur d’écran pour remplacer l’affichage inactif d’un moniteur LCD inactif.2Résumé de l’article de Yuval Nir et al. publié dans Nature sur le site de l’institut Weizmann. Quoi qu’il en soit, laissons de côté les conclusions que tire James et revenons sur l’hypothèse de la sphère blanche elle-même. Au sein de celle-ci, la question ne se pose pas: le cerveau est déjà formé, et il comme posé là, au milieu de la sphère.

Il est impossible de ne faire le lien entre la sphère blanche et le brain in a vat de Putnam:

Supposons qu’un être humain (vous pouvez supposer qu’il s’agit de vous-même) a été soumis à une opération par un savant fou. Le cerveau de la personne en question (votre cerveau) a été séparé de son corps et placé dans une cuve contenant une solution nutritive qui le maintient en vie. Les terminaisons nerveuses ont été reliées à un super-ordinateur scientifique qui procure à la personne-cerveau l’illusion que tout est normal. Il semble y avoir des gens, des objets, un ciel, etc. Mais en fait tout ce que la personne (vous-même) perçoit est le résultat d’impulsions électroniques que l’ordinateur envoie aux terminaisons nerveuses.

L’ordinateur est si intelligent que si la personne essaye de lever la main, l’ordinateur lui fait « voir » et « sentir » qu’elle lève la main. En plus, en modifiant le programme, le savant fou peut faire « percevoir » (halluciner) par la victime toutes les situations qu’il désire. Il peut aussi effacer le souvenir de l’opération, de sorte que la victime aura l’impression de se trouver dans sa situation normale. La victime pourrait justement avoir l’impression d’être assise en train de lire ce paragraphe qui raconte l’histoire amusante mais plutôt absurde d’un savant fou qui sépare les cerveaux des corps et qui les place dans une cuve contenant des éléments nutritifs qui les gardent en vie.

Raison, Vérité et Histoire, Hilary Putnam

Demande-toi: préfèrerais-tu vivre une vie normale dans la réalité, ou vivre la vie de tes rêves en étant un cerveau dans une cuve? Ce n’est pas une question rhétorique. Même si j’ai la mienne et que je l’expose dès le paragraphe suivant, il y a autant de réponses possibles que de points de vues valables – c’est-à-dire beaucoup.

Dans Matrix, Néo a fait son choix en avalant la pilule rouge – peut-être parce que s’il prenait la bleu il n’y aurait pas de film. Car à quoi bon? Quelle est la différence entre le réel et le non-réel si on ne peut pas faire la différence entre les deux?

Ceux qui répondent préférer le réel car il est mieux que le non réel adjugent une valeur morale à ce qu’est la réalité. Or, si tu es un cerveau dans une cuve, ta réalité est celle que ton cerveau hallucine grâce à l’ordinateur du savant fou, de la même façon que ta réalité à toi en ce moment est celle que tu expérimentes en lisant ces lignes. Il n’y a pas d’échelle de valeurs entre les réalités. Quitte à être condamné à vivre la réalité dans laquelle nous sommes piégés, autant bronzer sur une place aux Bahamas – même s’ils sont virtuels.

Il y a quelques jours, une équipe menée par Xing Chen du département Vision & Cognition de l’institut Néerlandais de Neurosciences a publié les résultats d’une expérience qu’ils ont conduit sur deux macaques. Grâce à 1024 électrodes intra-corticaux3C’est à dire: « branché » directement au cortex, ici visuel.3 connectées au cerveaux des singes, les chercheurs ont réussis à généré dans leur champ de vision des stimulis visuels, dont des formes géométriques et des chiffres.

Ce n’est pas le premier travail de ce type, même chez les humains.4Voir liste mentionné dans l’article de Chen et al.:

W. H. Dobelle, M. G. Mladejovsky, J. P. Girvin, Artificial vision for the blind: Electrical stimulation of visual cortex offers hope for a functional prosthesis. Science 183, 440–444 (1974). doi:10.1126/science.183.4123.440pmid:4808973

J. Button, T. Putnam, Visual responses to cortical stimulation in the blind. J. Iowa Med. Soc. 52, 17 (1962).

G. S. Brindley, W. S. Lewin, The sensations produced by electrical stimulation of the visual cortex. J. Physiol. 196, 479–493 (1968). doi:10.1113/jphysiol.1968.sp008519pmid:4871047

M. Bak, J. P. Girvin, F. T. Hambrecht, C. V. Kufta, G. E. Loeb, E. M. Schmidt, Visual sensations produced by intracortical microstimulation of the human occipital cortex. Med. Biol. Eng. Comput. 28, 257–259 (1990). doi:10.1007/BF02442682pmid:2377008

W. H. Dobelle, M. G. Mladejovsky, J. R. Evans, T. S. Roberts, J. P. Girvin, “Braille” reading by a blind volunteer by visual cortex stimulation. Nature 259, 111–112 (1976). doi:10.1038/259111a0pmid:1246346

J. R. Evans, J. Gordon, I. Abramov, M. G. Mladejovsky, W. H. Dobelle, Brightness of phosphenes elicited by electrical stimulation of human visual cortex. Sens. Processes 3, 82–94 (1979). pmid:515743

D. N. Rushton, G. S. Brindley, in Physiological Aspects of Clinical Neurology, F. C. Rose, Ed. (Blackwell Scientific Publications, ed. 1, 1977), pp. 123–153.

E. M. Schmidt, M. J. Bak, F. T. Hambrecht, C. V. Kufta, D. K. O’Rourke, P. Vallabhanath, Feasibility of a visual prosthesis for the blind based on intracortical microstimulation of the visual cortex. Brain 119, 507–522 (1996). doi:10.1093/brain/119.2.507pmid:8800945

J. Winawer, J. Parvizi, Linking electrical stimulation of human primary visual cortex, size of affected cortical area, neuronal responses, and subjective experience. Neuron 92, 1213–1219 (2016). doi:10.1016/j.neuron.2016.11.008pmid:27939584

W. H. Bosking, P. Sun, M. Ozker, X. Pei, B. L. Foster, M. S. Beauchamp, D. Yoshor, Saturation in phosphene size with increasing current levels delivered to human visual cortex. J. Neurosci. 37, 7188–7197 (2017). doi:10.1523/JNEUROSCI.2896-16.2017pmid:28652411.
De tels progrès représentent une immense source d’espoir pour les 36 millions de personnes5Source: France Info atteintes de cécité à travers le monde. Cela fait aussi furieusement penser à l’expérience du cerveau dans la cuve.

Ce n’est rien par rapport aux braindances de Cyberpunk 2077. Dans l’univers dystopique du jeu dont tout le monde parle en ce moment, les braindances sont la forme de divertissement la plus populaire. Sorte de réalité virtuelle poussée à leur paroxysme, ils permettent de revivre l’expérience vécue par quelqu’un d’autre. Ils permettent de vivre quelque chose comme si on y était; on peut passer une journée dans la peau d’une célébrité ou d’un aventurier. Ils sont principalement utilisés pour le divertissement, mais aussi pour mener des entrainements militaires ou canaliser les prisonniers. De par leur caractère stimulant, les braindances ont remplacé les médias traditionnels comme la télévision et la radio.

Des studios se sont spécialisés dans la production de braindances, où ils enregistrent les états mentaux de leurs acteurs pour les revendre. Dans le lore de Cyberpunk 2077, où ils permettent aux consommateurs de s’échapper d’une réalité souvent peu reluisante, les braindances ont causé une vague d’addiction dans la ville fictive de Night City. Le parallèle avec le cerveau dans la cuve est saisissant, en plus d’être probablement intentionnel. Avec les Oculus Rift de Facebook et autres Vive de HTC, nous sommes encore loin des braindances. Mais, dans une société comme celle-là, quel serait notre rapport à la réalité? Et combien de temps faudrait-il avant de pouvoir vivre en réalité virtuelle?

La puissance du recuit

Les métaux sont uniques, notamment grâce aux comportements qu’ils adoptent vis-à-vis des changements de températures. Si un métal est décrit par le matériau dont il est constitué (par exemple, le cuivre ou le fer), ses propriétés sont déterminées par la disposition de ses atomes, elle-même extrêmement variable.

Cet arrangement est semi-permanent, mais peut être manipulé par certaines techniques. Une d’entre elles est le recuit, où le métal est d’abord chauffé puis lentement refroidi au fil du temps. Grâce à ce processus, le métal devient moins dur et ductile. Le refroidissement fournit ensuite le temps et les niveaux d’énergie nécessaires à la formation de grains plus gros.

Les programmeurs informatiques ont pris note de ces propriétés uniques et les ont transposées dans leur domaine, ce qui a donné naissance à l’algorithme du « recuit simulé » (simulated annealing). Il est utilisé pour trouver un optimum global à un problème spécifique, et fonctionne, comme le recuit métallurgique, en réduisant progressivement la « température » (pour l’algorithme, la probabilité de se « diriger » vers une solution moins « bonne »). Le fonctionnement de l’algorithme est plus explicite en se représentant graphiquement l’espace de solution d’un problème (l’exemple ci-dessous traite d’un espace à une dimension, mais nous pouvons évidemment étendre le mode opératoire à des espaces à n dimensions).

L’algorithme part d’une valeur d’entrée aléatoire (un endroit aléatoire sur la ligne ci-dessus), puis, à chaque itération, sélectionne un point proche aléatoire (la définition de « proche » change avec la température; à des températures plus élevées, des points « plus loin » peuvent être choisis).

Si le point choisi au hasard est plus élevé que le point actuel, l’algorithme « se déplace » vers ce point ; s’il est plus bas, l’algorithme peut ou non « se déplacer », en fonction de la température (l’algorithme est plus susceptible de « se déplacer » à des températures plus élevées). Cette stratégie converge vers l’optimum global. L’image ci-dessous (tirée de Wikipedia) illustre le fonctionnement de l’algorithme pour un problème à une dimension:

Il faut bien noter que si on connaissait d’avance l’espace de solution, on pourrait simplement sélectionner la solution optimale à vue d’œil. C’est le cas pour les cas simples (par exemple y = 1 – |x|), mais pour des problèmes plus complexes (par exemple le problème du voyageur de commerce, illustré ci-dessous), on a alors besoin d’un algorithme d’approximation comme le recuit simulé.

Comme nous l’avons vu pour les métaux et la programmation, le processus de recuit – qui consiste à réduire lentement l’état énergétique d’un système – présente des propriétés intéressantes. Il permet d’atteindre un certain type d’organisation. Le recuit prend le meilleur de chaque plage du spectre de température. Il tire parti des températures élevées pour approcher le problème (de manière plus grossière), et des basses températures pour déterminer une solution plus précise (en se concentrant sur la zone particulière identifiée précédemment). Vu sous cet angle, le concept de recuit s’applique bien au-delà des domaines de la métallurgie et des mathématiques, avec les deux exemples puissants que sont la formation (au niveau individuel) et l’évolution (au niveau social) du cerveau.

La plasticité du cerveau varie grandement au cours de l’existence. Les nouveau-nés appréhendent rapidement le monde qui les entoure, et les tout-petits ont plus de facilités pour le langage. Pendant ces périodes de notre vie, le cerveau peut être considéré comme fonctionnant à haute température; chaque expérience joue un rôle important dans la façon dont le cerveau se construit; le cerveau est ductile. En vieillissant, notre cerveau refroidit; les concepts que nous avons acquis dans notre enfance se solidifient et, bien que nous puissions toujours les modifier, ces changements se produisent beaucoup plus lentement qu’avant. Ce schéma de formation, analogue au recuit métallurgique, permet au cerveau d’atteindre des états de basse énergie, où ici, basse énergie peut être compris comme ayant une faible erreur standard. En formant d’abord des concepts généraux et des catégories dès l’enfance (par exemple « êtres vivants », « choses inanimées », « nourriture », etc. – bien qu’au plus jeune âge nous n’ayons pas encore les mots attachés aux concepts eux-mêmes), notre cerveau cimente un modèle de base sur lequel on peut ensuite bâtir une compréhension plus subtile et affinée du monde.

En regardant le cerveau à travers cet angle, il est intéressant de considérer les effets des drogues psychoactives, en particulier celles comme le LSD. Beaucoup de gens décrivent cette expérience comme « leur permettant de se sentir à nouveau comme des enfants », le monde leur paraissant tout nouveau. Lorsque nous atteignons l’âge adulte, notre cerveau a acquis d’importantes connaissances préalables sur notre environnement. Ces drogues permettraient de réduire la force de ces antécédents, empêchant alors le cerveau d’imposer une partie de ces acquis sur l’expérience actuelle. En utilisant la métaphore du recuit, elles font monter la température.

L’observation à l’échelle neuronale est en adéquation avec l’analogie plus méta du recuit. À la naissance, nous disposons déjà de tous nos neurones, mais seul un nombre limité de synapses se sont formées – de l’ordre de ~1/6 du nombre total de synapses dans un cerveau adulte. Au cours des années suivantes, les synapses s’établissent rapidement; à l’âge de deux ans, un enfant en a même beaucoup plus qu’un adulte! À partir de là, la formation des synapses est ralentie, la tendance principale étant plutôt à l’élagage. Nous pouvons encore une fois voir le rôle que joue la « haute température » dans la formation spontanée des synapses, et celui des « basses températures » dans la solidification de ces fondations et la mise en place de représentations plus précises du monde qui nous entoure.

Si l’on passe à l’échelle évolutionnelle, l’analogie est plus vague, mais toujours utile. L’évolution des systèmes nerveux a été ponctuée de sauts importants. Des protoneurones se sont regroupés en grappes, pour finalement se concentrer au sein d’organes dédiés. Nous pouvons considérer que ces premiers sauts se sont produits à une « température élevée », se figeant au fil du temps en une structure générale, le cerveau (partagée par un grand nombre d’espèces) lors du « refroidissement ». Tout comme les premières phases du recuit simulé ont servi à identifier la meilleure colline pour ensuite la grimper, les premières phases de l’évolution du cerveau ont permis d’identifier la meilleure structure fondamentale, selon certains critères.1L’analogie trouve ici ses limites, car l’évolution n’a pas de but – mais c’est l’idée générale qui importe.Avec cette structure comme base, des mutations à petite échelle ont commencé à jouer un rôle de plus en plus important. Notre cerveau a beaucoup en commun avec ceux d’autres mammifères, et seuls de petits ajustements permettent de passer du leur au nôtre – ou du moins, des changements bien plus insignifiants que ceux qui ont été nécessaires pour passer des premiers réseaux de neurones au cerveau.

le phénomène de recuit semble avoir quelque chose de spécial. Il permet de tirer le meilleur des deux mondes: quand les températures sont élevées, que la plasticité est importante, on peut faire de grands bonds dans l’espace de solution, en cherchant où s’installer; et lorsqu’elles sont basses, nous pouvons explorer pleinement cette zone prometteuse. Pour l’instant, nous n’imprégnons nos systèmes d’IA que d’un faible niveau de recuit – les paramètres sont certes mis à jour lentement au fil du temps, mais les systèmes eux-mêmes disposent d’une structure fixe et d’un nombre constant de paramètres à mettre à jour. Nous pourrions nous inspirer de notre cerveau et essayer d’imiter la croissance synaptique explosive qui se produit chez les nourrissons; ou, plus ambitieux encore, tirer des enseignements du raffinement du système nerveux sur des centaines de millions d’années d’évolution.

Traduit de My Brain’s Thoughts