Centaur : prédire le comportement humain

  • "Savoir que l’on sait ce que l’on sait, et savoir que l’on ne sait pas ce que l’on ne sait pas : voilà la véritable intelligence." Confucius
  • "L’intelligence est la capacité de s’adapter au changement." Stephen Hawking
  • "La plus haute forme d’intelligence humaine est la capacité d’observer sans juger."  Jiddu Krishnamurti
 
 




RAPPEL :
"Une intelligence artificielle générale (IAG) est une intelligence artificielle capable d'effectuer ou d'apprendre pratiquement n'importe quelle tâche cognitive au moins aussi bien que l'humain. La création d'intelligences artificielles générales est un des principaux objectifs de certaines entreprises comme OpenAIMetaet DeepMind. C'est aussi un thème majeur de la science-fiction et de la futurologie. Même si GPT-4 a été décrit comme ayant des «étincelles d'intelligence artificielle générale »," WIKIPEDIA


A foundation model to predict and capture 
human cognition
Binz, M., Akata, E., Bethge, M. et al.  Un modèle fondamental pour prédire et capturer la cognition humaine.     Nature 644, 1002–1009 (2025). https://doi.org/10.1038/s41586-025-09215-4
Article en libre accès
 
 
L'établissement d'une théorie unifiée de la cognition constitue un objectif majeur en psychologie. 

Une première étape vers une telle théorie consiste à créer un modèle computationnel capable de prédire le comportement humain dans un large éventail de contextes.

Nous présentons ici Centaur, un modèle computationnel qui peut prédire et simuler le comportement humain dans toute expérience exprimable en langage naturel.

Centaur a été obtenu en affinant un modèle de langage de pointe sur un vaste ensemble de données appelé Psych-101. Psych-101 présente une ampleur sans précédent, couvrant les données essai par essai de plus de 60 000 participants effectuant plus de 10 millions de choix dans 160 expériences.

Centaur non seulement reproduit mieux le comportement des participants exclus de l'étude que les modèles cognitifs existants, mais il se généralise également à des scénarios inédits, à des modifications structurelles des tâches et à des domaines entièrement nouveaux. De plus, les représentations internes du modèle sont davantage alignées sur l'activité neuronale humaine après son affinement. Nos résultats démontrent qu'il est possible de découvrir des modèles informatiques capables de reproduire le comportement humain dans de nombreux domaines. Nous sommes convaincus que de tels modèles offrent un potentiel considérable pour orienter le développement des théories cognitives, et nous présentons une étude de cas à cet effet.

RÉSUMÉ GÉNÉRATIF
 

Ce document présente Centaur, un modèle computationnel capable de prédire et de simuler le comportement humain dans divers contextes expérimentaux, en s'appuyant sur un vaste ensemble de données psychologiques.

Modèle Centaur pour la cognition humaine

Centaur est un modèle computationnel qui prédit et simule le comportement humain dans divers contextes expérimentaux.

    • * Centaur a été dérivé d'un modèle de langage avancé, affiné sur un ensemble de données appelé Psych-101.
    • * Psych-101 comprend des données de plus de 60 000 participants et plus de 10 millions de choix dans 160 expériences.
    • * Le modèle surpasse les modèles cognitifs existants en prédisant le comportement des participants non inclus dans les données d'entraînement.

Importance d'une théorie unifiée de la cognition

Une approche intégrée est nécessaire pour comprendre pleinement l'esprit humain.

    • * Les modèles contemporains sont souvent spécifiques à un domaine, limitant leur applicabilité.
    • * Une théorie unifiée pourrait rassembler les connaissances croissantes en psychologie sous un contrôle intellectuel.
    • * Centaur représente une avancée vers cette théorie unifiée en capturant le comportement humain à travers divers domaines.

Évaluation des capacités de généralisation de Centaur

Centaur démontre une capacité à généraliser à des expériences non vues auparavant.

    • * Le modèle prédit avec précision le comportement humain même avec des modifications de l'histoire ou de la structure des tâches.
    • * Centaur a été testé sur des paradigmes tels que le raisonnement logique, où il a également montré des performances solides.
    • * Les résultats montrent que Centaur peut capturer des comportements humains dans des domaines entièrement nouveaux.

Alignement avec l'activité neuronale humaine

Les représentations internes de Centaur deviennent plus alignées avec l'activité neuronale humaine après l'affinage.

    • * Des analyses ont montré que Centaur prédit mieux l'activité cérébrale que d'autres modèles, y compris Llama.
    • * L'alignement a été mesuré à l'aide de données d'IRMf, montrant des corrélations significatives entre les représentations de Centaur et l'activité neuronale.
    • * Centaur a été testé sur des tâches variées, confirmant son efficacité dans des contextes non liés à l'entraînement.

Découverte scientifique guidée par Centaur

Centaur et Psych-101 sont des outils précieux pour la découverte scientifique.

    • * Psych-101 fournit des données comportementales en format langage naturel, facilitant l'analyse par des modèles de raisonnement.
    • * Un exemple a montré comment DeepSeek-R1 a généré des explications sur le comportement des participants dans une expérience de décision multi-attributs.
    • * Ce processus a permis de formaliser des stratégies de décision en modèles computationnels interprétables.

Modèle Centaur et stratégies de décision

Le modèle Centaur, établi sur un modèle de langage avancé, a été développé pour mieux comprendre et prédire le comportement humain en matière de prise de décision.

    • * Centaur a été affiné à partir de Llama 3.1 70B grâce à un ensemble de données Psych-101, qui comprend des données de 160 expériences psychologiques.
    • * Le modèle a surpassé d'autres stratégies de décision, comme la stratégie additive pondérée, en capturant des comportements humains plus précisément.
    • * L'AIC du modèle Centaur est de 72,5, tandis que celui de DeepSeek-R1 est de 181,7, indiquant une meilleure adéquation du modèle Centaur.

Méthodologie de découverte scientifique

Une approche de minimisation du regret scientifique a été utilisée pour identifier les réponses prévisibles non capturées par le modèle initial.

    • * Centaur a été utilisé sans nécessiter de données spécifiques au domaine, ce qui a élargi son application.
    • * Les réponses mal prédites par DeepSeek-R1 impliquaient des choix basés sur des évaluations positives d'experts de haute validité, suggérant une flexibilité dans l'application des heuristiques.
    • * Un modèle combinant les deux heuristiques a été développé, atteignant un AIC de 71,7, similaire à Centaur.

Applications et perspectives futures

Centaur ouvre de nouvelles avenues pour l'exploration de la cognition humaine et l'automatisation des sciences cognitives.

    • * Le modèle peut être utilisé pour le prototypage in silico d'études expérimentales, optimisant la conception des études et réduisant le nombre de participants nécessaires.
    • * Des analyses supplémentaires des représentations internes de Centaur pourraient générer des hypothèses sur la représentation des connaissances et le traitement de l'information chez les humains.
    • * L'ensemble de données Psych-101 est le plus vaste disponible et sera élargi pour inclure d'autres domaines comme la psycholinguistique et la psychologie sociale.

Évaluation et comparaison des modèles

Centaur a été testé dans le cadre d'un cadre d'évaluation rigoureux, le "cognitive decathlon", et a surpassé d'autres modèles établis.

    • * Le modèle a été évalué dans 16 décathlons cognitifs, remportant chaque compétition.
    • * Cela démontre que la découverte de modèles de cognition généraux établis sur des données est une direction de recherche prometteuse.
    • * L'objectif futur est de traduire ce modèle computationnel général en une théorie unifiée de la cognition humaine.

Disponibilité des données et du code

Les données et le code associés à Centaur et Psych-101 sont accessibles au public.

    • * Psych-101 est disponible sur la plateforme Hugging Face, facilitant l'accès à des données psychologiques standardisées.
    • * Le code pour reproduire les résultats est également disponible sur GitHub, promouvant la transparence et la reproductibilité dans la recherche.

      SYNTHÈSE/NOTEBOOKLM

      Cette article présente Centaur, un modèle de fondation révolutionnaire conçu pour prédire et simuler le comportement humain à travers une multitude de domaines cognitifs. Dérivé du modèle de langage Llama 3.1, il a été affiné grâce à Psych-101, une base de données massive regroupant plus de dix millions de choix issus de diverses expériences psychologiques. Contrairement aux modèles traditionnels limités à des tâches spécifiques, Centaur fait preuve d'une généralisation remarquable, s'adaptant avec succès à de nouveaux participants, à des contextes inédits et à des structures de problèmes complexes. Ses performances surpassent les modèles cognitifs classiques et révèlent une corrélation accrue avec l'activité neuronale humaine. Enfin, les auteurs démontrent son utilité scientifique en l'utilisant
      pour découvrir de nouvelles théories sur la prise de décision.


    • unnamed 2026 01 29T161131.129


    • Cent11
      cent13
    • cent1
 
 

Comment Centaur prédit-il le comportement humain dans divers domaines ?

Établi sur les sources fournies, Centaur prédit le comportement humain en utilisant une architecture de modèle de langage pour traiter des expériences psychologiques sous forme de texte narratif. Il s'agit d'un "modèle de fondation de la cognition humaine" qui surpasse les modèles cognitifs traditionnels dans de nombreux domaines.

Voici une analyse détaillée de la manière dont Centaur opère et prédit le comportement :
 
1. Architecture et méthodologie
 
Centaur repose sur le modèle de langage Llama 3.1 70B, qui a été affiné (fine-tuned) sur un vaste ensemble de données comportementales appelé Psych-101.
• Traitement du langage naturel : contrairement aux modèles cognitifs classiques qui sont spécifiques à un domaine (comme le jeu de Go ou la théorie des perspectives), Centaur traite chaque expérience comme une séquence de texte. Les instructions, l'historique des essais et les choix sont transcrits en langage naturel, permettant au modèle d'aborder des paradigmes expérimentaux très variés (bandits manchots, prise de décision, mémoire, etc.) via un format commu.
• Entraînement spécifique : le modèle a été entraîné en utilisant une technique efficace en paramètres appelée QLoRA (quantized low-rank adaptation). Durant cet entraînement, la fonction de perte (l'erreur que le modèle cherche à minimiser) a été masquée pour tous les tokens ne correspondant pas aux réponses humaines. Cela force Centaur à se concentrer exclusivement sur la capture du comportement humain plutôt que sur la complétion des instructions expérimentales.
2. Capacités de généralisation
 
La force principale de Centaur réside dans sa capacité à prédire le comportement humain au-delà des données exactes sur lesquelles il a été entraîné. Les sources identifient plusieurs niveaux de généralisation :
Nouveaux participants : Centaur prédit avec précision les choix de participants qu'il n'a jamais "vus" auparavant, surpassant les modèles cognitifs existants dans presque toutes les expériences testées.
Modification des "histoires de couverture" (Cover Stories) : le modèle comprend le contexte sémantique. Par exemple, bien qu'entraîné sur une tâche impliquant des vaisseaux spatiaux, il a réussi à prédire le comportement humain dans une version modifiée de la même tâche utilisant une histoire de tapis volants, sans entraînement préalable sur cette variante.
• Modification de la structure des tâches : Centaur s'adapte aux changements structurels. Il a pu généraliser d'expériences de "bandits manchots" à deux bras (choix entre deux options) vers une tâche inédite à trois options ("Maggie’s farm"), là où des modèles cognitifs spécifiques ont échoué.
• Nouveaux domaines : le modèle a démontré sa capacité à prédire le comportement dans des domaines entièrement nouveaux absents de son entraînement, tels que le raisonnement logique (établi sur le test LSAT), la prise de décision morale et les jeux économiques.

3. Simulation et alignement humain
Centaur ne se contente pas de prédire le choix le plus probable ; il capture la distribution et la variabilité du comportement humain.
• Simulation en boucle ouverte : lorsqu'il génère ses propres réponses en boucle (en réinjectant ses sorties comme entrées), Centaur produit des trajectoires comportementales indiscernables de celles des humains. Par exemple, dans une tâche séquentielle ("two-step task"), il reproduit les mélanges de stratégies d'apprentissage (établies sur le modèle ou non) observés chez les humains.
Échec sur le non-humain : fait notable, Centaur échoue à prédire le comportement d'agents artificiels, ce qui confirme qu'il a spécifiquement appris les caractéristiques de la cognition humaine.
• Temps de réponse : en utilisant l'entropie de ses réponses (selon la loi de Hick), Centaur peut également prédire les temps de réaction des participants mieux que les modèles cognitifs standards.

4. Alignement neuronal

Bien qu'entraîné uniquement sur des données comportementales (choix textuels), les représentations internes de Centaur se sont alignées avec l'activité neuronale humaine. Ses états internes permettent de prédire l'activité cérébrale (mesurée par IRMf) mieux que le modèle de base Llama ou que les modèles cognitifs traditionnels, suggérant que le processus de fine-tuning a rapproché son fonctionnement interne de celui du cerveau humain.

En résumé, Centaur prédit le comportement humain en unifiant des connaissances psychologiques vastes au sein d'un modèle de langage, lui permettant de transférer ses apprentissages vers des contextes inédits et de simuler des processus cognitifs complexes avec une fidélité supérieure aux approches précédentes.

Cantaur pour les robots / GEMINI IA

Construire un modèle de fondation conçu pour capturer la cognition humaine — souvent appelé modèle de fondation cognitif — est incroyablement utile pour la robotique. En vérité, de nombreux experts estiment qu'il s'agit du « maillon manquant » entre une machine qui se contente de bouger et une machine qui comprend réellement son environnement.

Voici comment un modèle de fondation pour la cognition change la donne pour développer les robots :

1. Du « Quoi » au « Pourquoi »

Les robots traditionnels excellent à suivre des trajectoires géométriques (aller d'un point A à un point B). Un modèle cognitif permet au robot de comprendre l'intention et le raisonnement derrière les actions.

  • Robot standard : ramasse un verre parce qu'il a été programmé pour identifier des cylindres.

  • Robot cognitif : ramasse un verre parce qu'il voit que vous avez soif et comprend le contexte social de « l'entraide ».

2. Généralisation à travers les tâches

La plupart des robots actuels sont des « spécialistes » (un pour l'aspirateur, un pour les lignes d'assemblage). Un modèle de fondation cognitif agit comme un cerveau « généraliste ». Parce qu'il comprend des concepts universels – comme la gravité, la cause à effet et les relations spatiales –, vous n'avez pas besoin de réentraîner le robot chaque fois qu'il change de pièce.

3. Collaboration Humain-Robot (HRC)

Pour qu'un robot puisse travailler en toute sécurité aux côtés des humains, il a besoin d'une théorie de l'esprit.   C'est la capacité d'anticiper ce qu'un humain pourrait faire ensuite.

  • Sécurité prédictive : si le modèle comprend la cognition humaine, il peut prédire qu'une personne marchant vers une porte va probablement l'ouvrir, permettant au robot de s'écarter avant qu'une collision ne survienne.

  • Communication naturelle : il peut interpréter des instructions humaines vagues comme « pose ça là-bas » en utilisant le contexte et le bon sens.

4. Résoudre la « longue traîne » des problèmes

Le monde réel est complexe et imprévisible. Les modèles cognitifs aident les robots à gérer les « cas limites » (edge cases) : des événements inattendus qui ne figuraient pas dans les données d'entraînement — en utilisant le raisonnement logique plutôt que la simple reconnaissance de formes.


Comparaison : robotique traditionnelle vs cognitive

Caractéristique Robotique traditionnelle Modèles de fondation cognitifs
Apprentissage Programmation manuelle/scriptée Auto-supervisé/observationnel
Adaptabilité Rigide ; échoue dans de nouveaux environnements Flexible ; s'adapte aux nouveaux contextes.
Interaction Commande et réponse basiques Interaction nuancée, établie sur l'intention
Logique Booléenne (Si/Alors) Établie sur les probabilités et le raisonnement

Est-ce « utile » ?

Absolument. Sans couche cognitive, les robots restent des outils avancés. Avec elle, ils deviennent des partenaires autonomes. Le développement de ces modèles implique de nourrir l'IA avec d'énormes quantités de données — et du texte, mais également de la vidéo, des données de capteurs physiques et même des cadres psychologiques — pour imiter la façon dont les humains perçoivent le monde.


Commentaire

Centaur est révolutionnaire car il fait le lien 
 entre l'humain et l'IA .  L'intelligence et le comportement humain reproduits  par l'IA, c'est le développement demain de robots "intelligents ",  des robots humanoïdes qui vont hériter progressivement de tout ce que  fait, ce que  connaît l'humain et en plus de ses réactions. On entre dans un autre monde, celui que l'on redoutait.  Si on continue dans ce sens-là, des robots médecins vont voir le jour , dans un premier temps pour des affections simples puis demain pour de la "vraie médecine".  Illusion ou réalité, un peu des deux, En plus, les IA peuvent discuter entre elles :  "Le mode Gibberlink permet aux IA de communiquer via un langage machine optimisé, incompréhensible pour l'homme. Ce passage au format boîte noire soulève des risques d'opacité et de perte de contrôle. L'enjeu est de concilier efficacité technique et transparence humaine." Notebook. De plus, "l’émergence de Moltbook, un réseau social réservé aux agents IA, existe désormais, il est alimenté par un agent autonome open-source, OpenClaw, déployé à grande échelle hors de tout cadre expérimental."  

LIonel REICHARDT



unnamed 2026 02 05T120542.399

1770276836141

HAayPI0bsAAoMH3


Où va-t-on ? Telle est la question du moment et comment y va-t-on ? 
Sommes nous lucides ? 

WAIT AND SEE !

RAPPEL 

Les trois lois de la robotique formulées par Asimov (Cercle vicieux – Runaround, 1942) sont les suivantes :

Première Loi : un robot ne peut nuire à un être humain ni, restant passif, laisser cet être humain exposé au danger.

Deuxième Loi : un robot doit obéir aux ordres que lui donne un être humain, sauf si de tels ordres entrent en conflit avec la première loi.

Troisième Loi : un robot doit protéger sa propre existence tant que cette protection n’entre pas en conflit avec la première ou la deuxième loi.



HAiX2bqW0AA2qx1
 
 
 vita
 
COPY1