Depuis l’arrivée fracassante de ChatGPT, la question de savoir comment fonctionnent réellement les grands modèles de langage (LLM) obsède la communauté scientifique. Souvent qualifiées de « boîtes noires », ces IA produisent des résultats impressionnants sans que leurs créateurs ne comprennent exactement comment elles y parviennent. Une équipe de chercheurs d’Anthropic a décidé d’y voir plus clair en examinant de près leur propre chatbot, Claude. Et leurs découvertes sont pour …