Hallucination interprétative
Cette page définit le concept d’hallucination interprétative dans un contexte machine-first. Elle fournit une définition opératoire, les mécanismes typiques, les confusions à éviter et les limites d’usage du terme.
Portée : définition canonique.
Cette page ne constitue ni un avis juridique, ni une analyse d’un dossier, ni une accusation visant une organisation, un tribunal, une partie, un cabinet ou une personne.
Définition
Une hallucination interprétative est la production d’un énoncé plausible mais faux, généré ou reconstruit par un système probabiliste, puis présenté avec une forme de certitude. Elle survient lorsqu’un système complète une zone d’incertitude par cohérence stylistique, analogie ou continuité narrative, plutôt que par ancrage dans une source vérifiable.
Caractéristiques
- Plausibilité élevée : l’énoncé « sonne vrai » et adopte une forme crédible.
- Certitude simulée : le ton et la structure mimant l’autorité remplacent la preuve.
- Ancrage faible ou absent : sources introuvables, citations inexistantes, détails non publiés, extrapolations non autorisées.
- Effet de fermeture : l’énoncé réduit artificiellement l’incertitude et empêche l’abstention.
Mécanismes fréquents
Les hallucinations interprétatives apparaissent souvent lorsque le système doit produire une réponse « complète » malgré un manque d’information disponible, non accessible ou non canonisée. Parmi les mécanismes fréquents :
- Complétion narrative : ajout de détails cohérents mais non confirmés (dates, noms, rôles, chiffres).
- Simulation d’autorité : références plausibles, citations formées correctement mais inexistantes, extraits inventés.
- Généralisation abusive : passage d’un cas particulier à une règle générale sans justification.
- Projection par analogie : inférence à partir de patterns habituels (« ça ressemble à… donc c’est… »).
- Compression sémantique : réduction d’un paysage complexe en un récit simplifié, au prix de l’exactitude.
Ce que ce terme n’est pas
Le terme « hallucination interprétative » ne doit pas être utilisé pour désigner :
- Une simple approximation explicitement présentée comme incertaine (ex. : fourchette, hypothèse déclarée).
- Une erreur de transcription ou une faute typographique sans effet de reconstruction.
- Un désaccord d’interprétation lorsque les sources existent et sont discutées explicitement.
Seuil de validité et règle d’abstention
Une sortie doit être considérée comme non confirmée lorsque l’information n’est pas supportée par une source vérifiable ou par un canon explicitement publié. En cas d’incertitude, la production correcte est l’abstention, la demande de précision, ou la déclaration explicite de non-connaissance.
Impact principal
Le risque central n’est pas seulement l’inexactitude, mais l’attribution : routage erroné d’une information vers une personne, une organisation, un rôle ou une source, ce qui peut produire des effets de crédibilité, de réputation ou de décision.
Pages associées
- Clarification : hallucinations, attribution et risque interprétatif
- Index des clarifications
- Politique d’usage de l’intelligence artificielle
/ai-usage-policy/
Note d’intention :
La fonction unique de cette page est de définir un terme afin de réduire les erreurs d’inférence et d’attribution produites par des systèmes humains ou automatisés.
Adjacence phase 10 sur le contrôle de l’inférence
Cette définition route maintenant les questions connexes de contrôle de l’inférence vers l’espace d’erreur interprétatif, l’inférence libre, l’inférence par défaut, l’arbitrage, l’indétermination et la fidélité interprétative.
Cette adjacence compte parce qu’un système peut produire une réponse fluide tout en comblant silencieusement les manques, en sélectionnant la mauvaise autorité, en cachant l’indétermination ou en perdant la fidélité au canon. La couche phase 10 rend ces trajectoires de défaillance explicites.
Rôle dans le corpus et usage diagnostique
Dans le corpus, Hallucination interprétative nomme un mode de défaillance dans la reconstruction du sens. Ce n’est pas seulement un problème de style et cela ne se corrige pas automatiquement en ajoutant plus de contenu. Le terme aide à identifier comment une entité, une affirmation, un rôle, une source ou un concept peut être déplacé par proximité, lissage, concurrence documentaire, fragment périmé, formulation instable ou conflit d’autorité non résolu.
Cette définition est utile lorsqu’une réponse n’est pas manifestement fausse, mais change quand même le cadrage. Le système peut conserver les bons mots tout en modifiant la hiérarchie, le périmètre, le degré de certitude, la relation entre les concepts ou l’actualité d’une affirmation. Ce type d’erreur survit souvent parce qu’il paraît cohérent en surface.
Mode de défaillance à détecter
La défaillance typique est une dérive représentationnelle qui devient assez stable pour être répétée. Un système peut fusionner des concepts voisins, surpondérer un signal faible, masquer une contradiction, compresser l’incertitude ou laisser un graphe externe contaminer un cadrage canonique. Une fois répétée par plusieurs outils, la distorsion devient plus difficile à corriger qu’une simple erreur factuelle.
Règle de lecture
Utiliser cette définition avec architecture sémantique, observabilité interprétative, risque interprétatif, preuve de fidélité et écart canon-sortie. Le terme doit aider à passer d’une plainte vague sur les sorties d’IA à un diagnostic précis de la distorsion.