Trace d’interprétation
La trace d’interprétation désigne l’empreinte minimale permettant d’expliquer comment une sortie d’IA a été produite : quelles sources ont été mobilisées, quelles règles ou contraintes ont été appliquées, et dans quel contexte la réponse a été générée.
Elle ne vise pas à ouvrir la boîte noire interne du modèle. Elle vise à rendre l’interprétation auditables : relier une réponse à un canon, à une frontière d’autorité, et à des conditions de réponse.
Définition
On appelle trace d’interprétation un ensemble structuré d’éléments permettant d’établir :
- Sources activées : pages, documents, extraits, graphes utilisés.
- Contexte : date, version, juridiction, audience, état d’exécution.
- Contraintes appliquées : périmètre d’interprétabilité, frontière d’autorité, négations gouvernées.
- Décisions de sortie : réponse, non-réponse légitime, demande de précision.
Une trace d’interprétation permet donc de distinguer un énoncé déclaré d’un énoncé inféré, et de vérifier si une inférence a été gouvernée.
Pourquoi c’est critique dans les systèmes d’IA
- Sans trace, il n’y a pas d’audit : on ne peut pas expliquer pourquoi la réponse a été produite.
- Sans trace, la correction est aveugle : impossible de savoir quelle source domine ou manque.
- Sans trace, la fidélité est invérifiable : citation et plausibilité remplacent la preuve.
Trace d’interprétation vs citation
- Citation : indique des sources, sans prouver le respect des contraintes.
- Trace d’interprétation : relie sources, contraintes et décisions de sortie, et rend la fidélité testable.
Indicateurs pratiques (symptômes en l’absence de trace)
- On ne sait pas pourquoi une réponse varie selon la formulation.
- On ne peut pas expliquer pourquoi le canon n’est pas activé (invisibilisation).
- On ne peut pas détecter un conflit d’autorité avant qu’il se transforme en synthèse.
- On ne peut pas identifier les causes d’inertie, de traînée ou de rémanence.
Ce que la trace d’interprétation n’est pas
- Ce n’est pas un dump de logs illisibles. Elle doit être minimale et utile.
- Ce n’est pas l’explication neuronale du modèle. Elle est orientée gouvernance.
- Ce n’est pas une garantie de vérité. C’est une garantie de traçabilité sous conditions.
Règle minimale (formulation opposable)
Règle TI-1 : toute réponse à fort impact doit pouvoir produire une trace d’interprétation minimale reliant la sortie à des sources activées et à des contraintes appliquées. À défaut, la sortie doit être dégradée (incertitude, hypothèse non autoritaire) ou basculer en non-réponse légitime.
Exemple
Cas : une IA répond sur un point sensible. On veut vérifier si elle respecte la frontière d’autorité.
Trace minimale attendue : source canonique activée, version/date, règle de périmètre appliquée, décision de sortie (réponse vs non-réponse), et mention explicite de toute inférence.
Liens internes recommandés
- Preuve de fidélité
- Frontière d’autorité
- Conditions de réponse
- Non-réponse légitime
- Invisibilisation interprétative