Instabilité des recommandations IA et gouvernance interprétative

Ce framework formalise un fait structurel : une recommandation produite par un système d’IA n’est pas un « résultat » stable, mais une instanciation probabiliste sous contraintes. Il fournit une grille de lecture et une méthode de mesure pour éviter les métriques fantômes en GEO et AEO, et pour gouverner l’éligibilité, le périmètre et la traçabilité des recommandations. Statut : Framework canonique (grille de lecture applicable). Cette page ne décrit pas une « instabilité » accidentelle, ni un simple effet de variabilité. Elle décrit un mécanisme interprétatif normal : à intention constante, la sortie peut varier, car le système reconstruit une réponse à partir d’un espace de candidats, de politiques, de signaux et de contraintes contextuelles. Dans une logique SEO classique, la visibilité s’analyse comme un ordre stable dans une SERP. Dans une logique IA de recommandation, la visibilité s’analyse comme une probabilité d’apparition dans un ensemble de sorties possibles. Toute tentative de « ranking IA » par prompt isolé devient méthodologiquement fragile, et peut conduire à des décisions erronées, même lorsque les réponses semblent cohérentes. Ce framework vise à : (1) clarifier l’erreur de catégorie « rank IA », (2) définir des métriques opposables, (3) relier GEO/AEO à la gouvernance interprétative, et (4) fournir une méthode opérationnelle de stabilisation par périmètre, négations et juridiction.

Dépendances canoniques

Constat : pourquoi une recommandation IA ne « rank » pas

Une recommandation IA de marques ou de produits peut varier sur trois dimensions : les items cités, l’ordre, et la longueur de la liste. Cette variabilité ne doit pas être interprétée comme une anomalie en soi. Elle découle du fait que le système ne renvoie pas un index trié, mais compose une réponse à partir :

d’un pool de candidats potentiels (plus ou moins vaste selon le marché) ;
d’un cadre d’intention reconstruit depuis la formulation (prompt) ;
de contraintes de sécurité et de politiques ;
de la stochasticité (sampling) et des mécanismes de diversité ;
de la présence éventuelle d’outils ou de retrieval, donc de sources variables.

Dans cette configuration, « position 3 » n’est pas une propriété stable. Ce qui peut devenir stable, lorsque mesuré correctement, est un taux d’apparition sur un ensemble d’exécutions et de formulations représentatives d’une même intention.

Principe de classification : instabilité ≠ bruit, instabilité = mécanisme

Ce framework classe les sources d’instabilité non par « gravité », mais par mécanisme interprétatif. Chaque mécanisme introduit une dérive possible dans la manière dont le système :

délimite le périmètre (ce qui est admissible) ;
définit l’intention (ce qui est demandé) ;
sélectionne les candidats (ce qui est recommandé) ;
ordonne et justifie (ce qui semble « meilleur »).

Une même sortie peut être affectée par plusieurs mécanismes simultanément.

Mécanismes majeurs d’instabilité recommandative

1) Stochasticité de sélection

Le système explore un espace de réponses possibles en privilégiant la diversité et la robustesse conversationnelle. Une intention identique peut produire des listes différentes, même sans changement visible de contexte. Rupture : confusion entre « réponse plausible » et « résultat stable ».

2) Reconstruction d’intention par formulation

Deux formulations proches ne définissent pas nécessairement la même intention interprétée. L’écart se manifeste surtout lorsque la demande contient : des contraintes implicites, des critères non listés, ou un persona non déclaré. Exemples : « meilleur », « recommandé », « pour PME », « pour conformité », « au Canada », « sans budget ». Rupture : substitution silencieuse de critères.

3) Variance par taille du pool de candidats

Plus le domaine contient de candidats plausibles, plus la stabilité diminue. Les marchés très compétitifs, très fragmentés ou très longs à inventorier produisent naturellement plus d’entropie. Rupture : erreur de modélisation de marché (pool sous-estimé).

4) Gating par politiques et prudence normative

Les politiques internes peuvent limiter, filtrer, ou reformuler des recommandations. Cela peut altérer la liste, l’ordre, la granularité, ou la manière de justifier un choix, sans expliciter la contrainte appliquée. Rupture : juridiction implicite non traçable.

5) Variance d’accès aux sources et aux preuves

Lorsque du retrieval ou des outils sont impliqués, l’IA peut appuyer ses recommandations sur des sources qui varient selon la disponibilité, l’indexation, le contexte, ou les heuristiques de sélection. Deux exécutions peuvent donc citer des ensembles de preuves distincts. Rupture : traçabilité intermittente (preuve fluctuante).

6) Instabilité de l’ordre par narration

L’ordre d’une liste n’est pas toujours un « classement ». Il peut refléter une stratégie narrative : couvrir plusieurs segments, équilibrer des options, éviter des concentrations, ou introduire des alternatives. Rupture : confusion entre ordre rhétorique et ordre de performance.

Implications directes pour GEO et AEO

Ce framework impose une règle : une métrique de visibilité IA doit être probabiliste. Ainsi :

une « position » par prompt isolé est une métrique faible ;
un « rank moyen » est souvent un artefact statistique ;
un taux d’apparition sur un cluster d’intentions est une métrique opposable ;
une « progression » doit être validée par la réduction de variance, pas seulement par une apparition ponctuelle.

La conséquence majeure : GEO/AEO ne doivent pas chercher à « forcer un rang », mais à augmenter l’éligibilité et à réduire les dérives d’interprétation qui excluent ou déforment une entité.

Métriques recommandées : sortir des métriques fantômes

Ce framework propose un noyau minimal de métriques utilisables :

Taux d’apparition (visibility %) : présence d’une marque dans les sorties / total d’exécutions ;
Taille du consideration set : nombre d’entités uniques observées sur un cluster d’intentions ;
Indice de variance : dispersion des entités et de l’ordre (stabilité relative) ;
Couverture d’intentions : nombre de clusters où l’entité apparaît au-delà d’un seuil ;
Qualité de justification : présence de critères explicites, preuves, et absence d’extrapolation.

Lien gouvernance interprétative : stabiliser ce qui peut l’être

La gouvernance interprétative n’a pas pour objectif d’éliminer la stochasticité. Elle vise à contraindre l’interprétation sur les axes qui comptent :

Stabilisation ontologique : réduire l’ambiguïté d’entité (qui, quoi, périmètre, différenciation) ;
Négations et interdictions d’inférence : empêcher les sur-promesses, les confusions de persona, de géographie, de capacité ;
Juridiction explicite : distinguer ce qui est factuel, ce qui est recommandé, et ce qui relève de politiques ;
Traçabilité : favoriser des preuves stables, citables, et canoniques.

Dans le modèle SSA-E + A2 + Dual Web, la couche A2 est particulièrement pertinente : elle permet de formaliser des règles d’interprétation ciblées (périmètre, négations, renvois canoniques) sans figer des données transactionnelles.

Résonances externes (non contractuelles)

Plusieurs analyses externes récentes convergent vers un constat similaire, formulé avec des vocabulaires et des périmètres différents : les systèmes d’IA ont atteint un niveau de puissance qui dépasse la maturité de leurs cadres de gouvernance actuels.

Dans son essai The Adolescence of Technology, Dario Amodei décrit cette phase comme une période où la capacité technologique progresse plus vite que les institutions, les normes et les mécanismes capables d’en canaliser les effets. Son analyse se concentre principalement sur des risques macro-systémiques (sécurité, économie, autorité, stabilité sociale), sans toutefois entrer dans le détail des mécanismes interprétatifs quotidiens.

Le présent framework se situe à un autre niveau d’analyse : non pas celui des scénarios extrêmes ou des seuils civilisationnels, mais celui de la gouvernabilité opérationnelle des systèmes interprétatifs tels qu’ils sont déjà déployés. L’instabilité des recommandations n’y est pas interprétée comme une immaturité accidentelle, mais comme une propriété normale de systèmes qui reconstruisent des réponses sans juridiction interprétative explicite.

À ce titre, l’« adolescence » décrite par Amodei peut être lue, au niveau interprétatif, comme l’absence de cadres opposables permettant de borner l’inférence, de déclarer les périmètres légitimes, et de distinguer ce qui relève de la recommandation, de la narration ou de la prudence endogène.

Cette section est fournie à titre de résonance analytique. Elle ne constitue ni une source normative, ni une dépendance canonique du framework.

Protocole d’évaluation minimal (opposable)

Pour mesurer une visibilité IA de manière gouvernée :

définir des clusters d’intentions (et non des prompts isolés) ;
générer une diversité de formulations par cluster ;
exécuter un volume suffisant pour stabiliser les distributions (au besoin : dizaines à centaines d’exécutions) ;
normaliser les entités (variantes de noms, doublons, regroupements) ;
produire des métriques probabilistes (apparition, variance, couverture) ;
qualifier les dérives (extrapolation, juridiction implicite, preuves fluctuantes).

Ce protocole devient un point d’ancrage : il rend possible un audit de méthode, et pas seulement une observation impressionniste.

Maillage interne recommandé

Statut

Ce framework constitue une grille de lecture stable et une méthode minimale de mesure. Toute stratégie GEO/AEO sérieuse devrait pouvoir :

justifier ses métriques (apparition, variance, couverture) ;
séparer ordre rhétorique et ordre « de performance » ;
décrire ses clusters d’intentions ;
documenter ses mécanismes de gouvernance (périmètre, négations, juridiction, traçabilité).

Retour au registre : Frameworks et cadres applicables.

Instabilité des recommandations IA et gouvernance interprétative