Skip to content Skip to content

Journal · 26 mai 2026 · 8 min

Filigrane bat ou égale GPT-5.5 sur les 9 suites BancQC v1.

Chiffres publics, méthode ouverte, lecture honnête — y compris là où nous perdons encore.

Le 26 mai 2026, LysIA publie la première mesure complète de Filigrane (pile v1) contre GPT-5.5 sur 9 suites BancQC v1. Mêmes prompts, même juge, sorties brutes en JSON. Résultat : 9 suites gagnées ou à égalité — gate BancQC v1 complète.

01 · Scoreboard

Neuf suites, neuf résultats.

  • Loi 25 mini : Filigrane 100 % · GPT-5.5 50 %
  • Statuts mini : 62 % · 11 %
  • Statuts hard : 83 % · 75 %
  • Civisme QC : 100 % · 100 % (égalité)
  • Histoire & politique : 100 % · 90 %
  • Métiers réglementés : 100 % · 100 % (égalité)
  • Terminologie OQLF : 90 % · 90 % (égalité)
  • Maths FR : 100 % · 100 % (égalité)
  • Lecture FR-QC : 100 % · 100 % (égalité) Tableau interactif : /bancs. Protocole détaillé réservé aux clients Programme (NDA).

02 · Ce qui a changé

Produit, pas recette.

Entre le premier leaderboard (24 mai) et celui-ci, nous avons renforcé la couche de connaissance québécoise propriétaire (RAG multi-corpus, prompt lecture métier, concierge Filigrane) au-dessus d'une base Qwen 3.6, servie sous Filigrane · pile v1 · Qwen 3.6.

Essayez. La démo publique est sur /filigrane — réponses avec sources, sans divulgation du protocole interne.

03 · Ce qu'on ne dit pas

Limites assumées.

  • Scores agrégés publics ; items et sorties brutes internes.
  • Juge LLM = pile Filigrane pour les deux sujets (biais documenté).
  • « Maîtrise du Québec » exige encore BancQC H2, humains et conformité opérationnelle.

04 · Suite

Prochaines étapes.

BancQC H2 2026 (experts sous contrat), adapter agent Filigrane, et qc-base dans les poids. Le pari Au Pied de Cochon reste ouvert sur /bancs § 06.