Journal · 26 mai 2026 · 8 min
Filigrane bat ou égale GPT-5.5 sur les 9 suites BancQC v1.
Chiffres publics, méthode ouverte, lecture honnête — y compris là où nous perdons encore.
Le 26 mai 2026, LysIA publie la première mesure complète de Filigrane (pile v1) contre GPT-5.5 sur 9 suites BancQC v1. Mêmes prompts, même juge, sorties brutes en JSON. Résultat : 9 suites gagnées ou à égalité — gate BancQC v1 complète.
01 · Scoreboard
Neuf suites, neuf résultats.
- Loi 25 mini : Filigrane 100 % · GPT-5.5 50 %
- Statuts mini : 62 % · 11 %
- Statuts hard : 83 % · 75 %
- Civisme QC : 100 % · 100 % (égalité)
- Histoire & politique : 100 % · 90 %
- Métiers réglementés : 100 % · 100 % (égalité)
- Terminologie OQLF : 90 % · 90 % (égalité)
- Maths FR : 100 % · 100 % (égalité)
- Lecture FR-QC : 100 % · 100 % (égalité) Tableau interactif : /bancs. Protocole détaillé réservé aux clients Programme (NDA).
02 · Ce qui a changé
Produit, pas recette.
Entre le premier leaderboard (24 mai) et celui-ci, nous avons renforcé la couche de connaissance québécoise propriétaire (RAG multi-corpus, prompt lecture métier, concierge Filigrane) au-dessus d'une base Qwen 3.6, servie sous Filigrane · pile v1 · Qwen 3.6.
Essayez. La démo publique est sur /filigrane — réponses avec sources, sans divulgation du protocole interne.
03 · Ce qu'on ne dit pas
Limites assumées.
- Scores agrégés publics ; items et sorties brutes internes.
- Juge LLM = pile Filigrane pour les deux sujets (biais documenté).
- « Maîtrise du Québec » exige encore BancQC H2, humains et conformité opérationnelle.
04 · Suite
Prochaines étapes.
BancQC H2 2026 (experts sous contrat), adapter agent Filigrane, et qc-base dans les poids. Le pari Au Pied de Cochon reste ouvert sur /bancs § 06.