De nombreux benchmarks d'IA générative mesurent les performances sur des tâches d'entreprise, mais ignorent souvent la factualité des sorties, cruciale pour les secteurs légaux, financiers et médicaux en France. Google et Kaggle lancent la suite FACTS, révélant un mur de factualité à 70 % pour tous les modèles, y compris Gemini 3 Pro. Cela impacte les entreprises françaises, appelant à des architectures RAG pour fiabiliser l'IA dans un contexte réglementé comme le RGPD, évitant ainsi des erreurs coûteuses en finance ou santé.