
technology
Le plafond de 70 % de factualité : pourquoi le nouveau benchmark « FACTS » de Google est un signal d'alarme pour l'IA d'entreprise en France
venturebeatDec 10english
De nombreux benchmarks d'IA générative mesurent les performances sur des tâches d'entreprise, mais ignorent souvent la factualité des sorties, cruciale pour les secteurs légaux, financiers et médicaux en France. Google et Kaggle lancent la suite FACTS, révélant un mur de factualité à 70 % pour tous les modèles, y compris Gemini 3 Pro. Cela impacte les entreprises françaises, appelant à des architectures RAG pour fiabiliser l'IA dans un contexte réglementé comme le RGPD, évitant ainsi des erreurs coûteuses en finance ou santé.





