Tag: benchmarks vérité IA

Évaluer la vérité des IA génératives : les benchmarks de précision factuelle en 2025

King Willie
|
août 11
|
6

En 2025, les benchmarks de vérité comme TruthfulQA révèlent que les IA génératives répètent souvent des mensonges courants. Gemini 2.5 Pro est le plus précis, mais même les meilleurs modèles échouent dans des contextes réels. La précision factuelle est devenue le critère essentiel pour une IA fiable.