jeudi 19 février 2026

sciences energies environnement blogger








A Aes modèles d'IA les plus performants peinent à résoudre des problèmes mathématiques originaux

Par Paul Arnold, Phys.org

Édité par Gaby Clark, relu par Robert Egan

Notes de la rédaction

The GIST
Ajouter comme source privilégiée
Crédit : Unsplash/CC0 Domaine public

Les mathématiques, comme de nombreuses autres disciplines scientifiques, font de plus en plus appel à l'intelligence artificielle. Bien sûr, les mathématiques constituent le socle de l'IA, mais les mathématiciens se tournent également vers ces outils pour des tâches telles que la recherche bibliographique et la correction d'erreurs dans les manuscrits. Mais dans quelle mesure l'IA est-elle performante lorsqu'il s'agit de résoudre de véritables problèmes de recherche de haut niveau ?

À ce jour, il n'existe toujours pas de méthodologie réaliste et largement acceptée pour évaluer les capacités de l'IA à résoudre des problèmes mathématiques de ce niveau. Un groupe de mathématiciens a donc décidé de mettre les machines à l'épreuve, comme ils le détaillent dans une étude disponible sur le serveur de prépublication arXiv.

Les tentatives précédentes de test de l'IA utilisaient des problèmes de concours mathématiques et des questions déjà présentes dans les manuels scolaires. Ce qui distingue cette étude, c'est que les questions auxquelles les programmes ont été confrontés proviennent des propres recherches des mathématiciens. Ces problèmes n'avaient jamais été publiés en ligne, ce qui signifie que l'IA ne pouvait pas mémoriser les réponses à partir de ses données d'entraînement.

Test des machines

Chaque mathématicien participant à l'étude a proposé un problème unique et l'a résolu lui-même afin de prouver que les questions n'étaient pas impossibles. Ils ont également crypté les réponses pour qu'elles n'apparaissent pas dans des sources publiques accessibles aux modèles.

Au total, dix problèmes ont été proposés, couvrant divers domaines mathématiques, dont l'analyse stochastique, la théorie spectrale des graphes, la géométrie symplectique et la topologie algébrique. Les chercheurs ont testé les questions sur plusieurs systèmes de pointe, notamment GPT-5.1 Pro et Gemini 3 Pro, et les modèles n'ont eu qu'une seule tentative par question. Aucun indice, conversation ou suggestion supplémentaire n'a été fourni pour les aider à trouver une solution.

L'expérience, intitulée « Première preuve », visait à tester une étape spécifique du processus mathématique. Comme l'ont indiqué les chercheurs dans leur article : « Notre expérience de “première preuve” se concentre sur l'étape finale et la plus précise de la recherche mathématique, où la question et les cadres théoriques sont déjà bien compris. »

L'IA en difficulté

Ces résultats peuvent rassurer ceux qui craignent que l'IA ne soit sur le point de remplacer les mathématiciens. Si les programmes d'IA excellent dans la synthèse des connaissances existantes et la détection de tendances dans les données, les modèles ont eu du mal à résoudre les problèmes du premier coup.

La conclusion générale des chercheurs est que, pour l'instant, l'IA est performante dans les tâches de type concours, mais manque de la créativité et de l'intuition nécessaires pour appréhender et résoudre l'inconnu.

L'équipe prévoit de publier les solutions chiffrées le 13 février, puis de se pencher sur une deuxième série de problèmes. Elle souhaite faire de First Proof un référentiel permanent qui continuera à mettre l'IA à l'épreuve, précisant : « Nous espérons utiliser ces connaissances pour concevoir un référentiel plus formel. »

XXXXXXXXXXXXX

RESUME
Les modèles d'IA les plus performants peinent à résoudre des problèmes mathématiques originaux.

Testés sur des problèmes de recherche mathématique originaux et inédits, issus de divers domaines, les modèles d'IA les plus performants n'ont pas réussi à les résoudre du premier coup. Bien que performants pour les tâches de type concours ou les exercices scolaires, les IA actuelles manquent du raisonnement créatif et de l'intuition nécessaires à la découverte mathématique de haut niveau, ce qui met en évidence une lacune importante dans leurs capacités de résolution de problèmes.

XXXXXXXXXXXXXXX

COMMENTAIRES

Les élèves posent une question simple:
Comment l'IA est-elle utilisée pour résoudre les problèmes ? Ou mieux encore quel est le type de
serve à la prise de décision quasi automatisée???Réponse:l'IA permet des prédictions plus rapides et plus précises, ainsi que des décisions fiables et fondées sur les données  acquises  en nombre et documentées
 xxxxx
Mais cet article  incite a une réflexion  plus générale sur l' IA  qui est actuellement une tarte à la crème pour les média !!!!
Il ya maints secteurs  de l 'activité  sociale et economique   qui seront peu toucgés ;les''petites mains'' ne seront pas remplacées par de '' gentils robots''  partout !!
 Je signale a tous que c'est à New Delhi, que se tiendra le Sommet de l'IA, à partir de jeudi
XXXXXXXX
Publication details
Mohammed Abouzaid et al, First Proof, arXiv (2026). DOI: 10.48550/arxiv.2602.05192

Journal information: arXiv 
AXXXXXXXXXXX

 New Delhi, où se tiendra le Sommet de l'IA, à partir de jeudi.

Aucun commentaire:

Enregistrer un commentaire