Source 1
Plus on donne de temps à l'IA pour produire ses chaînes de raisonnement, plus les résultats s'améliorent.
En septembre 2024, le système d'IA « o1 » est déployé par la société OpenAI en version « preview ». Il s'agit du premier modèle dit « de raisonnement ». Au lieu de produire une réponse directement, comme le faisait ChatGPT jusqu'alors, le système prend le temps de « réfléchir » avant de répondre.
Le terme « réfléchir » n'est pas à prendre au pied de la lettre. En réalité, comme tous les grands modèles de langue, o1 ne fait que produire des mots probables. Mais pour répondre à une demande de l'utilisateur, il commence par produire des mots correspondant à un raisonnement (on parle de « chaines de raisonnement ») avant d'utiliser la demande de l'utilisateur et ses propres chaines de raisonnement pour produire des mots correspondant à la réponse.
Par exemple, considérons la question :
« Marie a 5 pommes, elle en donne 2 puis en rachète 4. Combien en a-t-elle ? »
Traditionnellement, ChatGPT aurait répondu directement :
« Marie a 7 pommes. »
Il est probable que ChatGPT donne un nombre de pommes inexact.
Le système o1, quant à lui répondrait :
« Raisonnement :
Marie a 5 pommes et en donne 2. Il lui en reste donc 5 – 2 égalent 3. Elle en rachète ensuite 4, qui doivent être ajoutées au résultat précédent. Marie a donc 3 + 4 égalent 7 pommes.
Réponse :
Marie a 7 pommes. »
Le raisonnement préalable permet à l'IA de décomposer le problème et de s'assurer de la précision de la réponse.
En dévoilant o1, OpenAI a aussi publié un résultat lourd de conséquences : dans de nombreux cas, plus le système produit de chaînes de raisonnement, plus ses résultats s'avèrent justes et précis. Les performances du système sont fonction du « temps de réflexion » donné au système ou, pour être plus exact, de la puissance de calcul qui lui est fournie au moment où il produit sa réponse.
Depuis o1, les modèles de raisonnement sont devenus la norme et permettent un gain de performance considérable, qui devrait encore augmenter à l'avenir.




