BFM Tech

OpenAI lance deux nouveaux modèles d'IA qui peuvent "penser avec des images"

BFM Business Sylvain Trinel
placeholder video
OpenAI propose deux modèles prévus pour réfléchir plus longuement afin de répondre plus efficacement aux utilisateurs.

Le raisonnement est l'avenir de l'intelligence artificielle, et pour pousser cette idée, OpenAI vient d'annoncer le lancement de ses modèles o3 et o4-mini pour ChatGPT, désormais conçus pour "réfléchir plus longuement avant de répondre", annonce l'entreprise dans un communiqué.

Ils peuvent être utilisés de manière autonome les différents outils proposés avec ChatGPT, comme la navigation sur le web, la compréhension des images envoyées ou la génération d'images, afin de résoudre "de manière plus efficace" des problèmes décrits comme "complexes" et qui peuvent être demandés en plusieurs étapes.

Une IA presque autonome, mais aussi plus lente

Ce n'est pas encore une IA complètement autonome, mais il s'agit d'un "progrès", selon l'entreprise, qui vente les mérites de o3 et o4-mini en les décrivant que des modèles pouvant "penser avec des images".

Par exemple, si vous téléchargez des images comme des croquis, qu'ils soient flous ou de mauvaise qualité, o3 comme o4-mini seront en mesure d'ajuster l'image reçue en la pivotant ou en la zoomant afin de comprendre ce que demande l'utilisateur.

OpenAI assure que ces deux modèles ont été testés dans le cadre de son programme de sécurité afin de ne pas "halluciner" (présenter une information comme vraie alors qu'elle est fausse, NDLR), ou en tout cas le moins possible, et d'assurer le meilleur résultat possible. Notons toutefois que le résultat devrait donc être plus long à se générer. On le constate dans l'exemple donné par la start-up IA qui arrive à un raisonnement en plus d'une minute.

Un exemple des modèles o3 et o4-mini sur ChatGPT
Un exemple des modèles o3 et o4-mini sur ChatGPT © OpenAI

Pour utiliser o3 et o4-mini, il faut toutefois être abonné à ChatGPT Plus, Pro et Team.

Il s'agit d'une avancée majeure pour OpenAI, mais d'autres sont encore attendues dans les prochains mois. L'objectif, d'ici la fin de l'année, est de proposer ChatGPT 5, une refonte de 4.5, destinée au grand public, et qui devrait être peu coûteuse pour la génération de textes, d'images et de vidéos.