Mistral AI annonce la mise à disposition pour tous de Le Chat, son chatbot dopé à l’IA. Alors qu’il fallait précédemment télécharger près de 24 Go de données en torrent pour utiliser Pixtral, la firme vient de les compiler dans son service web.
La première IA multimodale de Mistral AI en version web
Semblable à ChatGPT ou à Google Gemini, Le Chat se présente en version web. Jusqu’alors, il permettait de dialoguer avec les modèles de langage IA Mistral Nemo, Codestral et Mistral Large 2. Cette nouvelle version autorise l’accès gratuit à Pixtral 12-B, le premier modèle IA multimodal de Mistral.
En d’autres termes, un langage multimodal sous-entend sa capacité à traiter divers formats de données : pour ce langage, il s’agit de la faculté à analyser des textes et des images.
D’après les benchmarks publiés par Mistral AI, la startup se félicite d’égaler et parfois même de surpasser certains modèles plus larges, comme le LLaVA-OV 7B.
Essai de Pixtral : générer du code HTML à partir d’une esquisse
Nous avons souhaité vérifier les capacités de Pixtral 12-B mises en avant par Mistral AI. L’entreprise annonce que son langage est capable de générer du code informatique à partir d’un schéma tracé à la main. Nous avons donc esquissé une page web sur un iPad en utilisant l’application Procreate avec un Apple Pencil.
En envoyant cette image à Pixtral, nous y avons associé ce prompt : « Écris du code HTML pour créer un site comme celui-ci. ». Le Chat s’exécute et génère un code source au format HTML.
Curieux, nous nous sommes empressés de visualiser le code HTML en version navigateur.
Bien que le résultat puisse légèrement paraître sommaire, la reconnaissance optique de l’écriture manuscrite se révèle très efficace. La mise en page est globalement respectée, à l’exception des emplacements pour les actualités qui ne sont pas positionnées comme sur l’esquisse.