MongoDB lance de nouveaux modèles : les Voyage 4

Pour accompagner les développeurs dans la mise en production des applications d’IA, MongoDB a lancé de nouvelles fonctionnalités destinées à simplifier la création et l’exploitation des applications intelligentes. L’entreprise dévoile : 

  • cinq modèles d’embedding de Voyage AI, intégrés à la suite de modèles d’embedding et de recherche sémantique de MongoDB
  • une gestion automatique des embeddings pour la recherche vectorielle au sein MongoDB Community, 
  • des API de modèles d’IA d’embedding et de reranking dans Atlas, 
  • ainsi qu’un assistant IA de gestion des données pour MongoDB Compass et Atlas Data Explorer. 

Ces fonctionnalités viennent renforcer la position de MongoDB en tant que plateforme de données de référence pour l’IA, plébiscitée par plus de 60 000 clients qui l’utilisent pour exécuter des charges de travail critiques. Les modèles Voyage AI sont désormais intégrés nativement à la plateforme MongoDB, mais ils peuvent également être utilisés indépendamment.

« Le plus grand défi des clients en matière d’IA n’est pas l’expérimentation, mais la fiabilité opérationnelle à grande échelle », explique Fred Roma, Senior Vice President of Product and Engineering chez MongoDB. « Les développeurs veulent plus de simplicité et plus de clarté dans les processus allant du prototype à la production. Avec les lancements annoncés aujourd’hui, MongoDB place la barre plus haut, et aide les équipes à réduire la complexité et à se focaliser sur la création d’applications d’IA performantes dans des environnements critiques réels. »

Parmi les nouveautés :

  • Précision de pointe grâce aux modèles Voyage AI : la disponibilité générale de la nouvelle série Voyage 4 continue d’offrir aux développeurs les meilleurs modèles d’embedding au monde – modèles qui devancent Gemini et Cohere dans le classement public RTEB – pour une récupération plus précise et à moindre coût. La série Voyage 4 comprend le modèle polyvalent voyage-4 qui offre un équilibre entre précision de récupération, coût et latence ; le modèle phare voyage-4-large pour une précision de récupération maximale ; le modèle voyage-4-lite pour une optimisation de la latence et des coûts ; et un modèle voyage-4-nano à pondération ouverte pour les développements et tests en local, ou les applications embarquées.
  • Extraction simplifiée du contexte à partir de vidéos, d’images et de textes : la disponibilité générale du nouveau modèle voyage-multimodal-3.5 étend désormais la prise en charge de l’entrelacement des textes et des images aux vidéos. Le modèle voyage-multimodal-3 a été le premier modèle d’embedding destiné à la production capable de gérer des textes et des images entrelacés. Le modèle voyage-multimodal-3.5 perfectionne cette approche de traitement unifié en vectorisant plus efficacement les données multimodales pour mieux saisir le sens sémantique clé des tableaux, graphiques, figures, diapositives, fichiers PDF, etc. Les développeurs peuvent ainsi s’affranchir des efforts considérables requis pour l’analyse syntaxique de documents complexes, processus qui peut réduire la précision de la récupération et amoindrir la fiabilité des applications.
  • Gestion automatique des embeddings pour la recherche vectorielle MongoDB : des embeddings (représentations vectorielles) haute-fidélité peuvent être générées et stockées automatiquement à l’aide de modèles Voyage AI à chaque insertion, mise à jour ou requête de données. En gérant la génération des embeddings en natif dans la base de données, MongoDB élimine le besoin de pipelines d’embedding distincts ou de services de modélisation externes. Les embeddings restent à jour au fur et à mesure que les données changent, la récupération demeure précise et les applications d’IA conservent un contexte fiable. À la clé : une architecture simplifiée qui facilite le développement et l’exécution des applications d’IA en production. La gestion automatique des embeddings est fournie en préversion publique, et compatible avec nos pilotes (JavaScript, Python, Java, etc.) et les frameworks d’IA tels que LangChain et LangGraph (Python). Cette fonctionnalité est dès à présent disponible pour MongoDB Community, et le sera prochainement sur MongoDB Atlas.

Lire plus