Le fournisseur de cloud de données Snowflake a lancé un grand modèle de langage open source, Arctic LLM, dans le cadre d’un portefeuille croissant d’offres d’IA aidant les entreprises à exploiter leurs données. Les cas d’utilisation typiques incluent l’analyse des données, y compris l’analyse des sentiments des avis, les chatbots pour le service client ou les ventes, et les requêtes de business intelligence, comme l’extraction d’informations sur les revenus.
L’Arctic de Snowflake est proposé aux côtés d’autres modèles LLM de Meta, Mistral AI, Google et Reka dans son produit Cortex, disponible uniquement dans certaines régions. Snowflake a déclaré que Cortex serait disponible dans la région APAC au Japon en juin via la région AWS Asie-Pacifique (Tokyo). L’offre devrait être déployée auprès des clients du monde entier et du reste de la région APAC au fil du temps.
Arctic sera également disponible via l’hyperscaler Amazon Web Services, ainsi que d’autres jardins modèles et catalogues utilisés par les entreprises, notamment Hugging Face, Lamini, Microsoft Azure, le catalogue API NVIDIA, Perplexity, Together AI et autres, selon la société.
Qu’est-ce que Flocon de neige Arctique ?
Arctic est le nouveau LLM « de pointe » de Snowflake, lancé en avril 2024, conçu principalement pour les cas d’utilisation en entreprise. La société a partagé des données montrant qu’Arctic obtient de bons résultats par rapport à d’autres LLM sur plusieurs critères, notamment la génération de code SQL et le suivi des instructions.
Baris Gultekin, responsable de l’IA chez Snowflake, a déclaré que la construction du LLM avait pris trois mois – un huitième du temps de certains autres modèles – avec un budget de 2 millions de dollars. Cette réalisation permet au modèle de repousser les limites de la rapidité et du coût de développement d’un LLM de niveau entreprise.
Quels sont les principaux différenciateurs de Snowflake Arctic ?
Les objectifs d’Arctic LLM sont de fournir un « renseignement efficace » ; il excelle dans les tâches courantes de l’entreprise, tout en étant moins coûteux à utiliser lors de la formation de modèles d’IA personnalisés sur les données de l’entreprise. Il repousse également les limites de l’open source, puisqu’il a été publié sur une licence open source Apache 2.0.
Plutôt que d’utiliser la compréhension générale du monde offerte par de nombreux autres LLM open source, qui incluent les modèles Llama de Meta, le modèle Arctic AI vise spécifiquement à répondre à la demande des entreprises en matière de « copilotes de données SQL conversationnels, de pilotes de code et de chatbots RAG ».
VOIR : Zetaris sur les lacs de données fédérés et le désordre des données d’entreprise
Capacités en « intelligence d’entreprise »
Snowflake a créé sa propre métrique « d’intelligence d’entreprise » pour mesurer les performances du LLM, qui était une combinaison de capacités de codage, de génération SQL et de suivi d’instructions.
Arctic s’est imposé face aux modèles de Databricks, Meta et Mistral lors des tests d’analyse comparative des modèles d’IA courants, qui remettent en question et fournissent un score en pourcentage pour les modèles LLM dans des domaines de capacité spécifiques. Selon Snowflake, la capacité du modèle à exceller en matière d’intelligence d’entreprise par rapport aux LLM dotés de budgets plus élevés était remarquable.
Efficacité de la formation et de l’inférence
Gultekin a déclaré que l’Arctic AI LLM offre aux entreprises clientes un moyen de former des LLM personnalisés en utilisant leurs propres données de manière plus rentable. Le modèle est également conçu pour une inférence efficace afin de rendre les déploiements en entreprise moins coûteux et plus pratiques.
Open source avec Apache 2.0
Snowflake a rendu l’Arctic LLM open source avec une licence Apache 2.0 grâce en partie à ce que Gultekin a dit être l’expérience approfondie de l’équipe d’IA en matière d’open source. Cela consiste à voir l’entreprise fournir un accès aux poids et au code, ainsi qu’à des recettes de données et des informations sur la recherche.
Snowflake pense que l’industrie et le produit lui-même pourront progresser plus rapidement grâce à de véritables contributions des développeurs open source, tandis que Gultekin a déclaré que pouvoir voir sous le capot aiderait les entreprises clientes à faire davantage confiance au modèle.
Quel sera l’impact de Snowflake Arctic sur le marché de l’IA ?
La version Arctic de Snowflake a fait sensation dans la communauté des données et des technologies d’entreprise, grâce à sa rapidité, son efficacité et ses capacités de génération SQL. Gultekin a déclaré que la décision de l’entreprise de « repousser les limites de l’open source » a suscité l’enthousiasme de la communauté des chercheurs.
VOIR : Notre comparaison de Snowflake avec Azure Synapse Analytics
« Il s’agit de notre première version et elle constitue une très bonne référence. Le marché va évoluer de telle sorte qu’il n’y aura pas un seul gagnant ; au contraire, tous les clients sont très intéressés par le choix sur le marché. Nous avons déjà constaté une tonne d’utilisation et nous espérons que cela continuera », a-t-il déclaré.
Snowflake a-t-il une formation en IA ?
Snowflake proposait auparavant une série de solutions d’apprentissage automatique. Dans le cadre du boom de l’IA générative en 2023, elle a acquis un certain nombre d’organisations d’IA, notamment la société de recherche de données Neeva et NXYZ, une société dont Gultekin était PDG et co-fondateur. Depuis lors, Snowflake a développé sa plate-forme principale d’IA générative, ses capacités de recherche d’IA et ajoute désormais des modèles LLM.