Jensen Huang, PDG de Nvidia, a clairement exprimé en 2016 sa volonté de conquérir le marché du data center. Huit ans plus tard, lors de la GPU Technology Conference 2024, l’entreprise a atteint son objectif. La demande croissante en puissance de calcul pour l’intelligence artificielle a propulsé Nvidia au rang de leader, avec une forte demande pour ses GPU. Huang va plus loin en affirmant que Nvidia ne construit pas seulement des puces, mais des data centers complets, soulignant son ambition de s’intégrer dans d’autres infrastructures. Il met en avant le marché du data center, évalué à 250 milliards de dollars en 2023, avec une croissance annuelle de près de 25%.
La révolution des data centers comme « usines d’IA »
Huang qualifie ces nouveaux data centers de « AI Factories », destinés à la production de tokens à partir de données, les comparant à des centrales électriques. Il présente une vision ambitieuse et réfléchie, positionnant les data centers comme des générateurs de profits plutôt que des centres de coûts. Un service clé, l' »AI Foundry », offre des modèles d’IA générative personnalisés pour répondre aux besoins spécifiques des entreprises, visant à révolutionner le secteur informatique vers une génération de contenu sur mesure pour chaque utilisateur.
Des modèles d’IA innovants pour les entreprises
Nvidia propose des microservices d’IA conteneurisés, basés sur la technologie de « retrieval-augmented generation » (RAG), ainsi que les Nvidia Inference Microservices (NIMs). Ces services regroupent un modèle d’IA, un runtime et un moteur d’inférence dans un package prêt à l’emploi, offrant une solution efficace pour le déploiement et l’optimisation des modèles. En collaborant avec divers partenaires, Nvidia vise à offrir des solutions personnalisées pour les entreprises, notamment dans les secteurs de la finance et de la santé.
Partenariats stratégiques pour l’avenir de l’IA
Nvidia renforce ses alliances, notamment avec SAP, pour promouvoir l’intégration de l’IA générative dans les processus métier. Cette collaboration vise à fournir des modèles d’IA adaptés à des cas d’utilisation spécifiques, offrant ainsi une approche sur mesure pour les clients. Cette initiative prévoit une adoption rapide de l’IA générative au sein des entreprises, marquant un tournant majeur dans le paysage technologique actuel.