DeepSeek a récemment lancé Janus-Pro, une intelligence artificielle open-source qui surpasse DALL-E et Stable Diffusion en matière de génération d’images. Cela représente un nouveau défi pour l’IA chinoise à bas coût.
Le nom de DeepSeek s’impose rapidement dans le domaine technologique mondial. Son ascension fulgurante a suscité de nombreux commentaires en ligne et a provoqué un véritable bouleversement dans le secteur de l’intelligence artificielle. Une entreprise chinoise relativement récente a osé défier les géants américains, ce qui a surpris plus d’un observateur.
L’entreprise a mis au point des modèles d’intelligence artificielle qui, selon de nombreux rapports, surpassent ceux disponibles sur le marché, et ce, à un coût extrêmement réduit. À titre de comparaison, OpenAI a investi 100 millions de dollars dans ses modèles, tandis que DeepSeek a obtenu des résultats impressionnants avec moins de 6 millions de dollars.
En d’autres termes, c’est comme si une start-up peu connue avait conçu une voiture plus performante qu’une Ferrari en dépensant seulement un vingtième du budget. Les répercussions de ce succès se sont rapidement fait sentir : DeepSeek est devenu l’application gratuite la plus téléchargée sur l’App Store, a provoqué des pannes de serveur en raison d’un trafic intense et aurait contribué à une chute historique de la capitalisation boursière de NVIDIA, qui a perdu plus de 400 milliards de dollars. La société a également rencontré des problèmes techniques liés à l’afflux d’utilisateurs et a signalé avoir subi une cyberattaque.
Le laboratoire chinois d’intelligence artificielle a franchi une nouvelle étape dans son parcours d’innovation en présentant un modèle d’intelligence artificielle open-source, nommé Janus-Pro. Certains rapports indiquent que Janus-Pro est un modèle de génération d’images qui surpasse DALL-E d’OpenAI, ainsi que Stable Diffusion de Stability AI et d’autres modèles similaires.
Le modèle AI récemment lancé représente une avancée par rapport au Janus précédemment proposé. Il se décline en plusieurs tailles, allant d’une version compacte à une version plus grande et plus sophistiquée, similaire au SD 3.5L. La version la plus étendue, Janus-Pro-7B, se distingue par ses capacités en matière de génération et d’analyse d’images, selon les informations fournies par DeepSeek.
Ce modèle est accessible en téléchargement gratuit sur Huggingface, une plateforme reconnue dans le domaine de l’intelligence artificielle. Janus-Pro-7B intègre une architecture technique particulière qui dissocie la partie de codage visuel du reste, tout en maintenant une architecture de transformation unifiée pour l’ensemble du processus. D’après l’entreprise, cela renforce la flexibilité du modèle. Cependant, il ne surpasse pas les modèles conçus pour des tâches spécifiques.
Le lancement de ce modèle de génération d’images fait suite au succès de DeepSeek avec le modèle de langage R1, qui rivalise avec les performances du GPT-4. Le faible coût de développement de ces modèles avancés suscite un grand intérêt au sein de l’industrie américaine de l’intelligence artificielle.
Commentaire 0
Soyez le premier à commenter !