Comment un modèle d’intelligence artificielle chinoise de haut niveau a-t-il dépassé les sanctions américaines?

La communauté de l’intelligence artificielle discute intensivement de Deepseek R1, un nouveau modèle de raisonnement ouvert à l’ouverture développé par la Venture Deepseek chinoise. Deepseek fait valoir que le R1 est égal dans de nombreux critères de base avec le Chatgpt O1 de l’Openai, le laissant même dans certaines régions, et il est réalisé à un coût beaucoup plus bas.

Hancheng Cao, professeur adjoint à l’Université des systèmes d’information de l’Université d’Emory, déclare que cette innovation peut créer une chance égale pour les chercheurs et les développeurs avec des ressources limitées.

Le succès de Deepseek devient encore plus remarquable compte tenu des effets des contrôles stricts américains sur les exportations de puces en technologie élevée sur les sociétés de renseignement artificielles chinoises. Cependant, les indicateurs existants révèlent que ces restrictions n’ont pas les conséquences attendues. Au lieu de prévenir les capacités de l’intelligence artificielle de la Chine, les sanctions semblent avoir dirigé des initiatives telles que Deepseek à une utilisation plus efficace et à des innovations axées sur la coopération.

Deepseek a dû optimiser les processus éducatifs afin de soulager le fardeau de Nvidia pour le marché chinois, tout en éduquant le modèle R1. L’ancien employé de Deepseek, doctorant à la Northwestern University, a élaboré les difficultés du processus.

Le R1 est loué par les chercheurs pour son succès supérieur dans des problèmes logiques complexes tels que les mathématiques et le codage. Le modèle attire l’attention avec sa capacité à résoudre les problèmes étape par étape en utilisant une approche appelée «chaîne de pensée.

Dimitris Papailopoulos, chercheur en chef du laboratoire de recherche AI ​​Frontiers de Microsoft, a déclaré que la simplicité d’ingénierie dans le modèle R1 est la plus touchée. «Deepseek s’est concentré sur la réalisation des bonnes solutions, plutôt que de se concentrer sur le traitement de chaque étape en détail, ce qui a diminué considérablement avec une grande efficacité», dit-il.

Deepseek a également publié six versions R1 différentes, qui sont suffisamment petites pour travailler sur des ordinateurs portables. La société affirme que l’une de ces versions a traversé le modèle O1-Mini d’OpenAI dans certains tests. Le PDG de Perplexity, Aravind Srinivas, soutient que Deepseek a largement copié O1-Mini et le rend ouvert. Cependant, Deepseek n’a pas commenté cette affirmation.

Liang Wenfeng, le fondateur de Deepseek, a étudié l’information et l’ingénierie électronique à l’Université de Zhejiang et a fondé une entreprise à Hangzhou en 2023. Liang avait précédemment créé un hedge fund appelé High-Flyer en 2015. Maintenant, il vise à créer une intelligence générale artificielle (AGI), comme Sam Altman, PDG d’Openai.

Selon la fin du poste, une organisation des médias chinoise, Liang a une pensée avant-gardiste derrière le succès de Deepseek. Liang, qui a fait un grand stock à partir des puces NVIDIA A100 avant les sanctions américaines, a pu optimiser ces ressources avec des puces à faible puissance. Selon certaines estimations, les actions de la société ont entre 10 000 et 50 000 puces.

Deepseek est l’une des rares initiatives qui ont survécu dans un marché dominé par les sociétés technologiques géantes Alibaba et Bytedance. Il diffère également par sa continuation de ses activités sans recevoir des investissements étrangers.

Mind Wang déclare qu’il a accès à de nombreux traitements de l’information pendant son travail à Deepseek et qu’il peut faire des expériences librement. Il s’agit d’un luxe rare, en particulier pour les nouveaux diplômés.

Liang reconnaît que les entreprises chinoises sont confrontées à l’inefficacité en ingénierie de l’intelligence artificielle. Cependant, avec son équipe, il dit qu’ils essaient de combler ces lacunes en apportant des améliorations de l’utilisation de la mémoire et de la vitesse de calcul.

Les entreprises chinoises ont commencé à accorder de l’importance aux principes open source ainsi qu’à la productivité ces dernières années. Alibaba Cloud a publié plus de 100 modèles d’IA à source ouverte pour 29 langues et codage et mathématiques. D’autres initiatives ont ouvertement des modèles similaires.

Ces développements ont permis à la Chine de prendre la deuxième place dans la race mondiale de l’intelligence artificielle. Le chercheur de l’intelligence artificielle, Matt Sheehan, a déclaré que les restrictions américaines sur les exportations de puces ont poussé les entreprises chinoises à utiliser plus efficacement les ressources.

Deepseek attire l’attention comme exemple qui continue de produire de l’innovation même sous ces pressions.