Tencent dévoile sa nouvelle IA raisonneuse pour rivaliser avec ChatGPT et DeepSeek

La Révolution des Modèles de Langage en Chine
Alors que le monde s’attendait à voir une rivalité technologique entre les États-Unis et la Chine dans le domaine de l’intelligence artificielle (IA), c’est une lutte interne qui semble se dessiner au sein de l’Empire du Milieu. À un rythme effréné, les géants chinois de la technologie dévoilent de nouveaux modèles de langage, marquant le début d’une intense compétition.
De Nouvelles Technologies en Émergence
Chaque semaine semble apporter son lot d’innovations. Dernièrement, plusieurs acteurs majeurs ont fait parler d’eux. Par exemple, le lancement du modèle DeepSeek a été un franc succès. Rapidement suivi par les annonces d’Alibaba et ses modèles Wan, ainsi que par Baidu avec le modèle ERNIE. Mais la danse ne fait que commencer, puisque Tencent, un autre géant chinois, s’apprête à faire son entrée sur le marché.
Les Ambitions de Tencent et Son Modèle T1
Tencent, qui avait déjà annoncé ses ambitions en 2023, vient récemment de révéler la version finale de son modèle T1. Conçu pour traiter rapidement des documents textuels complexes, le T1 promet une logique de contenu cohérente sur de longues séquences et un taux d’hallucination bas, ce qui est essentiel pour une expérience utilisateur optimale. Sa conception repose sur l’architecture Turbo S, ce qui confère à ce modèle une rapidité d’exécution supérieure à celle de son rival DeepSeek, renforçant ainsi son attrait pour les entreprises et développeurs.
Des Performances à la Hauteur des Attentes
Comme à son habitude, Tencent a présenté un tableau comparatif des performances de son T1 par rapport aux modèles concurrents. Selon les données fournies, le T1 a atteint un score de 87,2 sur le benchmark MMLU-Pro, surpassant le R1 de DeepSeek qui se contente de 84, tandis que le modèle o1 d’OpenAI reste en tête avec 89,3. Il est à noter que ces scores doivent être interprétés avec prudence.
Une Architecture Hybride Innovante
Le modèle T1 s’appuie sur une architecture hybride, nommée Transformer-Mamba, qui combine la structure classique Transformer à une version plus récente, permettant des gains significatifs en vitesse de traitement et en optimisation de la mémoire. Cette innovation contribue également à une meilleure gestion des contextes étendus, sans nécessiter des ressources matérielles excessives.
Une Stratégie de Tarification Compétitive
Pour faire face à la stratégie tarifaire de DeepSeek, Tencent adopte une approche agressive. Le coût d’utilisation du T1 est fixé à 1 yuan (environ 0,13 euro) par million de tokens dans un sens, et uniquement 4 yuans (environ 0,52 euro) pour la sortie. Par contraste, les tarifs de DeepSeek sont plus complexes, variant entre 1 et 16 yuans selon l’heure et le type d’utilisation.
Une Collaboration Stratégique avec Yuanbao
Malgré la concurrence, Tencent choisit de ne pas évincer ses partenaires. Le modèle T1 est intégré dans sa plateforme d’assistant IA, Yuanbao, tout en permettant l’accès au modèle R1 de DeepSeek. Cette stratégie “double” offre aux utilisateurs la flexibilité nécessaire pour ajuster leurs requêtes selon leurs préférences et besoins spécifiques.
Investissements Accrus dans l’IA
Enfin, il convient de souligner l’engagement de Tencent envers l’IA, avec des investissements atteignant 11,7 milliards de dollars en 2024, en forte hausse par rapport aux 3,4 milliards de l’année précédente. Ce dynamisme témoigne de la volonté de Tencent de renforcer son rôle dans le domaine de l’intelligence artificielle, avec des perspectives de croissance pour 2025.
À mesure que la compétition s’intensifie en Chine, l’issue de cette “guerre civile” de l’IA pourrait avoir des répercussions sur l’ensemble de l’écosystème technologique mondial.
Source : www.lesnumeriques.com