Publié le 6 Janvier 2026
Alibaba Cloud confirme une nouvelle fois que la Chine n’a pas de retard flagrant en matière de modèles IA génératifs.
Le groupe lance Wan2.6, un modèle concurrent de Veo3 et Sora 2 qui promet d’abaisser la barrière d’entrée de la vidéo IA en combinant génération d’images, de son et de plans successifs…
Wan2.6 dispose d'un argument marketing central : l’utilisateur peut aisément se mettre en scène lui-même dans une vidéo générée par IA, en conservant apparence et voix, via un mécanisme dit de “reference-to-video”.
Dit autrement, le modèle se distingue par sa capacité à produire des séquences longues où les visages, les expressions et les voix restent cohérents d’une scène à l’autre, même lorsque le décor, l’angle de caméra ou l’action évoluent. Cette continuité, rendue possible par une technologie baptisée R2V, place Alibaba parmi les premiers acteurs en Chine capables de maintenir une identité visuelle et vocale stable sur plusieurs plans successifs, un défi technique que peu de modèles avaient réussi à relever jusque‑là.
/image%2F1495419%2F20260106%2Fob_eef59f_alibaba-cloud-ia-newpubmarketing-feudj.jpg)
/https%3A%2F%2Fi.ytimg.com%2Fvi%2FRq8gjZgV-jg%2Fhqdefault.jpg)
/image%2F1495419%2F20241105%2Fob_fce95b_alibaba-trade-assurance.png)
/image%2F1495419%2F20240110%2Fob_0cd593_alibaba.jpg)
/image%2F1495419%2F20231223%2Fob_09705b_xpeng-p7-2020-03.jpg)
