Suivez Nous

DeepSeek lance Janus-Pro : un rival de Dall-E et Stable Diffusion encore en rodage

Alexandre Martin | | Technologie
DeepSeek
Exemples d’images générées avec Janus-Pro. © DeepSeek

À peine une semaine après avoir dévoilé R1, son chatbot conçu pour rivaliser avec les modèles d’OpenAI, l’entreprise chinoise DeepSeek remet le couvert avec une nouvelle intelligence artificielle : Janus-Pro. Présenté comme un sérieux challenger face à Dall-E et Stable Diffusion, ce générateur d’images saura-t-il réellement bousculer la hiérarchie en place ?

Une IA ambitieuse aux promesses alléchantes

DeepSeek franchit un cap en dotant Janus-Pro d’une double compétence : la génération et la compréhension d’images. Son lancement s’accompagne d’un rapport technique publié sur GitHub, révélant deux déclinaisons du modèle : Janus-Pro-1B (un milliard de paramètres) et Janus-Pro-7B (sept milliards de paramètres). Les premiers tests, notamment ceux de GenEval et DPG-Bench, suggèrent que ce nouvel arrivant surpasserait Dall-E 3 et Stable Diffusion XL, rien que ça !

Janus-Pro ne se contente pas de créer des visuels. Il sait aussi analyser des images et répondre à des questions les concernant. Besoin de convertir une formule en code LaTeX ou d’expliquer une scène ? L’IA de DeepSeek promet de s’en charger avec précision.

Une qualité d’image encore loin du compte

Sur le papier, Janus-Pro impressionne. Dans la pratique, quelques bémols viennent tempérer l’enthousiasme. Le premier frein majeur : une résolution limitée à 384 x 384 pixels pour ses rendus, bien en deçà des standards actuels. Même en version de démonstration sur Hugging Face, où les images atteignent 768 x 768 pixels, un upscaling artificiel semble être de mise.

Autre point faible, la reconnaissance de caractères (OCR) reste perfectible, et le niveau de détail des images générées ne rivalise pas encore avec les ténors du marché. Les concepteurs de Janus-Pro en conviennent eux-mêmes : « la faible résolution […] donne des images qui, bien que riches en contenu sémantique, manquent encore de détails fins ».

Disponible sous licence MIT, Janus-Pro peut être téléchargé librement par quiconque dispose d’un matériel suffisamment puissant. Ceux qui souhaitent le tester peuvent se rendre sur Hugging Face, mais attention : sans compte, l’usage est restreint à une centaine de secondes de calcul, soit seulement deux ou trois essais.

Janus-Pro marque-t-il une avancée ou reste-t-il un simple coup d’essai ? Pour l’instant, il séduit par son ambition mais pêche encore par ses performances. Reste à voir si DeepSeek saura affiner son modèle pour en faire un véritable poids lourd de l’IA générative.

Alexandre Martin

Mots-clefs : ,

Laisser un commentaire