Manus 1.5 et DeepSeek-OCR : L'IA brise de nouvelles frontières

By Boukary Ouédraogo
Manus 1.5 et DeepSeek-OCR : L'IA brise de nouvelles frontières

Le monde de l'intelligence artificielle est en ébullition constante, mais il est rare de voir deux avancées aussi fondamentales émerger quasi simultanément. En cette fin d'octobre 2025, la startup chinoise Monica a dévoilé Manus 1.5, un agent IA doté d'un "traitement contextuel illimité", tandis que DeepSeek AI a publié DeepSeek-OCR, un modèle open source qui révolutionne la manière dont les LLMs traitent l'information en compressant le texte en images. Ces deux innovations, bien que distinctes, convergent vers un même objectif : créer des intelligences artificielles plus puissantes, plus efficaces et plus proches du raisonnement humain.

Manus 1.5 : La fin de l'amnésie des IA

L'un des freins majeurs à l'adoption à grande échelle des agents IA pour des tâches complexes a toujours été leur mémoire limitée. Les modèles, même les plus performants, perdaient souvent le fil des contraintes et des décisions prises au cours de longs processus. Monica, avec Manus 1.5, prétend avoir résolu ce problème grâce à une gestion du contexte étendue. [1]

Un contexte "illimité" pour une meilleure cohérence

Bien que le terme "illimité" soit plus marketing que technique (la société n'a pas divulgué de limite de tokens), l'avancée est significative. Manus 1.5 est capable de maintenir une cohérence parfaite sur des flux de travail étendus et multi-fichiers. Concrètement, cela signifie que vous pouvez lui confier la refonte d'un projet logiciel complexe, et il se souviendra de chaque dépendance, de chaque modification de fichier et de chaque décision prise, même après des heures de travail. Cette persistance mémorielle est assurée par des politiques de mémoire affinées et une architecture multi-agents, où des sous-agents spécialisés gèrent des tâches simultanées sans interférence.

Vitesse et accessibilité : le duo gagnant

Au-delà de la mémoire, Manus 1.5 impressionne par sa vitesse. Le temps d'exécution moyen des tâches a été divisé par quatre, passant de 15 à moins de 4 minutes. Cette performance est due à un moteur repensé qui parallélise les étapes de planification et d'exécution. [1]

Monica a également eu la bonne idée de proposer deux versions :

Cette stratégie rend la technologie accessible à un plus grand nombre, des développeurs indépendants aux grandes entreprises.

Le générateur d'applications full-stack : une révolution pour le développement

L'une des fonctionnalités les plus spectaculaires de Manus 1.5 est son générateur d'applications full-stack. À partir d'une simple invite en langage naturel, l'agent peut créer une application web complète, incluant l'interface front-end, les API back-end, les flux d'authentification et les bases de données. Il peut même intégrer des fonctionnalités d'IA directement dans le code généré. C'est une attaque frontale contre les plateformes low-code et une promesse de productivité décuplée pour les développeurs.

DeepSeek-OCR : Voir le texte pour mieux le comprendre

De son côté, DeepSeek AI a pris la communauté IA à contre-pied avec une approche radicalement nouvelle. Plutôt que de traiter le texte comme une séquence de mots (tokens), le modèle DeepSeek-OCR le convertit en images. [2]

Une compression 10x pour un contexte décuplé

L'idée, contre-intuitive au premier abord, est d'une efficacité redoutable. Le modèle peut représenter 10 tokens de texte avec seulement 1 "vision token", tout en conservant une précision de 97%. Cette compression permet de stocker et de traiter 10 fois plus d'informations dans le même espace. Les implications sont immenses.

"Peut-être que tous les inputs des LLMs devraient être des images. Les tokens de texte sont peut-être inefficaces", a commenté Andrej Karpathy, cofondateur d'OpenAI, soulignant le potentiel de cette approche. [2]

L'ère des méga-contextes pour l'entreprise

Cette avancée ouvre la voie à des fenêtres de contexte de 10 à 20 millions de tokens. Pour une entreprise, cela signifie pouvoir charger l'intégralité de sa base de connaissances, de ses documents internes ou de son code source dans la "mémoire" de l'IA. L'analyse ne se fait plus fichier par fichier, mais sur l'ensemble du corpus, permettant des analyses croisées et une compréhension globale jusqu'ici impossibles.

Jeffrey Emanuel, un ancien investisseur quantitatif, imagine déjà les possibilités : "Vous pourriez essentiellement entasser tous les documents internes clés d'une entreprise dans un préambule de prompt... et ne pas avoir à vous soucier des outils de recherche, tout en restant rapide et rentable." [2]

Vers un "palais de mémoire" pour l'IA ?

Le modèle, qui est open source, suscite un immense intérêt. Il pourrait non seulement améliorer l'efficacité, mais aussi changer la manière dont les LLMs stockent et récupèrent l'information, en utilisant des représentations visuelles qui rappellent la technique du "palais de mémoire" humain.

Conclusion : Une nouvelle ère pour l'IA

Manus 1.5 et DeepSeek-OCR sont plus que de simples mises à jour. Ce sont des changements de paradigme. Le premier offre à l'IA une mémoire de travail fiable et rapide, la rendant apte à des tâches de longue haleine. Le second lui donne une nouvelle façon de "voir" et de comprendre le langage, décuplant sa capacité d'analyse.

Ces deux avancées, combinées aux progrès constants des autres grands modèles comme Claude (qui vient de se doter d'une mémoire [3]) et Gemini, nous propulsent dans une nouvelle ère de l'intelligence artificielle. Une ère où les agents IA ne seront plus de simples assistants, mais de véritables collaborateurs autonomes, capables de gérer des projets complexes de A à Z. Une ère qui se dessine aujourd'hui, et qui promet de transformer en profondeur notre façon de travailler et d'innover.

 

Références

[1] McFarland, A. (2025, 17 octobre). L'agent IA Manus 1.5 offre un « traitement contextuel illimité ». Unite.AI. https://www.unite.ai/fr/manus-1-5-ai-agent-has-unlimited-context-processing/

[2] Nolan, B. (2025, 23 octobre). DeepSeek’s new model sees text differently, opening new possibilities for enterprise AI. Fortune. https://fortune.com/2025/10/23/deepseek-new-model-text-images-enterprise-ai/

[3] Les Numériques. (2025, 24 octobre). Fini l'oubli : Claude se dote enfin d'une mémoire, mais ce n'est pas la même que ChatGPT. https://www.lesnumeriques.com/intelligence-artificielle/fini-l-oubli-claude-se-dote-enfin-d-une-memoire-mais-ce-n-est-pas-la-meme-que-chatgpt-n244346.html