TIEMPO DE LECTURA: 14 min

Alibaba libera su agente IA open source: ¿OpenAI en jaque?

Foto de Robinson Lalos
Robinson Lalos
Editor Senior
Alibaba libera su agente IA open source: ¿OpenAI en jaque?

Tongyi DeepResearch, el agente de IA open source de Alibaba, apunta a investigación autónoma y gran eficiencia. ¿Rival para OpenAI? Claves, usos y límites.

Inteligencia Artificial Código Abierto Tecnología Alibaba

En un movimiento que está sacudiendo los cimientos del mundo de la inteligencia artificial, Alibaba ha desvelado Tongyi DeepResearch, un agente de investigación profunda de código abierto que, según afirman, iguala el rendimiento del flagship Deep Research de OpenAI, pero con una eficiencia notablemente superior. ¿Estamos presenciando un nuevo capítulo en la carrera global por la supremacía de la IA?

GitHub página del proyecto Alibaba-NLP/DeepResearch

El agente, desarrollado por el Tongyi Lab de Alibaba (no confundir con el equipo Qwen que crea modelos fundamentales bajo la misma empresa matriz), ya ha sido integrado en aplicaciones reales como Amap, la aplicación de mapas de Alibaba, y Tongyi FaRui, su herramienta de investigación legal. Esto no es solo una demostración tecnológica, sino una solución práctica que ya está siendo utilizada por millones de personas.

Un "Momento DeepSeek" para los Agentes de IA

Expertos de la industria están comparando este lanzamiento con el impacto que tuvo DeepSeek a principios de 2025, cuando los modelos chinos de IA comenzaron a cerrar la brecha con sus contrapartes estadounidenses. "Es el momento DeepSeek para los agentes de IA", señalan varios analistas, destacando cómo este lanzamiento podría democratizar el acceso a tecnologías de investigación avanzada.

Lo que hace particularmente impresionante a Tongyi DeepResearch es su eficiencia: con solo 30 mil millones de parámetros (3 mil millones activos por token), está funcionando a un nivel comparable a modelos que tienen hasta 20 veces su tamaño. Esto no solo reduce los costos computacionales, sino que también lo hace más accesible para desarrolladores y empresas de todos los tamaños.

Características Técnicas: Eficiencia y Potencia en un Solo Paquete

Tongyi DeepResearch, cuyo nombre completo es Tongyi-DeepResearch-30B-A3B, representa un avance significativo en la arquitectura de modelos de lenguaje. Su diseño se basa en una mezcla de expertos (MoE) con aproximadamente 30.5 mil millones de parámetros totales y solo 3-3.3 mil millones activos por token. ¿Qué significa esto en términos prácticos? Pues que ofrece el rendimiento de un modelo grande con la eficiencia de uno pequeño.

Logos de Alibaba Cloud y Tongyi

Arquitectura MoE: El Secreto de la Eficiencia

La arquitectura de Mezcla de Expertos (MoE) permite que solo una parte de los parámetros del modelo se active para procesar cada token, lo que reduce drásticamente los requisitos computacionales. En el caso de Tongyi DeepResearch, esto significa que aunque tenga 30.5 mil millones de parámetros en total, solo se activan aproximadamente 3.3 mil millones para cada unidad de procesamiento, logrando un equilibrio perfecto entre potencia y eficiencia.

Ventana de Contexto Ampliada

Otra característica destacada es su impresionante ventana de contexto de 128,000 tokens. Esta capacidad permite al modelo mantener conversaciones prolongadas y procesar documentos extensos sin perder el hilo del razonamiento, algo crucial para tareas de investigación profunda que requieren analizar múltiples fuentes y sintetizar información compleja.

Licencia Permisiva y Accesibilidad

A diferencia de muchos modelos propietarios, Tongyi DeepResearch se publica bajo una licencia Apache 2.0, lo que significa que desarrolladores y empresas pueden descargarlo, modificarlo y utilizarlo incluso para aplicaciones comerciales sin restricciones. Este enfoque de código abierto está acelerando la innovación y permitiendo que más personas accedan a tecnologías de vanguardia.

"La calidad de los datos determina directamente el límite superior de la capacidad del modelo para generalizar a escenarios fuera de distribución a través de la autoexploración." - Documento técnico de Tongyi DeepResearch

Rendimiento Comparativo: Superando a los Gigantes

Las cifras no mienten, y en el caso de Tongyi DeepResearch, son realmente impresionantes. En benchmarks estándar de la industria, el agente de Alibaba no solo compite, sino que en muchos casos supera a modelos significativamente más grandes y costosos. ¿Cómo logra un modelo con una fracción de los parámetros alcanzar estos resultados? La respuesta está en su innovadora metodología de entrenamiento y arquitectura optimizada.

Gráficos comparativos de rendimiento del modelo
Benchmark Tongyi DeepResearch OpenAI o3 Diferencia
Humanity's Last Exam (HLE) 32.9 26.6 +6.3
BrowseComp (EN) 43.4 49.7 -6.3
BrowseComp (ZH) 46.7 58.1 -11.4
xbench-DeepSearch 75.0 N/A Líder
WebWalkerQA 72.2 N/A Excelente
FRAMES 90.6 N/A El más alto

Excelencia en Investigación Legal

En evaluaciones específicas para investigación legal, Tongyi DeepResearch supera tanto a OpenAI como a Anthropic Claude en calidad de citación de casos (64.26 vs 57.56 y 40.43) y se mantiene a la par en precisión de puntos clave (88.28). Esto lo convierte en una herramienta excepcional para profesionales del derecho que necesitan realizar investigaciones exhaustivas con citas verificadas.

Eficiencia Comparativa

Quizás el aspecto más destacable sea su eficiencia. Con solo 30 mil millones de parámetros (3 mil millones activos), Tongyi DeepResearch está funcionando a un nivel comparable a modelos de hasta 2 billones de parámetros como el GPT-4 de OpenAI. Esto significa que ofrece un rendimiento similar con una fracción de los recursos computacionales, lo que tiene implicaciones enormes para la accesibilidad y sostenibilidad de la IA.

Metodología de Entrenamiento: La Magia Detrás del Éxito

¿Cómo logra Tongyi DeepResearch un rendimiento tan excepcional con una arquitectura relativamente compacta? La respuesta está en su innovadora metodología de entrenamiento, que representa un avance significativo en la forma en que se entrenan los agentes de IA. En lugar de depender de datos etiquetados por humanos, el equipo de Alibaba desarrolló un sistema completamente automatizado que genera y refina datos sintéticos de alta calidad.

Entrenamiento End-to-End como Agente

A diferencia de muchos modelos que son entrenados principalmente como chatbots y luego adaptados para tareas específicas, Tongyi DeepResearch fue entrenado de extremo a extremo como un agente. Su canalización de entrenamiento abarca tres etapas fundamentales: Preentrenamiento Continuo de Agente (CPT), Ajuste Fino Supervisado (SFT) y Aprendizaje por Refuerzo (RL). Este enfoque integral asegura que el modelo desarrolle capacidades de razonamiento y toma de decisiones desde el principio.

AgentFounder: El Motor de Datos Sintéticos

En el corazón del sistema está AgentFounder, un motor de datos sistemático que utiliza grafos de conocimiento, documentos y trayectorias de uso de herramientas para generar pares de preguntas-respuestas sintéticos a gran escala. Una innovación clave es el uso de dos enfoques estructurados para el modelado de comportamiento sintético: Síntesis de Acciones de Primer Orden (FAS) y Síntesis de Acciones de Orden Superior (HAS).

Aprendizaje por Refuerzo Personalizado

La etapa final utiliza un algoritmo personalizado de Group Relative Policy Optimization (GRPO) que aplica aprendizaje on-policy con optimización de gradientes a nivel de token, estimación de ventaja leave-one-out y filtrado cuidadoso de muestras negativas de baja calidad. El equipo informa tendencias consistentemente ascendentes en las señales de recompensa y un comportamiento de exploración estable, atribuyendo gran parte de esto a la estructura y calidad de sus datos de entrenamiento sintéticos.

"Al cerrar el bucle entre la generación de datos y el entrenamiento del modelo, este enfoque no solo garantiza la estabilidad del entrenamiento sino que también proporciona ganancias sustanciales de rendimiento." - Equipo de Tongyi Lab

Dos Modos de Inferencia: Flexibilidad para Diferentes Necesidades

Una de las características más distintivas de Tongyi DeepResearch es su capacidad para operar en dos modos diferentes, cada uno optimizado para tipos específicos de tareas. Esta dualidad permite a los usuarios elegir el enfoque que mejor se adapte a sus necesidades, ya sea priorizando la simplicidad y la transparencia o la profundidad y el rendimiento máximo.

Modo ReAct: Simplicidad y Transparencia

El Modo ReAct (Reasoning + Acting) sigue el clásico ciclo Pensamiento-Acción-Observación, mostrando las capacidades intrínsecas del modelo sin necesidad de ingeniería de prompts compleja. Este modo ofrece una manera directa y transparente de evaluar el rendimiento del agente en un entorno limpio y repetible. Es ideal para tareas que requieren un razonamiento claro y una ejecución predecible, proporcionando una ventana al proceso de "pensamiento" del modelo.

Modo Heavy: Potencia Máxima para Tareas Complejas

Para tareas más exigentes, Tongyi DeepResearch ofrece el Modo Heavy, construido sobre el paradigma IterResearch. Este modo aborda uno de los problemas más comunes en los agentes de IA: la "asfixia cognitiva" y la "contaminación por ruido" que ocurre cuando los agentes acumulan toda la información en un único contexto en constante expansión. En cambio, IterResearch descompone una tarea en una serie de "rondas de investigación", reconstruyendo un espacio de trabajo simplificado en cada iteración.

En cada ronda, el agente reconstruye un espacio de trabajo simplificado utilizando solo las salidas más esenciales de la ronda anterior. Dentro de este espacio de trabajo enfocado, el agente analiza el problema, integra hallazgos clave en un informe central continuamente evolutivo, y luego decide su próxima acción. Este proceso iterativo de "síntesis y reconstrucción" permite al agente mantener un "enfoque cognitivo" claro y una alta calidad de razonamiento a lo largo de tareas largas y complejas.

Aplicaciones Prácticas: De la Teoría a la Realidad

Tongyi DeepResearch no es solo una demostración tecnológica o un proyecto académico; es una herramienta práctica que ya está siendo utilizada en aplicaciones del mundo real. Alibaba ha integrado este agente en varios de sus productos, demostrando su valor en escenarios comerciales reales y proporcionando ejemplos concretos de su utilidad.

Gaode Mate: Planificación de Viajes Inteligente

Una de las implementaciones más visibles es Gaode Mate, un planificador de viajes de IA integrado en Amap, la popular aplicación de mapas de Alibaba. Los usuarios pueden aprovechar las capacidades de recuperación web del agente para planificar viajes de varios días, obteniendo recomendaciones personalizadas basadas en una investigación exhaustiva de atracciones, restaurantes, opciones de transporte y alojamiento. El agente no solo encuentra información, sino que la sintetiza en itinerarios coherentes y prácticos.

Tongyi FaRui: Investigación Legal de Vanguardia

Otra aplicación destacada es Tongyi FaRui, una herramienta de investigación legal que ha sido actualizada con las funciones de investigación del agente. Esta herramienta puede recuperar y citar de manera autónoma leyes de casos y estatutos relevantes, mejorando significativamente la eficiencia de los profesionales del derecho. Su capacidad para proporcionar citas verificadas y analizar jurisprudencia lo convierte en un recurso invaluable para abogados y académicos del derecho.

Potencial en Otros Sectores

Más allá de estas implementaciones iniciales, el potencial de Tongyi DeepResearch abarca numerosos sectores. En investigación académica, podría ayudar a los investigadores a realizar revisiones exhaustivas de la literatura y analizar grandes volúmenes de datos. En el periodismo, podría asistir en la verificación de hechos y la investigación de historias complejas. En el sector empresarial, podría apoyar el análisis de mercado y la inteligencia competitiva.

Impacto en la Comunidad: Un Nuevo Horizonte para la IA Abierta

El lanzamiento de Tongyi DeepResearch está teniendo un impacto significativo en la comunidad de IA y en el mercado tecnológico en general. Al ser de código abierto y estar disponible bajo una licencia permisiva, está democratizando el acceso a tecnologías de investigación avanzada que antes estaban restringidas a empresas con grandes recursos.

Democratización de la Tecnología de Vanguardia

La disponibilidad de Tongyi DeepResearch como proyecto de código abierto significa que desarrolladores de todo el mundo pueden acceder, modificar y mejorar esta tecnología. Esto está acelerando la innovación y permitiendo que equipos más pequeños y con menos recursos compitan en un espacio dominado tradicionalmente por gigantes tecnológicos. El modelo ya ha ganado una rápida popularidad en plataformas como Hugging Face, donde desarrolladores están comenzando a construir sobre él.

Reacción de la Comunidad Técnica

La recepción en la comunidad técnica ha sido abrumadoramente positiva. Expertos como Adina Yakefu, gerente de comunidad de aprendizaje automático de Hugging Face, han descrito las puntuaciones del benchmark de Tongyi DeepResearch como "increíbles". Investigadores de instituciones académicas de prestigio, como la Universidad de California, Berkeley, han elogiado su innovadora canalización de curación de datos, que produce datos de entrenamiento sintéticos de "muy alta calidad".

Implicaciones para el Mercado de IA

Este lanzamiento también está cambiando las dinámicas del mercado de IA. Al ofrecer un modelo de alto rendimiento de código abierto, Alibaba está desafiando el dominio de empresas como OpenAI, Anthropic y Google en el espacio de los agentes de IA avanzados. Esto podría llevar a una mayor competencia, una aceleración de la innovación y, potencialmente, a una reducción de los costos para los consumidores finales de tecnología de IA.

Tongyi DeepResearch en Acción

Para comprender mejor las capacidades y el funcionamiento de Tongyi DeepResearch, te invitamos a ver este video que muestra una instalación y prueba práctica del modelo:

Conclusión: El Futuro de los Agentes de IA

El lanzamiento de Tongyi DeepResearch por parte de Alibaba representa un hito significativo en la evolución de los agentes de IA. Con su impresionante rendimiento, eficiencia computacional y enfoque de código abierto, está desafiando las nociones preestablecidas sobre lo que es posible en el campo de la investigación automatizada. Pero más allá de los logros técnicos, este lanzamiento plantea preguntas importantes sobre el futuro de la IA y su impacto en la sociedad.

Un Nuevo Paradigma en la Investigación Automatizada

Tongyi DeepResearch demuestra que es posible lograr un rendimiento de vanguardia con modelos más eficientes y accesibles. Su arquitectura MoE, metodología de entrenamiento innovadora y enfoque en datos sintéticos de alta calidad están estableciendo nuevos estándares en la industria. Esto podría marcar el comienzo de una tendencia hacia modelos más especializados y eficientes, en lugar de simplemente buscar modelos cada vez más grandes.

Además, su disponibilidad como código abierto está democratizando el acceso a tecnologías avanzadas, permitiendo que una comunidad más amplia de desarrolladores e investigadores contribuya al progreso de la IA. Esto podría acelerar la innovación y llevar a aplicaciones más diversas y creativas de la tecnología.

Sin embargo, también es importante considerar las implicaciones más amplias de este desarrollo. A medida que los agentes de IA se vuelven más capaces y accesibles, ¿cómo afectará esto a las profesiones que tradicionalmente se han basado en la investigación y el análisis? ¿Podríamos ver una transformación similar a la que ocurrió con la llegada de Internet en campos como el periodismo, la investigación legal o el análisis de mercado?

También vale la pena reflexionar sobre la creciente competencia en el espacio global de la IA. El lanzamiento de Tongyi DeepResearch es solo el último ejemplo de cómo empresas chinas como Alibaba están cerrando la brecha con sus contrapartes estadounidenses. Esta competencia global está impulsando la innovación y beneficiando a los consumidores, pero también plantea preguntas sobre la gobernanza de la IA y la necesidad de estándares internacionales.

"La calidad de los datos determina directamente el límite superior de la capacidad del modelo para generalizar a escenarios fuera de distribución a través de la autoexploración." - Equipo de Tongyi Lab

En última instancia, Tongyi DeepResearch representa más que un avance técnico; es un testimonio del poder del enfoque de código abierto y la colaboración global en la IA. Al compartir esta tecnología con el mundo, Alibaba no solo está avanzando en sus propios intereses comerciales, sino que también está contribuyendo al progreso colectivo en el campo de la inteligencia artificial.

¿Estamos presenciando el comienzo de una nueva era en la que los agentes de IA de código abierto se conviertan en herramientas tan omnipresentes y transformadoras como lo son hoy los navegadores web y los motores de búsqueda? Solo el tiempo lo dirá, pero sin duda, Tongyi DeepResearch ha dado un paso significativo en esa dirección.

Publicado el 19/9/2025

Compartir este artículo: