Skip to main content

Google ha presentado una versión renovada de su agente de investigación profunda, Gemini Deep Research Agent, y lo hizo abierto para desarrolladores mediante una nueva Interactions API dentro de la API de Gemini. Este cambio pone en manos del código lo que hasta ahora era una herramienta avanzada dentro de productos controlados por Google, un investigador digital capaz de planificar, buscar, sintetizar y producir informes complejos de forma autónoma.

De respuestas cortas a investigación estructurada

Hasta ahora, las interfaces de IA funcionaban como asistentes conversacionales, tú preguntas, ellos responden. Deep Research es un agente autónomo, diseñado para descomponer un problema en fases, lanzar búsquedas iterativas, leer resultados, encontrar huecos en la información y recomponer lo aprendido en informes detallados con citas claras. El proceso puede tomar minutos y requiere analizar múltiples fuentes, no simplemente responder de forma reactiva.

Detrás de esto está Gemini 3 Pro, el modelo de IA más potente de Google, pensado para razonamiento profundo y síntesis de información de alta complejidad.

Interactions API, el nuevo puente para desarrolladores

La pieza que permite todo esto es la Interactions API, una interfaz única para interactuar tanto con modelos como con agentes. A diferencia de la vieja llamada de generación de texto —que funcionaba como enviar preguntas y recibir respuestas— esta API mantiene estado, maneja contexto extendido y habilita ejecuciones largas en segundo plano.

Esto quiere decir que puedes iniciar una investigación desde tu aplicación, desconectar, y luego consultar el resultado cuando esté listo. La API devuelve un identificador de interacción que puedes consultar hasta que el agente termine su trabajo.

Para desarrolladores, no solo programan respuestas de IA, sino flujos de investigación autónomos que se integran como parte de procesos más amplios en productos y servicios.

Medir lo que importa con DeepSearchQA

Junto al anuncio, Google ha abierto DeepSearchQA, un benchmark de código abierto para medir agentes de “búsqueda profunda”. A diferencia de pruebas tradicionales, este conjunto de tareas exige que un agente razone, busque en la web y sintetice resultados en múltiples pasos. El objetivo es establecer estándares más robustos para evaluar estas capacidades cuando la investigación no es trivial, desde comparar marcos regulatorios hasta analizar mercados o literatura científica.

Usos tempranos en sectores de alta exigencia

Aunque la comunicación oficial se centra en desarrolladores, ya hay indicios de usos en sectores exigentes en análisis profundo. Equipos en finanzas emplean Deep Research para automatizar análisis de mercado, mientras que en biotecnología se explora su uso para revisar literatura científica extensa, lo que tradicionalmente consume semanas de trabajo manual.

Esto sugiere que el agente no solo es últil para prototipos o bots, sino también como componente de herramientas analíticas avanzadas que requieren síntesis de información de calidad.

Más allá de hoy, hacia una IA que investiga por sí sola

Google ya ha anticipado que la Interactions API no se quedará en Deep Research. La idea es permitir que otros agentes y modelos se integren bajo un mismo estándar, facilitando que desarrolladores construyan ecosistemas complejos de IA con múltiples tipos de agentes.

También hay señales de integración futura con otros productos de Google y herramientas de productividad, lo que podría llevar estas capacidades a tareas corporativas y a flujos de trabajo más colaborativos.

Un cambio de fondo en cómo programamos con IA

Con Gemini Deep Research Agent y la Interactions API, Google no está simplemente añadiendo una nueva opción para desarrolladores. Está redefiniendo cómo las aplicaciones pueden internalizar procesos de investigación profunda automatizada.

Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.

Dejar un comentario