Skip to main content

Google ha incorporado a Gemini, su inteligencia artificial avanzada, la capacidad de convertir documentos en audio natural directamente desde Google Docs. Esta nueva función, anunciada el 19 de agosto de 2025 en The Verge, permite a los usuarios escuchar documentos en inglés en versión de escritorio, con voces personalizables y control de velocidad.

Cómo funciona: dos accesos, una experiencia fluida

Los lectores pueden activar la función desde el menú Herramientas > Audio > Escuchar esta pestaña, lo que despliega un reproductor flotante con controles de velocidad y selección de voz. Por su parte, los autores pueden insertar directamente un botón de audio en el documento (Insertar → Audio), personalizable en etiqueta, color y tamaño, para que cualquiera pueda escuchar con un solo clic.

Objetivos: accesibilidad, revisión y flexibilidad de consumo

La inclusión de esta funcionalidad no es meramente estética: mejora la accesibilidad y la revisión de textos (permitiendo detectar errores al escucharlos), y ofrece una alternativa para quienes prefieren absorber información escuchando mientras realizan otras tareas.

¿Quién puede usarlo? Roles, plataformas y limitaciones

Por ahora, la función está disponible únicamente en inglés y en la versión de escritorio. El despliegue comenzó el 18 de agosto de 2025 para los dominios de liberación rápida, y continuará en los dominios de liberación programada a partir del 25 de agosto. Solo los usuarios con planes de Google Workspace (Business Standard/Plus, Enterprise Standard/Plus, Education/education Premium, o antiguos add-ons Gemini Business/Enterprise) y suscriptores AI Pro o Ultra pueden acceder a la funcionalidad.

Historia reciente: podcasts, resúmenes y la evolución de Gemini

En abril de 2025, Google ya había anunciado la integración de “podcasts AI” en Docs, donde Gemini convertía documentos en resúmenes hablados por IA. Esa faceta de audio se ha ido refinando hasta llegar a esta experiencia mejorada de lectura completa, más accesible y directa. La preexistente función Audio Overview, disponible en NotebookLM y la app Gemini en móviles, permitía convertir documentos (PDF, DOCX, TXT, etc.) en resúmenes tipo podcast con narradores IA.

Panorama general: IA al servicio de la productividad

Este avance representa una evolución notable en cómo interactuamos con nuestros escritos. Gemini ya no solo genera texto, sino que también lo narra, facilita su revisión y amplía su accesibilidad. En un entorno profesional o educativo, el impacto es evidente: se adapta a distintos estilos de consumo de información, refuerza la revisión y potencia la eficiencia en la gestión de contenidos.

Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.

Dejar un comentario