Google ha ampliado las capacidades de su chatbot de inteligencia artificial Gemini incorporando dos nuevas funciones: Canvas y Audio Overview. Estas herramientas, disponibles desde el martes 18 de marzo de 2025, buscan transformar Gemini en una suite de productividad más completa, siguiendo una estrategia similar a la de sus competidores en el campo de la IA generativa.
Canvas: un espacio interactivo para creación y colaboración
Canvas proporciona a los usuarios de Gemini un espacio interactivo donde pueden crear, refinar y compartir proyectos de escritura y programación. Esta función es conceptualmente similar a la herramienta Canvas de OpenAI para ChatGPT y a Artifacts de Anthropic, reflejando la tendencia de las empresas de IA de convertir sus chatbots en plataformas de productividad más completas.
"Canvas está diseñado para una colaboración fluida con Gemini", explicó Dave Citron, director de producto de Gemini, en una entrada de blog compartida con TechCrunch. "Con estas nuevas funciones, Gemini se está convirtiendo en un colaborador aún más eficaz, ayudándote a dar vida a tus ideas".
La función Canvas se puede iniciar a través de la barra de comandos desde la aplicación Gemini tanto en web como en dispositivos móviles. Permite a los usuarios redactar mensajes extensos con Gemini que luego pueden editar y perfeccionar. Los usuarios pueden actualizar secciones específicas de un borrador y ajustar el tono, la longitud y el formato mediante herramientas dedicadas.
"Por ejemplo, puedes resaltar un párrafo y pedirle a Gemini que lo haga más conciso, profesional o informal", explica Citron. "Si quieres colaborar con otros en el contenido que acabas de crear, puedes exportarlo a Google Docs con un solo clic".
Capacidades de programación en Canvas
Además de las funciones de escritura, Canvas incorpora capacidades orientadas a la programación, incluyendo una función que permite a los usuarios generar y previsualizar código HTML, React y otros prototipos de aplicaciones web. Los usuarios pueden solicitar a Gemini que realice cambios en una vista previa, y Canvas la actualizará de manera iterativa.
"Por ejemplo, digamos que quieres crear un formulario de suscripción por correo electrónico para tu sitio web", escribió Citron. "Puedes pedirle a Gemini que genere el HTML para el formulario y luego previsualizar cómo aparecerá y funcionará dentro de tu aplicación web".
Esta capacidad de vista previa de código actualmente solo está disponible en la versión web de Gemini, según informó Google.
Audio Overview: resúmenes en formato podcast
Junto con Canvas, Google también ha incorporado a Gemini la función Audio Overview, anteriormente disponible en NotebookLM. Esta característica ganó popularidad el año pasado por su capacidad para crear resúmenes de audio con sonido realista, similares a podcasts, de documentos, páginas web y otras fuentes.
Al igual que en NotebookLM, Audio Overview en Gemini acepta archivos y contenido en diversos formatos. Al cargar un documento a través de la barra de comandos se activará el acceso directo a Audio Overview, y una vez generado el resumen, se puede descargar o compartir a través de la aplicación Gemini tanto en web como en dispositivos móviles.
Es importante señalar que los resúmenes de Audio Overview están actualmente limitados al idioma inglés, lo que podría representar una barrera para usuarios de habla hispana.
Espacios de trabajo: la nueva tendencia en plataformas de IA
La incorporación de espacios de trabajo como Canvas representa el último intento de las compañías de IA por transformar sus plataformas de chatbot en suites de productividad completas. Estos espacios de trabajo dedicados pueden ofrecer mayor precisión que las interfaces basadas únicamente en texto, además de proporcionar una forma de previsualizar código en tiempo real.
Como señala TechCrunch, esta estrategia es común entre los principales actores del sector: OpenAI con Canvas para ChatGPT, Anthropic con Artifacts, y ahora Google con Canvas para Gemini.
Disponibilidad de las nuevas funciones
Tanto Canvas como Audio Overview están disponibles gratuitamente para todos los usuarios de Gemini a nivel mundial desde el martes 18 de marzo. Sin embargo, existen algunas limitaciones:
- La función de vista previa de código de Canvas solo está disponible en la versión web por el momento
- Los resúmenes de Audio Overview están limitados al idioma inglés
Estas nuevas incorporaciones reflejan la intensa competencia en el sector de la IA generativa, donde las empresas buscan constantemente mejorar sus productos con nuevas funcionalidades que aumenten la utilidad para los usuarios finales.
La estrategia de Google con Gemini parece clara: transformar su chatbot de IA en una herramienta de productividad más completa que pueda competir directamente con las soluciones ofrecidas por OpenAI y Anthropic, proporcionando a los usuarios capacidades avanzadas tanto para la escritura como para la programación, todo ello en un entorno interactivo y colaborativo.