Google reveló las mejoras que trae el Gemini 1.5 Pro, su más reciente versión de IA

Sundar Pichai, CEO de la empresa, demostró cómo estas actualizaciones potenciarán la inteligencia artificial de Google, destacando su compromiso de mejorar los productos utilizados por miles de millones de personas a diario. Estas novedades llegan poco después del anuncio de OpenAI sobre mejoras en el modelo de IA ChatGPT, evidenciando una intensa competencia en el escenario tecnológico. Google busca expandir sus horizontes más allá de la publicidad, explorando nuevos dispositivos y herramientas potenciadas por IA.

Durante una presentación liderada por Sundar Pichai, CEO de Google, se revelaron las funcionalidades más recientes impulsadas por el avanzado modelo de IA, el Gemini 1.5 Pro. Una de las innovaciones destacadas es la herramienta “Preguntar a las fotos”, que permite a los usuarios explorar imágenes en busca de información detallada, como preguntar sobre el momento en que su hija aprendió a nadar o recordar el número de la matrícula de su coche, todo utilizando imágenes almacenadas previamente.

Además, ejecutivos de Google mostraron cómo el Gemini 1.5 Pro es capaz de “leer” un libro de texto y transformarlo en una especie de charla de IA. Esta funcionalidad ofrece a los profesores una voz natural, permitiéndoles responder a las preguntas de los estudiantes de forma interactiva y atractiva.

Pichai también destacó los avances de IA incorporados en Gmail. Mostró cómo los usuarios ahora pueden pedir al Gemini 1.5 Pro que resuma todos los correos electrónicos recientes de la escuela de sus hijos, analizando los archivos adjuntos, resaltando los puntos esenciales e identificando las tareas pendientes.

En un escenario de intensa innovación, OpenAI, una de las principales empresas en el campo de la inteligencia artificial, presentó un nuevo hito: el modelo de IA GPT-4o. Esta evolución promete hacer que el chatbot ChatGPT sea aún más inteligente y accesible. GPT-4o apunta a transformar ChatGPT en un asistente personal digital, capaz de participar en conversaciones en tiempo real e interactuar utilizando texto y “visión”. Esto implica que puede interpretar capturas de pantalla, fotos, documentos o gráficos enviados por los usuarios, posibilitando diálogos pertinentes sobre esos contenidos.

Google también presentó las habilidades más recientes de Gemini, su chatbot, que ahora puede aceptar una variedad de entradas, convirtiéndose en verdaderamente “multimodal”. Esta actualización está alineada con los avances de ChatGPT. Un ejecutivo también mostró un “colega” virtual que ayuda en la gestión de listas de tareas, organización de datos y administración de flujos de trabajo.

La empresa enfatizó mejoras significativas en la funcionalidad de búsqueda, permitiendo que los usuarios hagan preguntas de forma más natural y específica, además de ofrecer múltiples versiones de respuestas, incluyendo detalladas o resumidas. Por ejemplo, la IA puede sugerir restaurantes adecuados para niños basándose en la ubicación del usuario o diagnosticar problemas con un dispositivo, como una cámara, al analizar un video a través de Google Lens. El objetivo principal es hacer que la búsqueda en el motor de Google sea más intuitiva y eficiente para los usuarios.

Durante la presentación, también se ofreció una breve visión del Proyecto Astra, desarrollado por el laboratorio de IA DeepMind de Google. Este proyecto promete revolucionar la vida cotidiana de los usuarios, permitiendo que asistentes de IA utilicen las cámaras de los teléfonos para interpretar información del mundo real, como identificar objetos e incluso localizar artículos perdidos. La demostración incluyó una visualización de cómo funcionaría esta tecnología en gafas de realidad aumentada.

Google anunció planes de integrar aún más funcionalidades de IA en los teléfonos inteligentes a lo largo de este año. Por ejemplo, los usuarios podrán simplemente arrastrar y soltar imágenes generadas por IA directamente en Google Messages y Gmail, además de hacer preguntas sobre videos de YouTube y archivos PDF en dispositivos Android. Además, se introducirá una nueva herramienta integrada para Android, destinada a detectar actividades sospechosas durante una llamada, como posibles intentos de fraude por parte de estafadores que se hacen pasar por representantes bancarios.

Según el analista Jacob Bourne, de la empresa de investigación de mercado Emarketer, no es sorprendente que la inteligencia artificial haya sido el centro de atención en la conferencia de desarrolladores de Google de este año. Bourne afirma: “Al destacar sus modelos más recientes y cómo potenciarán los productos existentes con amplio alcance al consumidor, Google está demostrando su capacidad para diferenciarse eficazmente de sus competidores”.

Bourne evalúa que la receptividad a las nuevas herramientas será un indicador crucial de qué tan bien la empresa puede adaptar su producto de búsqueda para satisfacer las demandas de la era de la IA generativa. Añade: “Para mantener su ventaja competitiva y cumplir con las expectativas de los inversores, Google necesitará enfocarse en transformar sus innovaciones en IA en productos y servicios rentables a gran escala”.

A medida que Google expande su presencia en el campo de la inteligencia artificial, la empresa anunció planes de introducir más protecciones para mitigar el potencial de uso indebido. Una de las medidas incluye la ampliación del recurso SynthID existente, que tiene como objetivo detectar contenido generado mediante herramientas de IA. El año pasado, este recurso fue mejorado para añadir marcas de agua a imágenes y audios producidos por IA. Además, la empresa afirmó estar colaborando con expertos e instituciones para probar y mejorar las capacidades en sus nuevos modelos.

A pesar del fuerte impulso de la empresa en el área de inteligencia artificial en el último año, también ha enfrentado desafíos significativos. Por ejemplo, poco después de la introducción de su herramienta de IA generativa – inicialmente llamada Bard y posteriormente renombrada a Gemini – el precio de las acciones de Google experimentó una caída. Esto ocurrió después de que un video de demostración de la herramienta ofreciera una respuesta incorrecta para una pregunta sobre el Telescopio Espacial James Webb.

Recientemente, en febrero, la empresa tomó la decisión de pausar la capacidad de Gemini para generar imágenes de personas, después de críticas en redes sociales debido a la producción de imágenes históricamente imprecisas, que representaban predominantemente personas de color en lugar de personas blancas.

Al igual que otros chatbots, como ChatGPT, Gemini está entrenado en amplios conjuntos de datos disponibles en línea. Desde hace tiempo, los expertos han advertido sobre las limitaciones de las herramientas de IA, incluyendo el potencial de inexactitudes, sesgo y propagación de desinformación. A pesar de estas preocupaciones, muchas empresas siguen avanzando en el desarrollo de herramientas de inteligencia artificial o estableciendo asociaciones en el área.

Según informes de Bloomberg en marzo, Apple está considerando la posibilidad de licenciar e integrar el motor de IA Gemini de Google en futuros iPhones y en las funcionalidades de iOS 18. Esto incluiría chatbots y otras herramientas desarrolladas por Google. Además, Apple estaría en negociaciones con OpenAI, creadora de ChatGPT, lo que sugiere un interés más amplio de la empresa en fortalecer sus capacidades de inteligencia artificial en sus productos y ecosistema.

Google reveló las mejoras que trae el Gemini 1.5 Pro, su más reciente versión de IA

ADVERTENCIA:

DIFUSIÓN DEL ANUNCIANTE:

NOTA EDITORIAL: