Google anunció la transformación de su chatbot de Inteligencia Artificial (IA) Bard en Gemini. Este cambio de nombre no es solo marketing, sino que también refleja una profunda revisión y mejora en las capacidades y funcionalidades del chatbot.

La empresa de tecnología lanzó la nueva herramienta de Inteligencia Artificial llamada Gemini, que presentó como más potente que cualquier otra actualmente en el mercado, incluyendo el popular ChatGPT, creado por OpenAI, hoy aliada con Microsoft.

El rebautizado proyecto de IA -antes llamado Bard- busca alinearse con el modelo multimodal de gran lenguaje de Google, Ultra 1.0, y representa un avance importante en esta tecnología ampliado su capacidad para comprender y responder de manera más precisa y relevante a las consultas y solicitudes de los usuarios.

Entre los atributos de Gemini destacaron la "multimodalidad", al ser capaz de "razonar con fluidez mediante textos, imágenes, video, audio y códigos", a través de lo que se conoce como el modelo MMLU, siglas en inglés para la "comprensión masiva de lenguaje multitareas".

Según la presentación general ofrecida por la compañía, Gemini se presentará en tres formatos: Nano (la más sencilla, en forma de aplicación para teléfonos celulares), Pro y Ultra, esta última "la más potente para tareas de gran complejidad".

Además, puede recibir información visual o auditiva (notas de música, imágenes, palabras) y desde ahí generar contenido propio, que a su vez puede ser en versión texto, audio o imágenes.

En esencia, Gemini es capaz de detectar errores en un problema matemático complejo, dar la respuesta correcta y explicar los pasos hasta llegar a ella; o de dar abundante información sobre un animal (un pato) a través de un simple dibujo, incluyendo la traducción de "pato" a cinco lenguas.

Igualmente, es capaz de "jugar" con el usuario en retos tan populares como "piedra, papel o tijera" o el de los tres vasos. Trabaja con los lenguajes de código más habituales, como Java, Python, C++ y Go, según sus creadores, y aunque incurre en algunos errores, Google dice que los sabe resolver cuando así se le comunica en el 90 % de los casos.

Disponible para iOS y Android

El modelo estará disponible en una aplicación para dispositivos móviles con sistemas operativos iOS y Android, y traerá mejoras en términos de capacidades conversacionales y funcionales.

La renovada plataforma permitirá a los usuarios realizar tareas variadas, desde solicitar ayuda con un mensaje de texto hasta generar contenido creativo, usando solo su voz o imágenes.

Y la integración del asistente en dispositivos móviles marcará un “primer paso importante” en la visión de Google de crear un verdadero asistente de IA que sea conversacional, multimodal y útil para tareas cotidianas. Con Gemini en el teléfono, se podrá escribir, hablar o agregar una imagen para obtener todo tipo de ayuda mientras se está en movimiento.

De hecho se puede tomar una fotografía de una llanta pinchada y pedir instrucciones, generar una imagen personalizada para tu cena invitación o pedir ayuda para escribir un mensaje de texto difícil.

Seguí leyendo: