Este miércoles, Google anunció el lanzamiento de su última hazaña tecnológica: Gemini, un modelo de Inteligencia Artificial (IA) que dejó boquiabiertos a los expertos. Este desarrollo, según la compañía, no solo puede comprender imágenes, audio y video por parte de los usuarios, sino que también se autodenomina como “el primer modelo que supera a los expertos humanos en comprensión masiva de lenguajes multitarea”.
No solo se presenta como una herramienta versátil, sino que se puede acceder a través de la plataforma Bard o desde dispositivos móviles, marcando un avance significativo en la accesibilidad de la IA. La plataforma multimodal puede procesar y generar texto, código, imágenes, audio y vídeo desde diversas fuentes de datos.
“Creemos en hacer que la IA sea útil para todos. Es por eso que lanzamos Gemini, nuestro modelo más capaz inspirado en la forma en que las personas entienden e interactúan con el mundo”, declaró Google en su cuenta de la red social X.
La versión inicial, Gemini Pro, ya está disponible para los usuarios a partir de hoy. Además, Google tiene planes ambiciosos para el próximo año, con el lanzamiento de Bard Advanced junto con Gemini Ultra, diseñado para tareas aún más complejas.
El CEO de Google y Alphabet, Sundar Pichai, compartió su entusiasmo por el potencial transformador de la inteligencia artificial. “La IA tiene el potencial de crear oportunidades desde las cotidianas hasta las extraordinarias para personas de todo el mundo. Traerá nuevas olas de innovación y progreso económico e impulsará el conocimiento, el aprendizaje, la creatividad y la productividad a una escala nunca antes vista”, afirmó.
Pichai destacó que Gemini Ultra logra una puntuación del 90,0%, superando a los expertos humanos en la comprensión masiva de lenguajes multitarea. El modelo utiliza una combinación de 57 materias, como matemáticas, física, historia, derecho, medicina y ética, junto con conocimientos y habilidades para la resolución de problemas.
