Alibaba Group Holding Ltd. ha lanzado un nuevo modelo de inteligencia artificial que, según la compañía, puede leer emociones, en un aparente intento por adelantarse al último modelo de OpenAI.
En dos demostraciones, los investigadores del Tongyi Lab de Alibaba mostraron cómo su nuevo modelo de código abierto, R1-Omni, infería el estado emocional de una persona en un video, además de describir su ropa y el entorno. Esto agrega una nueva capa de comprensión a la llamada visión por computadora y es una versión mejorada de otro modelo de código abierto, HumanOmni, desarrollado por el mismo investigador principal, Jiaxing Zhao.
El esfuerzo de Alibaba por consolidarse como líder en inteligencia artificial se ha acelerado tras el llamativo debut de DeepSeek en enero. Ahora, el gigante del comercio electrónico está impulsando el lanzamiento de nuevas herramientas y aplicaciones de IA en varios ámbitos. Ha comparado su modelo Qwen con DeepSeek, asegurado una importante alianza con Apple Inc. para integrar IA en los iPhones y, ahora, parece estar enfrentándose también a OpenAI. Alibaba ha puesto R1-Omni a disposición de los usuarios para su descarga gratuita en Hugging Face.
OpenAI lanzó su modelo GPT-4.5 a principios de este año, destacando que la nueva versión mejora la capacidad de captar y responder a señales sutiles en los mensajes escritos por los usuarios. Sin embargo, el modelo tiene un precio elevado: inicialmente, solo está disponible para quienes paguen $200 al mes.
El director ejecutivo de la compañía tecnológica con sede en Hangzhou, Eddie Wu, dijo a los analistas en febrero que la inteligencia artificial general es ahora el "objetivo principal" de Alibaba.