DeepSeek y Tsinghua desarrollan modelos de IA que se mejoran a sí mismos
Se trata de una nueva técnica de aprendizaje por refuerzo que mejora la eficiencia de los modelos de inteligencia artificial y reduce los costos computacionales.
Por: Bloomberg
Publicado: Lunes 7 de abril de 2025 a las 08:12 hrs.
Foto: Bloomberg
Noticias destacadas
DeepSeek está trabajando con la Universidad de Tsinghua para reducir el entrenamiento que necesitan sus modelos de inteligencia artificial (IA), con el objetivo de disminuir los costos operacionales.
La startup china, que sacudió al mercado en enero con su modelo de razonamiento de bajo costo, colaboró con investigadores de la institución de Beijing en un artículo que detalla un enfoque novedoso de aprendizaje por refuerzo para hacer que los modelos sean más eficientes.
El nuevo método busca ayudar a que los modelos de inteligencia artificial se alineen mejor con las preferencias humanas, ofreciendo recompensas por respuestas más precisas y comprensibles, según escribieron los investigadores.
El aprendizaje por refuerzo ha demostrado ser eficaz para acelerar tareas de IA en aplicaciones y ámbitos específicos. Sin embargo, expandirlo a aplicaciones más generales ha sido un desafío, y ese es justamente el problema que el equipo de DeepSeek está intentando resolver con lo que llaman "ajuste de crítica auto-principiada" (self-principled critique tuning, en inglés).
Según el artículo, esta estrategia superó a métodos y modelos existentes en varios indicadores de referencia (benchmarks), mostrando un mejor rendimiento con menos recursos computacionales.
DeepSeek ha bautizado a estos nuevos modelos como DeepSeek-GRM, abreviatura de "generalist reward modeling" (modelado de recompensas generalista), y anunció que los liberará como código abierto.
Otros desarrolladores de IA, como el gigante tecnológico chino Alibaba Group Holding Ltd. y la empresa estadounidense OpenAI, también están avanzando hacia una nueva frontera que busca mejorar las capacidades de razonamiento y auto-mejora mientras un modelo de IA ejecuta tareas en tiempo real.
Meta Platforms Inc., con sede en Menlo Park, California, presentó el fin de semana su más reciente familia de modelos de IA, Llama 4, marcando el primero de sus modelos en utilizar la arquitectura Mixture of Experts (MoE).
Los modelos de DeepSeek dependen significativamente del enfoque MoE para utilizar los recursos de manera más eficiente, y Meta comparó su nuevo lanzamiento con la startup con sede en Hangzhou. DeepSeek aún no ha especificado cuándo lanzará su próximo modelo insignia.
Te recomendamos
ARTICULOS RELACIONADOS
Newsletters
LO MÁS LEÍDO
La gira tech del canciller Pérez Mackenna y de la ministra Lincolao: reuniones en Silicon Valley con Nvidia, Google y Apple
En el marco del programa Choose Chile, los secretarios de Estado se reunieron con grandes empresas tecnológicas para promover la inversión y la formación de capital humano en el país.
Clínica Costanera de Valdivia invierte US$ 15 millones en infraestructura para fortalecer sus prestaciones de tratamiento y cuidado oncológico
La apertura de esta nueva área está proyectada para enero de 2027 y busca entregar atención especializada integral para pacientes que hoy deben recurrir a Santiago por cuidados médicos.
BRANDED CONTENT
Un salto hacia la electromovilidad:
La iniciativa, que estará vigente hasta el 31 de mayo de 2026 o hasta agotar las 500 unidades, busca facilitar el acceso a los vehículos eléctricos, en un contexto marcado por la búsqueda de alternativas más sustentables y eficientes ante el alza de los combustibles
Un salto hacia la electromovilidad:
La iniciativa, que estará vigente hasta el 31 de mayo de 2026 o hasta agotar las 500 unidades, busca facilitar el acceso a los vehículos eléctricos, en un contexto marcado por la búsqueda de alternativas más sustentables y eficientes ante el alza de los combustibles
Dra Susan Bueno y el impulso que la mueve a avanzar, investigar y aportar a la sociedad.
Su curiosidad temprana la llevó a estudiar las enfermedades infecciosas y a contribuir en el desarrollo de la primera vacuna aplicada masivamente en Chile contra el Covid-19. Hoy, la Dra. Susan Bueno, reconocida en 2024 como inventora del año, continúa aportando desde la investigación al fortalecimiento de la salud. Mira aquí su entrevista
Instagram
Facebook
LinkedIn
YouTube
TikTok