OpenAI lanzó un par de modelos de inteligencia artificial abiertos y de libre acceso que pueden imitar el proceso humano de razonamiento, meses después de que DeepSeek, de China, llamara la atención mundial con su propio software de IA abierto.
Los denominados GPT-oss-120b y GPT-oss-20b, estarán disponibles en la plataforma de alojamiento de software de IA Hugging Face y podrán generar texto —pero no imágenes ni vídeos— en respuesta a las solicitudes de los usuarios, según informó OpenAI el martes. Estos modelos también pueden realizar tareas complejas, como escribir código y buscar información en línea en nombre del usuario, según la startup.
Ambos modelos son sistemas de peso abierto, similares al Llama de Meta Platforms Inc. El término "peso" se refiere a los valores numéricos de los parámetros de un modelo de IA, que son el resultado de su entrenamiento y se pueden ajustar.
OpenAI está revelando los numerosos valores numéricos que los modelos recogieron y con los que se ajustaron durante el proceso de entrenamiento, lo que permite a los desarrolladores personalizarlos mejor.
Sin embargo, no revela los datos utilizados para entrenarlos, lo que no cumple con la definición de un modelo de IA verdaderamente de código abierto.
Una vieja promesa
A pesar de su nombre, la mayoría de los modelos de OpenAI son sistemas cerrados, es decir, el tipo de software que controla el desarrollador, que los usuarios no pueden modificar y que ofrece menos transparencia sobre sus fundamentos técnicos.
Al igual que muchos de sus rivales estadounidenses, OpenAI ha protegido sus datos de entrenamiento y se ha centrado en cobrar más por sus modelos más potentes para compensar el enorme coste de desarrollo. OpenAI no ha lanzado ningún modelo abierto desde 2019, cuando presentó GPT-2, un predecesor del software que originalmente impulsaba el chatbot ChatGPT.
Poco después de que DeepSeek lanzara su sistema abierto R1 en enero, el CEO de OpenAI, Sam Altman, dijo que la empresa estaba debatiendo la posibilidad de publicar algunos pesos de los modelos. También reconoció que OpenAI necesitaba "encontrar una estrategia de código abierto diferente". Más recientemente, el Plan de Acción de IA del Presidente de Estados Unidos, Donald Trump, fomentó el desarrollo de modelos abiertos, citando su potencial para "convertirse en estándares globales" en la investigación empresarial y académica.
Sin embargo, los detractores del software de código abierto llevan mucho tiempo argumentando que es menos seguro. En julio, Altman publicó en la red social X que la compañía tenía previsto lanzar un modelo de peso abierto a mediados de ese mes, pero que lo estaba posponiendo "para realizar pruebas de seguridad adicionales y revisar las áreas de alto riesgo".
"Aunque confiamos en que la comunidad creará grandes cosas con este modelo, una vez que se publiquen los pesos, no se podrán retirar", afirmó Altman en ese momento. Añadió que este tipo de publicación es "nueva para nosotros" y que la empresa quería "hacerlo bien".
OpenAI pretende que los nuevos modelos abiertos sean utilizados por particulares, empresas y gobiernos que deseen ajustar y ejecutar sistemas de IA en su propio hardware y servicios. Orange SA y la empresa de software Snowflake Inc. se encuentran entre las empresas que han estado probando los modelos, según OpenAI.
Los nuevos modelos también serán distribuidos por el repositorio de modelos Bedrock de Amazon.com Inc. y en la nube de inferencia gestionada por Groq y la empresa saudí Humain AI.
Ambos nuevos modelos son relativamente compactos y eficientes. La opción más potente, 120b, puede funcionar con una unidad de procesamiento gráfico de 80 gigabytes, según la empresa. Por su parte, el modelo 20b puede funcionar en un ordenador portátil con 16 gigabytes de memoria, según OpenAI.
Durante una rueda de prensa celebrada esta semana, OpenAI afirmó que espera recibir comentarios de los usuarios para poder analizarlos y decidir qué tipo de modelo abierto lanzar en el futuro.