Los investigadores tienen una herramienta mágica para comprender la IA: Harry Potter
Un número creciente de investigadores está utilizando los libros más vendidos de Harry Potter para experimentar con tecnología de inteligencia artificial generativa.
Por: Bloomberg
Publicado: Martes 26 de diciembre de 2023 a las 12:23 hrs.
Foto: Bloomberg
Noticias destacadas
Más de dos décadas después de que J.K. Rowling presentó al mundo un universo de criaturas mágicas, bosques prohibidos y un mago adolescente, Harry Potter está encontrando una relevancia renovada en un cuerpo de literatura muy diferente: la investigación de la IA.
Un número creciente de investigadores está utilizando los libros más vendidos de Harry Potter para experimentar con tecnología de inteligencia artificial generativa, citando la influencia duradera de la serie en la cultura popular y la amplia gama de datos lingüísticos y complejos juegos de palabras dentro de sus páginas. Revisar una lista de estudios y artículos académicos que hacen referencia a Harry Potter ofrece una instantánea de la investigación de vanguardia en IA y algunas de las preguntas más espinosas que enfrenta la tecnología.
Quizás en el ejemplo reciente más notable, Harry, Hermione y Ron protagonizan un artículo titulado "¿Quién es Harry Potter?" que arroja luz sobre una nueva técnica que ayuda a modelos de lenguaje grandes a olvidar información de forma selectiva. Es una tarea de alto riesgo para la industria: los grandes modelos de lenguaje, que impulsan los chatbots de IA, se basan en grandes cantidades de datos en línea, incluido material protegido por derechos de autor y otros contenidos problemáticos. Esto ha dado lugar a demandas y escrutinio público para algunas empresas de IA.
Los autores del artículo, los investigadores de Microsoft Mark Russinovich y Ronen Eldan, dijeron que han demostrado que los modelos de IA se pueden alterar o editar para eliminar cualquier conocimiento de la existencia de los libros de Harry Potter, incluidos los personajes y las tramas, sin sacrificar las habilidades analíticas y de toma de decisiones generales del sistema de IA.
El dúo dijo que eligieron los libros por su familiaridad universal. "Creímos que sería más fácil para la gente de la comunidad de investigación evaluar el modelo resultante de nuestra técnica y confirmar por sí mismos que el contenido efectivamente ha sido 'desaprendido'", dijo Russinovich, director de tecnología de Microsoft Azure. “Casi cualquiera puede proponer indicaciones para el modelo que permitan comprobar si 'conoce' o no los libros. Incluso las personas que no han leído los libros conocerán los elementos de la trama y los personajes”.
En otro estudio, investigadores de la Universidad de Washington en Seattle, la Universidad de California en Berkeley y el Instituto Allen de IA desarrollaron un nuevo modelo de lenguaje llamado Silo que puede eliminar datos para reducir los riesgos legales. Sin embargo, el rendimiento del modelo disminuyó significativamente si se entrenaba sólo con textos de bajo riesgo, como libros sin derechos de autor o documentos gubernamentales, dijeron en un artículo publicado a principios de este año.
Para profundizar más, los investigadores utilizaron libros de Harry Potter para ver si fragmentos de texto individuales influyen en el rendimiento de un sistema de inteligencia artificial. Crearon dos almacenes de datos o colecciones de sitios web y documentos. El primero incluía todos los libros publicados excepto el primer libro de Harry Potter; otro incluía todos los libros de la serie menos el segundo, y así sucesivamente. "Cuando los libros de Harry Potter se eliminan del datastore, la perplejidad empeora", dijeron los investigadores, refiriéndose a la medida de precisión de los modelos de IA.
Ayuda y referencia fundamental
Los estudios de IA han citado a Harry Potter durante al menos una década, pero se ha vuelto más común a medida que académicos y tecnólogos se han centrado en herramientas de IA que pueden procesar y responder al lenguaje natural con respuestas relevantes. Con Harry Potter, "la abundancia de escenas, diálogos y momentos emocionales lo hacen muy relevante para el área específica del procesamiento del lenguaje natural", dijo Leila Wehbe, investigadora de Carnegie Mellon que realizó una serie de experimentos en 2014 recopilando datos de resonancia magnética cerebral de personas mientras leen historias de Harry Potter para comprender mejor los mecanismos del lenguaje.
En arXiv, un repositorio de investigación científica de acceso abierto, artículos recientes incluyen "Aprendizaje automático para el desarrollo de pociones en Hogwarts", "Grandes modelos de lenguaje conocen a Harry Potter" y "Detección de hechizos en la literatura fantástica con una inteligencia artificial basada en transformadores".
Incluso cuando no es central para la investigación, Harry Potter es también una referencia literaria favorita para los investigadores. Un estudio, por ejemplo, utilizó los trabajos de Rowling para probar la inteligencia de sistemas de inteligencia artificial como los que generaron el chatbot ChatGPT, un tema que ha generado mucho debate en los debates recientes. Terrence Sejnowski, director del laboratorio de neurobiología computacional del Instituto Salk de Estudios Biológicos, argumentó en el artículo que los chatbots simplemente reflejan la inteligencia y los prejuicios de sus usuarios, como el Espejo de Erised en el primer libro de Harry Potter, que refleja los deseos de una persona. volver a ellos
"Harry Potter es popular entre los investigadores más jóvenes", afirmó Wehbe. “Los habrían leído cuando eran niños o adolescentes, pensando así en ellos a la hora de elegir un corpus de texto escrito o hablado”.
Te recomendamos
ARTICULOS RELACIONADOS
Newsletters
LO MÁS LEÍDO
Caja Los Andes concreta la segunda inversión de su fondo en la startup chilena Wheel The World
A través de Leap, el brazo de capital de riesgo corporativo de la caja de compensación, invirtió en la firma de turismo accesible. Cuenta con un fondo de US$ 9 millones, con el que espera respaldar a 20 startups.
Firma que trajo marca Ritz-Carlton a Chile busca frenar el Túnel Lo Ruiz con demanda contra el MOP
Quarzo SA, ligada a la familia Harseim, inició una acción judicial contra el Fisco, el MOP y Autopista Central, acusando que la construcción del proyecto invade concesiones mineras de su propiedad.
Linzor Capital Partners compra participación mayoritaria en firma mexicana Numaris para expandirse en tecnología logística
La inversión se produce en un contexto de transformación del sector logístico mexicano, impulsado por el crecimiento del comercio electrónico, el nearshoring y una mayor demanda por soluciones tecnológicas para optimizar el transporte.
BRANDED CONTENT
¿Qué se necesita para transformar una montaña en un destino de clase mundial?
En este episodio de Fuera de Pista, conversamos con Dominique Rudloff, quien lidera una de las transformaciones más ambiciosas de la industria de la nieve en la región: consolidar a Valle Nevado como parte del hub de ski más importante de Sudamérica.
Santander lanzó una nueva campaña que permitirá a sus clientes ser testigos en vivo de un Grand Prix
La campaña permitirá a clientes que contraten y/o ya tengan una Cuenta Digital Santander participar por un viaje para asistir a una de las fechas más esperadas del calendario de la Fórmula 1, fenómeno que vive un fuerte auge a nivel mundial y también en Chile.
Instagram
Facebook
LinkedIn
YouTube
TikTok