Monitor Software
Investigadores utilizan libros de Harry Potter para comprender la IA
Publicación:29-12-2023
TEMA: #Inteligencia Artificial
Varios investigadores están utilizando los libros de Harry Potter para experimentar con tecnología de Inteligencia Artificial generativa.
Hace ya más de 20 años que J. K. Rowling escribió la saga de Harry Potter, unos libros cuya popularidad ha crecido como la espuma en prácticamente todo el mundo, y que disfrutan tanto niños como mayores. Tanto, que se utilizan con frecuencia en el mundo académico con diversos fines. Uno de ellos, según Bloomberg, es la investigación en Inteligencia Artificial.
Varios investigadores están utilizando los libros de Harry Potter para experimentar con tecnología de Inteligencia Artificial generativa, por la influencia tan fuerte que está generando en la cultura popular, y por la cantidad de datos sobre lenguaje y los juegos de palabras complejos que contiene. La revisión de varios estudios y trabajos académicos que hacen referencia a Harry Potter se puede apreciar una muestra de la marcha de la investigación sobre IA, y también algunas de las dudas de más calado a las que se enfrenta la tecnología.
En uno de ellos, titulado «¿Quién es Harry Potter?«, se explica una técnica nueva que ayuda a los modelos grandes de lenguaje a olvidar información de manera selectiva, una tarea muy importante para el sector. Los modelos grandes de lenguaje, que están detrás de los chatbots con IA, están desarrollados a partir de grandes cantidades de datos online. Entre ellos hay material protegido por derechos de autor, o con contenidos problemáticos y polémicos. Esto ha llevado a la presentación de demandas y a la exposición pública de las actividades de algunas empresas de IA.
Los autores de este estudio, Mark Russinovich y Ronen Eldan, aseguran que han demostrado que los modelos de IA se pueden alterar o editar para eliminar cualquier conocimiento de la existencia de los libros de Harry Potter, incluyendo tramas y personajes, sin mermar las capacidades analíticas y de toma de decisiones generales del sistema de IA.
En otro estudio realizado por varios investigadores de la Universidad de Washington en Seattle, la Universidad de California en Berkeley y el Instituto Allen para la IA; se desarrolló un nuevo modelo de lenguaje, llamado Silo, que puede eliminar datos para reducir los problemas legales. No obstante, el rendimiento del modelo caía de manera notable si solo se entrenaba con textos de bajo riesgo, como libros sin derechos de autor o documentos del gobierno.
Para profundizar y ver si podía mejorar sus resultados, los investigadores utilizaron los libros de Harry Potter para ver si con extractos del texto podían influir en el rendimiento del sistema de IA. Crearon dos conjuntos de datos, compuestos por colecciones de webs y documentos.
El primero incluía todos los libros publicados excepto el primero de Harry Potter. El otro incluía todos los libros de Harry Potter menos el segundo. Después crearon otros que, sucesivamente, no incluían el tercer libro, el cuarto, el quinto, etc. Según sus conclusiones, em relación con la precisión de los modelos de IA, «cuando los libros de Harry Potter se eliminan del conjunto de datos, la confusión empeora«.
Hay estudios sobre IA que llevan citando los libros de Harry Potter ya desde hace unos años, pero utilizar sus libros se ha vuelto más frecuente a medida que tanto académicos como tecnológicos se han centrado en herramientas de IA capaces de procesar y contestar al lenguaje natural con respuestas relevantes.
Otros ejemplos los tenemos en los experimentos de Leila Wehbe, una investigadora de Carnegie Mellon, que en 2014 recopiló datos de resonancias cerebrales de gente leyendo historias de Harry Potter, y que tenía como fin comprender mejor los mecanismos del lenguaje. Wehbe asegura que «la abundancia de escenas, diálogos y momentos emotivos hacen que sea muy relevante, en concreto, para el sector del proceso de lenguaje natural«.
Por otro lado, en el repositorio de acceso abierto de investigación científica arXiv hay varios estudios recientes con títulos como «Machine Learning para el desarrollo de pociones en Hogwarts» o «Detección de conjuros en literatura fantástica con una Inteligencia Artificial basada en Transformer».
Además, aunque no sean una pieza principal en la investigación, Harry Potter es también una de las referencias literarias preferidas por los investigadores. Un estudio, por ejemplo, usa los trabajos de Rowling para probar la inteligencia de los sistemas de IA, como los que impulsan ChatGPT. Sin duda, los libros de Harry Potter son muy populares entre los investigadores más jóvenes, porque es muy probable que los hayan leído de niños o adolescentes y los eligen cuanto tienen que utilizar una obra de texto hablada o escrita.
« Especial »