Un estudiante de informática logró un resultado sorprendente al entrenar una IA con textos del Londres de 1800 a 1875. El objetivo era generar texto con el estilo de la época victoriana, pero el resultado superó las expectativas.

Un experimento con resultados inesperados

Hayk Grigorian, estudiante del Muhlenberg College, entrenó tres modelos de IA (dos con nanoGPT y uno con Phi 1.5) con aproximadamente 7000 textos de la era victoriana. Utilizó un tokenizador personalizado para eliminar el vocabulario moderno y asegurar la autenticidad del lenguaje generado.

Al probar la IA con el prompt "Era el año de nuestro señor 1834", la respuesta incluyó detalles precisos sobre protestas en Londres ese año, una referencia bíblica y la mención de Lord Palmerston.

Más allá de la imitación

La investigación de Grigorian reveló que las protestas mencionadas por la IA ocurrieron realmente en 1834, en respuesta a las acciones de Lord Palmerston como Secretario de Exteriores, relacionadas con la Ley de Pobreza. La IA no solo imitaba el estilo de escritura victoriano, sino que recordaba eventos históricos específicos.

Grigorian destaca la capacidad de la IA para recordar eventos históricos reales con una cantidad relativamente pequeña de datos (5-6 GB), anticipando resultados aún más impresionantes con mayor volumen de información. Este tipo de proyectos, conocidos como HLLM (Historical Large Language Models), abren nuevas posibilidades para la investigación histórica y el análisis de datos históricos.

Ejemplos de HLLM

Otros ejemplos de HLLM incluyen MonadGPT (textos de 1400 a 1700) y XunziALLM (generación de poesía clásica china). Estos modelos demuestran el potencial de la IA para procesar y generar información histórica con precisión y estilo auténticos.

Este experimento resalta la capacidad de las IA para ir más allá de la simple imitación, demostrando su potencial para la investigación y el descubrimiento de información histórica.

Fuente: 3DJuegos