Por Laszlo Beke
El futuro de Inteligencia Artificial (IA) son modelos flexibles y reutilizables entrenados en un conjunto amplio de datos que son utilizables en diferentes tareas con un mínimo de ajustes. Se les denomina fundacionales, por cuanto son la fundación para su aplicación prácticamente a cualquier tarea en un ámbito o sector
. Pertenecen a una nueva clase de máquinas, por cuanto comprenden los símbolos en el idioma, la música y la programación y las utilizan en formas que parecen creativas. Un poco como lo hace un ser humano
La evolución de Inteligencia Artificial
Crear e implementar un nuevo sistema toma un cantidad de tiempo y recursos considerable. Para cada nueva aplicación se requiere una nueva base de datos gigantesca y bien etiquetada para la tarea específica que se desea realizar. Si la base de datos no existe es necesario dedicar cientos o miles de horas para ubicarla y etiquetar las imágenes, textos o gráficos del conjunto de datos. Entonces el modelo de IA debe aprender a reconocer todo en el conjunto de datos y partir de allí se puede aplicar para el caso de uso deseado, bien sea el reconocimiento de lenguaje o la generación de nuevas moléculas para el descubrimiento de una droga.
Con la generación previa de técnicas de IA, si se deseaba construir un modelo de IA que pudiera resumir textos, se requerirían decenas de miles de ejemplos resumidos para un solo caso de uso. Con un modelo fundacional pre-entrenado se pueden reducir los requerimientos de etiquetado de data en forma dramática
. Primero, se puede mini-ajustar el corpus no etiquetado para crear un modelo fundacional específico al dominio deseado. Entonces, utilizando un número mucho menor de data etiquetada (potencialmente solo una muestra de mil ejemplos etiquetados) se puede entrenar el modelo para que realice el resumen. El modelo fundacional específico-para-el-dominio puede ser utilizado para muchas tareas en lugar de las tecnologías previas que requerían la construcción del modelo desde cero para cada caso de uso. Lo que diferencia a estos nuevos sistemas es que pueden ser la fundación para muchas aplicaciones del modelo de IA, teóricamente su valor se puede extender a cualquier dominio
Avanza la Revolución del Conocimiento
Imaginemos una computadora que pueda completar nuestras oraciones, usando un mejor giro de una frase; o que utilice un fragmento de una melodía para componer música que suena como si uno mismo la hubiera compuesto; o resolver un problema con la creación de cientos de líneas de código de computación, librando a la persona para focalizarse en algo más complejo. Desde una perspectiva, esa computadora sería simplemente la descendiente de la tejedora mecánica y las máquinas de vapor que aceleraron la Revolución Industrial. Pero, también pertenece a una nueva clase máquinas, por cuanto comprende los símbolos en el idioma, la música y la programación y las utiliza en formas que parecen creativas. Un poco como lo hace un ser humano
Los “modelos fundacionales” que pueden hacer estas cosas representan un avance determinante en IA. Se trata de una revolución, que en este caso afectará el trabajo cerebral de alto nivel que la Revolución Industrial nunca tocó
Los modelos fundacionales son el giro más reciente en “Aprendizaje Profundo”, una técnica que alcanzó protagonismo hace 10 años y ahora domina el campo de IA. Libremente basado en la estructura en redes de las neuronas del cerebro humano, todos los sistemas son “entrenados” utilizando miles de millones de ejemplos de textos, imágenes o clips de videos. Los modelos fundacionales demuestran que la construcción de “aprendizaje profundo” cada vez más extenso y complejo revela cada más capacidades nuevas e impresionantes. Nadie sabe donde está el límite.Los modelos resultantes son una nueva forma de inteligencia creativa no humana. Los sistemas son lo suficientemente sofisticados para poseer una comprensión del lenguaje y también para romper las reglas. Un perro no puede reírse en una revista, pero una IA puede explicar la razón por la cual es cómico, un hecho que probablemente está más allá de la capacidad de la mayoría de los lectores de la revista. En The Economist se le pidió a uno de esos modelos que creará un collage del título para una edición, este produjo el arte de la cubierta que se uso para las ediciones estadounidense y asiática.
Propiedades de los modelos fundacionales
- Comportamiento “emergente” – Habilidades (tales como el entender un chiste o compaginar una situación y un proverbio) que nacen del tamaño y la profundidad de los modelos, en lugar de ser el resultado de un diseño deliberado. En la misma forma en que una rápida sucesión de fotos da la sensación de movimiento, trillones de decisiones computacionales binarias se funden en un simulacro de compresión y creatividad fluida humana, que aparentan la cosa real. Hasta los creadores de estos sistemas están sorprendidos por su poder.
- Inteligencia amplia y adaptable – Tienen la adaptabilidad que no poseía IA anteriormente, ya que posiblemente en algún nivel existe similitud entre las reglas para manipular símbolos en disciplinas tan diferentes como dibujo, escritura creativa y programación de computadoras. Esta amplitud implica que los modelos fundacionales podrían utilizarse en muchas aplicaciones.
- Productividad – IA puede ser utilizada como un compañero o compinche de software para mejorar la productividad. Está inteligencia de máquina no se asemeja a la humana, pero ofrece algo totalmente diferente. Bien manejado, podrá complementar a la humanidad en lugar de usurparla.
Preocupaciones
- Maldad – La gente teme que IA pueda ser lo suficiente creativa para volverse maligna. La realidad es que los modelos fundacionales están a años luz de los robots asesinos de Hollywood. Los Terminators tienden a ser focalizados, obsesivos y ciegos a las consecuencias más profundas de sus acciones. Como contraste, IA Fundacional es difusa.
- Control – Una preocupación mayor es sobre quién controla los modelos fundacionales. Entrenar un sistema grande como el paLM de Geoogle (Pathway Languague Model) cuesta US$10 millones cada ejecución y requiere enorme cantidad de data – mientras haya más poder de computación hay más data. Esto trae a colación el espectro de la tecnología concentrada en un pequeño número de empresas tecnológicas o estados e incluso se podría aplicarse a cambiar las mentes en las batallas ideológicas del mundo.
- Acceso – Por ahora, los modelos más grandes están restringidos para prevenir que sean utilizados con propósitos nefastos como la generación de noticias falsas. El emprendimiento Openai ha diseñado un modelo con la intención de impedir que se produzcan imágenes violentas o pornográficas. La empresas tienen el derecho de temer el abuso, pero mientras más poderosos los modelos, más se limita el acceso a los modelos a una nueva élite. Auto-regulación sola difícilmente resolverá este dilema
Se hace referencia a How smarter AI will change creativity y What are foundation models?. También aparece en mi Portal https://bit.ly/39s7ERo. La imagen es cortesía de pixabay.