La publicación del blog de Thomas Wolf “El maniquí Einstein AI” es una lectura obligatoria. Contrasta su pensamiento sobre lo que necesitamos de la IA con otra lectura obligatoria, Dario Amodei “Máquinas de desenvoltura amorosa”. El argumento de Wolf es que nuestros modelos de idiomas más avanzados no están creando nada nuevo; Solo están combinando ideas antiguas, frases viejas, palabras antiguas según modelos probabilísticos. Ese proceso no es capaz de hacer nuevos descubrimientos significativos; Wolf enumera el sistema solar heliocéntrico de Copérnico, la relatividad de Einstein y el CRISPR de Doudna como ejemplos de descubrimientos que van mucho más allá de la recombinación. Sin duda, se podrían incluir muchos otros descubrimientos: Kepler’s, Newton’s y todo lo que condujo a la mecánica cuántica, comenzando con la alternativa al problema del cuerpo adverso.
El corazón del argumento del lobo refleja la visión del progreso que Thomas Kuhn observa en La estructura de las revoluciones científicas. Wolf está describiendo lo que sucede cuando el proceso verificado se libera de la “ciencia natural” (término de Kuhn) a valía de un nuevo modelo que es impensable para los científicos inmersos en lo que fue ayer. ¿Cómo podrían la relatividad y la teoría cuántica comenzar a tener sentido para los científicos basados en la mecánica newtoniana, un ámbito intelectual que podría explicar casi todo lo que sabíamos sobre el mundo físico, excepto el problema del cuerpo adverso y la precesión del mercurio?
Estudiar más rápido. Cavar más profundo. Ver más allá.
El argumento de Wolf es similar al argumento sobre el potencial de creatividad de la IA en la música y otras artes. Los grandes compositores no solo recombinan lo que ocurrió ayer; Están volcando tradiciones, haciendo algo nuevo que incorpora piezas de lo que ocurrió ayer de una forma que nunca podría haberse predicho. Lo mismo es cierto para los poetas, novelistas y pintores: es necesario romper con el pasado, escribir algo que no podría haber sido escrito ayer, para “hacerlo nuevo”.
Al mismo tiempo, mucha buena ciencia es la “ciencia natural” de Kuhn. Una vez que tenga la relatividad, debe descubrir las implicaciones. Tienes que hacer los experimentos. Y debe encontrar dónde puede tomar los resultados de los documentos A y B, mezclarlos y obtener el resultado C que sea útil y, a su forma, importante. La etapa de la creatividad que resultó en la mecánica cuántica (Bohr, Planck, Schrödinger, Dirac, Heisenberg, Feynman y otros) no fue solo una docena de físicos que hicieron un trabajo revolucionario. Se requirió miles que vinieron después para atar los cabos sueltos, encajar las piezas faltantes y validar (y extender) las teorías. ¿Nos importaría Einstein si no tuviéramos las medidas de Eddington durante el eclipse solar de 1919? ¿O la relatividad habría quedado en el olvido, tal vez para ser reconcebida una docena o cien años después?
Lo mismo es cierto para las artes: puede haber solo un Beethoven o Mozart o Monk, pero hay miles de músicos que crearon música que la gente escuchó y disfrutó, y que desde entonces han sido olvidadas porque no hicieron algo revolucionario. Escuchar música verdaderamente revolucionaria 24-7 sería insoportable. En algún momento, quieres algo seguro; algo que no sea desafiante.
Necesitamos una IA que pueda hacer tanto “ciencia natural” como la ciencia que crea nuevos paradigmas. Ya tenemos el primero, o al menos, estamos cerca. Pero, ¿cómo se vería ese otro tipo de IA? Ahí es donde se vuelve desafiante, no solo porque no sabemos cómo construirla, sino porque esa IA podría requerir su propio nuevo modelo. Se comportaría de forma diferente a cualquier cosa que tengamos ahora.
Aunque he sido escéptico, estoy empezando a creer que, tal vez, la IA pueda pensar de esa manera. He argumentado que una característica, tal vez la característica más importante, de la inteligencia humana que nuestra IA actual no puede igualar es, precisamente, la capacidad de querer hacer algo. Alphago puede jugar al Go, pero no puede desear jugar al ir. La voluntad es una característica del pensamiento revolucionario: tienes que querer ir más allá de lo que ya se sabe, más allá de la simple recombinación, y seguir un tren de pensamiento a sus consecuencias más resonantes.
Es posible que ya estemos obteniendo algunos vislumbres de esa nueva IA. Ya hemos conocido algunos ejemplos extraños de mal comportamiento de IA que van más allá de la inyección inmediata o hablando de un chatbot para ser travieso. Estudios recientes discuten el intrigante y preocupante fenómeno de falsificación en el que los LLM producen resultados dañinos, posiblemente debido a los conflictos sutiles entre diferentes indicaciones del sistema. Otro estudio mostró que los modelos de razonamiento como OpenAI O1-Preview engañan en el ajedrez para ganar; Los modelos más antiguos como GPT-4O no lo hacen. ¿Es el error simplemente un error en el razonamiento de la IA o algo nuevo? Algunos asociaron la voluntad con el comportamiento transgresivo; ¿Podría ser esto una señal de una IA que puede querer algo?
Si estoy en lo correcto, tendremos que ser conscientes de los riesgos. En su mayor parte, mi pensamiento sobre el riesgo se ha alineado con Andrew Ng, quien una vez dijo que preocuparse por los robots asesinos era similar a preocuparse por la sobrepoblación en Marte. (Desde entonces, Ng se ha vuelto más preocupado). Hay riesgos reales y concretos en los que debemos pensar ahora, no riesgos hipotéticos extraídos de la ciencia ficción. Pero una IA que puede crear nuevos paradigmas trae sus propios riesgos, especialmente si ese riesgo surge de un tipo diferente de intención.
Eso no significa alejarse de los riesgos y rechazar cualquier cosa percibida como arriesgada. Pero también significa comprender y controlar lo que estamos construyendo. Todavía estoy menos preocupado por una IA que puede decirle a un humano cómo crear un virus que por el humano que decide crear ese virus en un laboratorio. (La Madre Naturaleza tiene varios miles de millones de años de experiencia en la creación de virus letales. Para toda la controversia en torno a Covid, con mucho la mejor evidencia es que es de origen natural.) Necesitamos preguntarnos qué podría hacer una IA que hace trampa en el ajedrez si se le pide que aumente las ventas de tanques de Tesla.
Wolf tiene razón. Si bien la IA que es meramente recombinativa será una ayuda para la ciencia, si queremos una ciencia innovadora, necesitamos ir más allá de la recombinación a modelos que puedan crear nuevos paradigmas, junto con cualquier otra cosa que pueda implicar. Como escribió Shakespeare: “Oh, dulce nuevo mundo que tiene a tales personas en él”. Ese es el mundo que estamos construyendo y el mundo en el que vivimos.
Notas al pie
VentureBeat publicó un excelente resumen con conclusiones que pueden no ser tan diferentes de las mías.
Si te preguntas cómo podría perder una IA que juega ajedrez, recuerda que Stockfish y otros modelos específicos de ajedrez son mucho más fuertes que los mejores modelos de lenguaje grandes.