Delegar tu pensamiento a la pantalla genera "pereza metacognitiva": el resultado brilla, pero tu cerebro se atrofia. Revisamos los principales estudios sobre el tema, para saber cómo seguir tus propias reglas y no las del algoritmo.
Hay algo que empezamos a hacer, casi sin darnos cuenta. Antes de saber qué pensamos sobre algo, se lo preguntamos a una interfaz. No tiene nada de malo preguntar. Lo que quiero mirar acá es otra cosa: qué nos pasa cuando esa pregunta empieza a reemplazar al proceso de pensamiento propio, en vez de acompañarlo. Porque la diferencia entre las dos cosas no aparece en el resultado. Aparece adentro nuestro, en una capa que casi nunca percibimos.
Modelos de Lenguaje y Aprendizaje
Hice una selección de algunos estudios que concluyen, en primera instancia, que el uso de Inteligencia Artificial mejora el aprendizaje:
Una revisión de sesenta y nueve estudios experimentales encontró que ChatGPT mejora el rendimiento académico y la propensión al pensamiento de orden superior.
Un meta-análisis posterior, sobre treinta y cinco estudios y más de cuatro mil participantes, midió un efecto positivo moderado.
A nivel del resultado medible, el uso de Modelos de Lenguaje (LLM) como prótesis cognitiva funcionan. Pero el primero de esos dos trabajos, que reporta la mejora, también reporta un detalle que tenemos que poner sobre la mesa: el uso de Modelos de Lenguaje "reduce el esfuerzo mental".
El experimento más limpio para mirar ese contraste creo que es el siguiente: un equipo tomó ciento diecisiete estudiantes universitarios y los repartió en cuatro grupos (asistidos por ChatGPT, por un tutor humano experto, por una lista de cosas a hacer, y, por último, un grupo de control, es decir, un grupo que lo hace sin asistencia alguna). El grupo que usó ChatGPT escribió los “mejores” ensayos. No solo le ganó al grupo controlado: le ganó al grupo que tenía un experto humano asistiéndolo. Pero, y acá lo más importante: "no hubo transferencia de conocimiento ni aumento de la motivación intrínseca". Los autores lo nombran sin vueltas, llaman al fenómeno "pereza metacognitiva": el grupo que usó Modelos de Lenguaje para crear su ensayo obtuvo un mejor texto a ojos de sus revisores, pero sus integrantes terminaron aprendiendo menos sobre el tema.
No tiene nada de malo preguntar. Lo que quiero mirar acá es otra cosa: qué nos pasa cuando esa pregunta empieza a reemplazar al proceso de pensamiento propio, en vez de acompañarlo.
La medición fisiológica apunta en la misma dirección. En un estudio pre-print del MIT Media Lab, cincuenta y cuatro estudiantes escribieron ensayos con la actividad cerebral monitoreada. "El grupo que usó Modelos de Lenguaje mostró la conectividad más débil de los tres, sus textos se parecieron cada vez más entre sí, y la deuda cognitiva persistió cuando se les pidió escribir sin asistencia". A mayor asistencia, peor se aprende. En el plano poblacional, otro trabajo sobre seiscientas sesenta y seis personas encontró una correlación negativa entre el uso frecuente de herramientas de IA y el pensamiento crítico, mediada por la descarga cognitiva.
Ya no quiero aburrirlos más con datos empíricos, y quiero pasar a aburrirlos con mis reflexiones: yo creo que se observa un patrón. La prótesis cognitiva funciona, y por eso es peligrosa: "funciona tan bien en la capa del resultado que tapa la atrofia en la capa del proceso". Y la atrofia es justamente lo que hace que, con el tiempo, seamos inútiles cognitivamente sin la prótesis. Veloz mejora de ciertos estándares, a cambio de dependencia cognitiva para la representación y evolución de los mismos.
También me parece muy importante resaltar que casi toda esta evidencia es sobre población universitaria, "sobre adultos con un desarrollo cognitivo más asentado, pero aún en curso". En primaria y en secundaria las muestras son chicas y los estudios escasos. Estamos impulsando el uso de una prótesis sin saber aún cuál puede ser el impacto en aquellas cogniciones en desarrollo.
La decisión soberana
Juan Ruocco viene ya hablando hace bastante de soberanía cognitiva como la capacidad de mantener activa el propio acto de pensar, filtrar lo que se recibe y resistir la manipulación. Si el aprendizaje se delega entero, no se pierde solo una habilidad. Se pierden grados de soberanía. "Y quien tiene menos soberanía sobre su propio pensar tiene menos margen para imaginar, decidir y representar el mundo de un modo propio o consensuado".
Hace unos meses hice un experimento en una clase de Diseño. Había unos seis grupos, cada uno con cinco integrantes, y teníamos poco tiempo para laburar, así que esencialmente la idea era: dada una idea concreta (“Ayudar a aquellos que no pueden dormir a que puedan conciliar el sueño”), tenían 20 minutos para desarrollar una solución con IA Generativa, y, por otro lado, 20 minutos para pensar sin teléfono ni computadora cómo abordarían el problema. A la hora de la presentación, los alumnos unánimemente estaban felices por las landing pages hermosas, con unas animaciones dignas de un premio, que Claude o Figma les habían armado, y estaban bastante decepcionados con su hoja de ruta de 15 o 20 ideas conectadas en papel.
Lo curioso, para cerrar, es que ninguno era consciente de las decisiones tomadas en el primer caso, y no podían dimensionar la riqueza de haber tomado decisiones experimentales en ese papel que de apariencia era un mal resultado, pero que guardaba algo importantísimo: lo habían decidido y consensuado. Lo que tenían en la mano no era un mal resultado. Era el registro de un montón de decisiones: por qué esto y no aquello, qué descartaron, en qué no se pusieron de acuerdo. El mismo grupo tenía una landing hermosa, y ningún aprendizaje de por qué era así. Habían recibido respuestas, no preguntas.
La hiperrealidad y el exdiseñador
Hay una vuelta de tuerca que quiero dar acá, porque me parece la más incómoda. Baudrillard se la pasó mostrando cómo los signos se despegan de lo real hasta que ya no remiten a nada más que a otros signos: copias sin original, lo que llamó hiperrealidad. Los Modelos de Lenguaje son la versión literal de eso. No copian un original. Generan un promedio de todo lo que digirieron, patrones de patrones, ecos de ecos en una catedral vacía. Algo que parece nuevo y es pura iteración.
El problema para la soberanía cognitiva es más hondo de lo que parece. La idea clásica de soberanía asumía que había un “vos” auténtico detrás de la manipulación, algo para defender. ¿Y si ese “vos” también empieza a parecerse al promedio?
Nos estamos convirtiendo, despacio mas no tanto, en exdiseñadores y exprogramadores. Gente que elige dentro de un menú que armó otro. Y elegir dentro de un menú ajeno no es agencia: es la forma más cómoda de obedecer.
Se empieza a ver en el ámbito productivo cotidianamente: Por ejemplo, el diseñador que aprueba el output del modelo no decide: valida. El que acepta la propuesta de cambio en el código no escribe: cura. Nos estamos convirtiendo, despacio mas no tanto, en exdiseñadores y exprogramadores. Gente que elige dentro de un menú que armó otro. Y elegir dentro de un menú ajeno no es agencia: es la forma más cómoda de obedecer.
La pereza metacognitiva que medían los estudios y la hiperrealidad que describía Baudrillard son la misma cosa vista desde dos lados. En uno, el estudiante entrega un texto que no entiende. En el otro, el diseñador firma un resultado que no decidió. En los dos casos el producto es impecable y el proceso quedó vacío.
Nuevos modos de interacción, y la doma del caballo
Los LLM, como tecnología, abren el abanico de modos de construcción y diseño. El problema no es la herramienta: es el modo por defecto de usarla, que entrega un resultado y absorbe el proceso. La vara mínima tiene que ser otra. Hay conocimiento cuando hay comprensión de la herramienta y de sus usos, no cuando hay un output entregado. Una herramienta que no se entiende no es una herramienta: es un oráculo tácitamente dirigido. Y frente a un oráculo no se aprende: se cree y se obedece, o se abandona.
Esto pasa ya con el hardware. Lo vienen mostrando los cybercirujas, con la idea de "low tech, high life". La operación tiene dos partes. La primera es low tech: descartar lo que no sirve, evaluar el costo real de cada tecnología antes de adoptarla, preferir lo simple cuando lo complejo no aporta. La segunda es permacomputing: construir y reparar lo que sí sirve, estirar la vida del hardware, usar solo lo necesario, tratar el cómputo como la permacultura trata la tierra. No es nostalgia ni ludismo: es estrategia, es intentar decidir, en la medida de lo posible (y deseable).
Hace no mucho comenzó a circular un nuevo modo de pensar la construcción de software con Modelos de Lenguaje: "harness engineering". Por motivos idiomáticos y de estilo literario, lo llamaré Cabezada. Si el cyberciruja decide qué reparar y qué descartar en el hardware, la Cabezada controla qué se permite que entre y qué se doma de la verborragia del Modelo de Lenguaje, un caballo desbocado que pierde fácil los estribos. Todo lo que no sea el modelo es parte de esos límites, de ese control: los prompts, las herramientas que se le dan, la memoria que persiste, los loop de razonamiento, qué porción del mundo entra como contexto y qué no se permite. Todo esto ayuda a quien está escribiendo software a estructurar el modo en que usa un Modelo de Lenguaje para no perder el rol humano ni el aprendizaje en el camino.Aquí vive la decisión humana. El modelo, al menos en la opaca tendencia de los modelos comerciales más populares, sigue siendo una caja negra para el usuario, pero vos decidís qué hacer cuando se abre. La soberanía no es no usar el modelo: es ser el arquitecto del dispositivo en vez del mero consumidor.
Y esto no es solo intuición mía. Hay un lugar donde se puede medir. SWE-bench es un banco de pruebas que evalúa qué tan bien un sistema resuelve problemas reales de software, sacados de repositorios abiertos. Cuando se empezó a mirar en serio qué movía la aguja, apareció un dato incómodo para quienes esperan que todo se resuelva con el próximo modelo: buena parte de la mejora no venía del modelo, venía del andamiaje alrededor del modelo. De la Cabezada. Cambiar la estructura que organizaba el código rendía tanto o más que cambiar el modelo. Conviene tomarlo con pinzas y contrastarlo correctamente antes de hacerlo dogma, pero la dirección es bastante clara: cómo estructurás el uso pesa tanto como la potencia bruta de lo que usás. La agencia no está en el caballo. Está en la Cabezada, y en su jinete.
Las propias herramientas y estructuras
Creo que es importante insistir en que una de las cosas que mejor podemos hacer hoy es buscar alternativas a cómo construimos las herramientas, o, como mínimo, ser conscientes de qué y cómo las estamos usando.
Hace un tiempo empecé a plantear un mini-framework de cuatro pasos para crear prototipos que pueden ir iterando hasta convertirse en soluciones. En pocas palabras, se trata de tomar (1) un Contexto, en el que determinada/s (2) Personas participan, planteando una (3) Hipótesis de solución al problema, y eligiendo una serie de (4) Resultados Esperados contra los cuales contrastar. Tomando estas cuatro partes, lo que podemos obtener es un modo de construir iteraciones de hipótesis de soluciones. Esto puede ser aplicado en menor o mayor medida a casi todas las situaciones. Por supuesto no es el método más exhaustivo ni definitorio, de hecho es bastante abstracto y minimalista, pero permite tener una mejor base sobre la cual pararse a la hora de definir qué estamos haciendo, y tomar decisiones.
No estoy proponiendo dejar de usar Modelos de Lenguaje. Lejos estoy de ser un ludista. Propongo algo más incómodo: tratar cada uso como una decisión y no como un reflejo.
No importa tanto que el framework sea este o que uses otro. Importa que exista uno: que entre vos y el Modelo de Lenguaje haya una estructura que pusiste a propósito, y no el modo por defecto que viene de fábrica. Esa estructura es, ni más ni menos, el lugar donde volvés a ser vos el que decide.
La ventana
No estoy proponiendo dejar de usar Modelos de Lenguaje. Lejos estoy de ser un ludista. Propongo algo más incómodo: tratar cada uso como una decisión y no como un reflejo. Preguntarse, antes de delegar, si eso lo hice alguna vez a mano, si voy a poder reconocer cuándo el resultado es mío y cuándo es el promedio disfrazado de idea propia. Sin esa memoria del oficio no podés validar, y mucho menos crear.
Ruocco cerraba su texto fundacional con las Zonas Temporalmente Autónomas de Hakim Bey: bolsones de libertad por fuera de la mirada del sistema. Me gusta robarle la imagen y torcerla un poco. Las Zonas Temporalmente Autónomas que nos quedan ya casi no son geográficas. Son cognitivas. Son los pocos minutos en que pensás sin asistente, trazás sin autocompletar, escribís sin modelo. Cada vez más breves. Cada vez más valiosas. Esa ventana, mientras podamos seguir manteniéndola abierta, es toda la soberanía que hay.
5.000+ lectores no pueden estar equivocados. Ensayos, guías y análisis que no vas a encontrar en otro lado — más todos los números de la revista digital.