Hoy la IA detecta conexiones invisibles para el cerebro, revolucionando el método científico. A medida que delegamos el reconocimiento de patrones en el software, el "por qué" importa menos que el resultado. ¿Será el fin de la teoría o nacerá una nueva forma de verdad híbrida?
¿Qué es la información? Una diferencia. Algo que no es igual a otra cosa que está antes, o después, arriba o abajo, o incluso superpuesta en tiempo y espacio. La letra “a” es una unidad informativa que se distingue de las otras letras, pero también de los números, también de los grafos sin sentido o del espacio en blanco. Pero para que haya diferencia tiene que haber alguien, o algo, capaz de captarla. Puede ser un animal, pero también un hongo, una planta, un termómetro, una calculadora o un microprocesador.
Claude Shannon fue uno de los pioneros en la teorización de la información, y es famoso entre otras cosas por haberla explicado en términos matemáticos. La IA de Anthropic, Claude, se llama así en su nombre. Las unidades diferenciales que constituyen la información están sujetas a leyes cuantificables. Cuanto más inesperada es la diferencia para el dispositivo (animal, vegetal, técnico: no importa) que la procesa, más carga informativa tiene. Si el lector de este texto (sea un humano o un agente de IA) lee A, B, C, D, y luego “E”, la carga informativa de esa letra es mínima. Si en cambio viniera “P”, la carga sería mayor. Los engranajes se tienen que empezar a mover cuando aparece lo que no es absolutamente predecible. Lo vemos en la vida cotidiana cuando a la pregunta de “¿cómo estás?” alguien responde algo que no sea “bien”.
Nuestro cerebro es excelente en reconocer patrones. Es decir, en hacer que esas diferencias mínimas y en principio caóticas se agrupen de forma coherente.
No es esta la única forma de concebir la información. En su libro Nexus, el divulgador Yuval Harari propone algo distinto aunque no necesariamente contradictorio. La información se define por su capacidad de producir agrupamientos, justamente, “nexos”, conexiones entre entidades diferentes. Para Harari, la información no es necesariamente un “espejo” de la realidad, sino un mecanismo de orden. Una lista de impuestos o un mito religioso funcionan como información no porque describan una verdad exterior, sino porque logran que miles de personas se coordinen bajo una misma estructura. Esta perspectiva desplaza el eje del contenido hacia la función: la información es lo que permite crear redes complejas. Sin embargo, esto nos arroja de lleno al problema de la verdad que exploraremos a continuación, ya que si la función primordial de la información es conectar y organizar, ¿qué importancia tiene que los datos que sostienen ese nexo sean realmente ciertos?
El pasaje de lo que llamamos información a lo que llamamos “conocimiento” es de una complejidad enorme. Sobre este problema se construyó gran parte de la lógica, la epistemología, la gnoseología. ¿Qué tan fiables son los sentidos humanos como procesadores de información del mundo externo? E incluso si lo fueran, ¿cuántas observaciones de un fenómeno permiten obtener de él algún tipo de consecuencia? David Hume, príncipe de los empiristas, propuso famosamente que la causalidad, al ser imperceptible no es más que una construcción imposible de comprobar. Yo veo la bola blanca del billar golpear a una bola roja; la bola roja se mueve, pero, ¿puedo acaso asegurar que es “consecuencia” del golpe de la bola blanca? Kant retomó esa idea y planteó la famosa división entre lo que construimos del mundo en tanto sujetos trascendentales y aquella cosa en sí que no podemos jamás aprehender en su esencia. La película Matrix, tan empleada en clases de filosofía desde su estreno, sirvió para ilustrar la famosa tesis de que todo lo que nos rodea podría ser consecuencia de algún tipo de genio maligno. No hay nada verdadero ahí afuera si todo es una simulación.
El problema menos metafísico de cómo el cerebro humano procesa información, cómo convierte los inputs que recibe en los outputs que produce (sean estos acciones, ideas, enunciados o lo que fuere) es un tema clave para la neurología y sus distintas ramas. Pero, a los fines de este artículo, podemos apelar a lo más general: nuestro cerebro es excelente en reconocer patrones. Es decir, en hacer que esas diferencias mínimas y en principio caóticas se agrupen de forma coherente. El cazador, sea primitivo o contemporáneo, puede detectar huellas en medio de un bosque sin que todos los otros estímulos que involucra ese bosque le impidan reconocer el rastro. “Investigar”, etimológicamente, es esto: in vestigium, seguir el “vestigio” o la huella.
Por supuesto, los animales tienen esta capacidad de reconocer patrones también, y a menudo están biológicamente híperadaptados a eso como consecuencia de la selección natural. Pero hay una diferencia de objetivos porque, hasta donde sabemos, el ser humano es el único animal al que le interesa ver patrones en las estrellas.
Un poco de ayuda
Generalizando y sin entrar en los largos debates respecto del “método científico” que atravesaron los siglos XIX y XX, el conocimiento humano, la obtención de información que pueda aceptarse como “verdadera” y sobre la que se pudiera actuar consecuente y eficazmente, siempre se basó en esta capacidad humana para encontrar patrones. No pensemos solo en Linneo, en Darwin o Newton. Los filólogos y críticos literarios como yo también lo hacemos. Vemos, por ejemplo, que en un corpus de textos de un período, o de un autor, se repite algo que no se repite en otros autores o en otro períodos, y sobre eso construimos hipótesis. Decimos, por ejemplo, que el Renacimiento italiano vio un renacer del epicureísmo, porque podemos reconocer un patrón de enunciados recurrentes sobre Epicuro en el corpus que leemos, y a esa repetición le atribuimos un sentido, o sea, algún tipo de casualidad: se recuperó el epicureísmo en el Renacimiento italiano como consecuencia de la revalorización de la vida terrenal, por ejemplo. Así se escriben artículos, tesis, conferencias.
El conocimiento humano, la obtención de información que pueda aceptarse como “verdadera” y sobre la que se pueda actuar consecuente y eficazmente, siempre se basó en esta capacidad humana para encontrar patrones.
El ser humano ha sido prolífico en invenciones que ayudan a que este proceso de reconocimiento de patrones sea más fácil. Uno de los primeros es la escritura. Escribir nos permite visibilizar y sistematizar información de una forma fácilmente recuperable, que no depende de la memoria individual ni colectiva y que dura mucho más que una vida, incluso, a veces, más que la vida de una civilización. Escribir también permitió hacer cálculos más complejos incluso antes de que se inventaran las máquinas de calcular, como el ábaco y eventualmente las calculadoras mecánicas y eléctricas.
Podría decirse entonces que las computadoras pre-machine learning eran la forma más sofisticada de esto. Herramientas como las planillas de cálculo de Excel (por citar una conocida) permitían que personas pudieran disponer de cantidades enormes de información para detectar patrones con una facilidad impensada poco antes. Las bases de datos de textos en .html o en .pdf con OCR permitieron que muchos de nosotros usáramos simples comandos como Ctrl + F (buscar) para encontrar palabras como “Epicuro” en textos de miles de páginas en pocos minutos. Luego eso que encontrábamos podíamos volcarlo en software de gestión de bibliografía como Zotero y armar constelaciones que hubieran llevado meses de haber dependido de la lectura tradicional y de la toma de notas manuscrita (o con máquina de escribir). Ni hablar del tiempo que se ahorra en cálculos matemáticos relativamente complejos. ¿Se pierde algo con este tipo de prácticas? Sin duda, pero pareciera que aquello que se pierde (el hábito de hacer cuentas en el aire o la memoria enciclopédica, por ejemplo) no es tan trágico ni tan esencial.
Uno podía imaginar que así iba a continuar la historia de la humanidad: máquinas cada vez más eficientes para administrar la información y disponerla frente al cerebro humano, el único verdaderamente capaz de encontrar patrones, de diseñar modelos causales que la expliquen. Pero, hace unos pocos años, sucedió algo: el aprendizaje automático, o machine learning.
A diferencia de la computación tradicional, donde un programador dicta reglas explícitas ("si pasa A, haz B"), el machine learning es una rama de la inteligencia artificial que permite a los sistemas aprender y mejorar a través de la experiencia y los datos. Su historia se remonta a los años cincuenta, pero no fue hasta la explosión del Big Data y el aumento de la capacidad de procesamiento que dio un salto cualitativo. En lugar de ejecutar instrucciones, estos modelos procesan volúmenes masivos de información para identificar patrones estadísticos por sí mismos. Esto marca una ruptura fundamental: la máquina ya no es solo una calculadora rápida, sino un arquitecto de correlaciones que puede detectar vínculos que el cerebro humano es incapaz de percibir, conectando así el procesamiento de datos puro con una nueva forma de “intuición” artificial.
Un ejemplo típico de esto son los préstamos bancarios. Hasta hace poco el banquero tenía una serie de información detallada, cargada en una base de datos de muchas capas y en base a eso analizaba, según su juicio y experiencia, la conveniencia o no de otorgar un préstamo. Quizás varios de estos procesos eran automatizables en su programa de base de datos, en donde a pedido suyo o de su equipo un programador había configurado una condición básica: si el solicitante no tiene un sueldo en blanco al menos equivalente a 500 USD, no otorgar ningún tipo préstamo personal. Entonces el banquero veía este aviso en su pantalla y la decisión era fácil. Pero la decisión era suya y estaba basada en información apenas pre-procesada por algunas operaciones computacionales muy básicas, fáciles de explicar, de reproducir o incluso de anular. Incluso si hubiera 100 reglas así en la base de datos, o 1000, no serían más que atajos que no cambian en esencia lo que está sucediendo.
Ahora, ¿qué pasa si la decisión de dar un préstamo no surge de la capacidad de detectar patrones y reproducirlos en reglas claras, sino de la capacidad de aprendizaje automático realizado sobre un conjunto de datos enorme y a primera vista caótico? Incluso si la decisión final de otorgar o no el préstamo sigue siendo humana, el proceso por el que se investigó y descubrió (o produjo) la “información verdadera” que indica que Fulano es elegible para un préstamo de tal o cual monto, ya no es consecuencia directa de la capacidad humana de alcanzar esa conclusión. Es muy probable además que hayan incidido datos en los que un humano jamás se hubiera fijado incluso tras siglos de cultura bancaria acumulados.
La máquina ya no es solo una calculadora rápida, sino un arquitecto de correlaciones que puede detectar vínculos que el cerebro humano es incapaz de percibir, conectando así el procesamiento de datos puro con una nueva forma de “intuición” artificial.
Las consecuencias de esto son potencialmente enormes. Bastante antes de la popularización de los LLM, Chris Anderson teorizó sobre este tema en su polémico artículo de 2008 para Wired, titulado The End of Theory (El fin de la teoría). Anderson argumentaba que, ante volúmenes masivos de datos, el método científico tradicional (basado en hipótesis, modelos y causalidad) se volvía obsoleto. Según él, "con suficientes datos, los números hablan por sí mismos" y las correlaciones reemplazan a las explicaciones causales. El a menudo vilipendiado (y no sin razón) filósofo francés Eric Sadin habla bastante del tema en su La inteligencia artificial o el desafío del siglo, que también fue escrito antes de que ChatGPT irrumpiera en nuestras vidas. Allí se pregunta justamente por la aparición de un nuevo régimen de verdad, de “desocultamiento” (aletheia, la palabra griega que recuperaba Heidegger).
¿Podría pasar, entonces, que ya no tengamos que hipotetizar relaciones causales? Si una IA recibe todos los textos literarios argentinos del siglo XX, ¿podrá llegar a conclusiones propias basadas en el aprendizaje automático que dejen obsoletas e inútiles los pequeños e incompletos patrones que han encontrado personas como Ricardo Piglia o Beatriz Sarlo? ¿Toda la investigación humana, toda la producción de enunciados verdaderos a partir de la información surgirá entonces de máquinas, que además, como anticipa Sadin, ejecutarán decisiones sobre ellas en las que nuestro rol quedará reducido a la nada?
Personalmente, no iría tan lejos. Pero el hecho de que ya hoy, 2026, están conviviendo diferentes formas de producir conocimiento, una de las cuales es incomparable con nada que haya producido la humanidad hasta ahora, es bastante estimulante. ¿Esta división acentuará la diferencia entre ciencias duras y ciencias humanas y sociales, o al contrario, tenderá a aproximarlas? Podría uno imaginar que el aprendizaje automático cambiará más radicalmente la biología y la física que los estudios literarios, artísticos, históricos o sociales, ya que en estos últimos los criterios de verdad a menudo están asociados con factores de otro tipo. Como dice Harari, lo que hace que la información funcione como tal es su capacidad de cohesionar, y en ese sentido, el tipo de conocimiento que produzca la IA podría sencillamente ser menos cohesivo, menos convocante que el que producimos nosotros analizando patrones y construyendo modelos causales.
Quizás esta división entre formas de investigación termine produciendo otra tercera forma que esté, en algún punto, sobre ellas y las incluya, siguiendo el famoso movimiento dialéctico. O quizás desarrollemos una sensibilidad, un gusto, por saberes más especulativos, menos susceptibles a ser extraíbles de cualquier tipo de dato maquínicamente procesable.
Humanista. Profesor de literatura e investigador en CONICET. Editor de la revista de teoría literaria Luthor (revistaluthor.com.ar). Hago videoensayos y streamings caseros en el canal de YouTube "Hotel Abismo".
5.000+ lectores no pueden estar equivocados. Ensayos, guías y análisis que no vas a encontrar en otro lado — más todos los números de la revista digital.