Franco Moretti fundador del Stanford Literary Lab. Foto: Stanford.edu

Algoritmos para leer a Shakespeare

Para entender la literatura no hace falta leer con detenimiento. Todo lo contrario. Es mejor valerse de nuevas tecnologías para analizar grandes corpus literarios. Es lo que propone Franco Moretti, fundador del Laboratorio Digital de Stanford y uno de los más reconocidos expertos en análisis literario digital.

2014/09/04

Por Ricardo Castro

Franco Moretti, fundador del Laboratorio Digital de la Universidad de Stanford, es uno de los mayores expertos en Humanidades Digitales, especialmente en el uso de herramientas digitales para el análisis literario. En conversación con Arcadia, Moretti asegura que es un campo con el potencial de una "revolución intelectual" pero que se enfrenta a la reticencia de sectores tradicionales que se sienten amenazados.

Moretti defiende una aproximación de 'lectura a distancia' para el estudio literario: no a partir del estudio detallado de textos, sino agregando y analizando cantidades enormes de datos.

Su área principal de estudio se centra en la literatura ¿Cómo puede el estudio de la literatura usar algoritmos para analizar grandes cantidades de datos?

-    Es un campo de estudio que hasta ahora estamos empezando con obras canónicas sobre cómo evoluciona la literatura y cómo las grande obras, las obras maestras, contribuyen y forjan esa evolución. Un colega de Stanford por ejemplo, ha conseguido calcular que cuando textos canónicos se escriben y publican, el campo literario se vuelve más ordenado. La función del canon podría ser la de ordenar el campo literario. No son importantes porque son grandes libros, son importantes porque son libros que hacen que la literatura sean más comprensible. Sé que es muy abstracto, pero verás, esto es precisamente lo que hacen los algoritmos. Son herramientas muy abstractas para investigar la realidad. Estos resultados acaban de aparecer y todavía no los hemos publicado. Apenas hemos empezado a discutirlos entre nosotros. Estamos muy emocionados porque parece ser el tipo de hallazgo que estas nuevas herramientas de investigación permiten.

¿Cuáles son esos resultados?

-    Al parecer, cuando se escriben textos canónicos, el campo gana orden. Los textos literarios parecen seguir otros textos, parecen comportarse según unas reglas. Así que el azar del campo se reduce. Pero esto puede ser muy abstracto o especulativo para un artículo de difusión.

Usted acuñó el término ‘Distant reading’, ¿cómo llegó a ese término y qué significa?

Al comienza era una forma de burlarme de la ‘lectura atenta’. En sus inicios quería referirme a lo opuesto de lo que se hace todos los días en las universidades norteamericanas. Se lo tomaron muy en serio, así que terminé tomándomelo en serio también. Quiere decir que en lugar de enfocarse en un solo texto, tratas de enfocarte en un compendio grande de textos. Y en lugar de mirar un detalle, tratas de observar un patrón general. Es como si estás en un museo, si te alejas de una obra, pierdes mucho, por supuesto, pero obtienes un sentido más profundo de las formas elementales en la pintura. Eso es lo que me gustaría hacer, obtener un sentido de las fuerzas básicas que operan en la historia literaria y cultural.

Hay muchas críticas sobre tratar la literatura como un conjunto de datos. De entrada parece problemático reducir literatura a datos…

Pasar textos literarios a un conjunto de datos implica una actividad reduccionista. Y la mayoría de mis colegas están en contra del reduccionismo. A ellos no les gustan las cosas simples. A mí me gustan las cosas sencillas porque te obligan a ser claro. Creo que de cosas simples puedes volver a cosas complejas, pero las entiendes mejor porque conoces sus componentes y sabes cómo se estructuran. Si nunca pasas de lo complejo a lo simple, básicamente sigues reformulando, y volviendo a describir tu objeto de estudio, sin que lo entiendas.

Reducir la literatura a datos simples es un paso hacia su mejor entendimiento. Acá está el gran problema: la mayoría de la gente que estudia y escribe sobre literatura no quiere  entender y explicar la literatura. Ese no es su interés principal. Su interés principal es usar la literatura como un discurso normativo, como un ejemplo de cómo deberías pensar, sentir, escribir… A mí no me interesa el discurso normativo. A mí me interesa poder explicar.

En cada crítico literario hay un poco de monje, que toma un texto y le dice a la gente qué tan bueno es, y un poco de plomero, que trata de entender cómo funciona la cocina. Muchos de mis colegas son 90% monje y 10% plomero. Yo tiendo a ser lo contrario: 90% carpintero y 10% monje.

Esta forma de aproximarse a la las obras supone una transformación en la forma y la dimensión de acceso al conocimiento…

-     Es correcto. He estado trabajando en universidades desde 1968, durante casi medio siglo… Y nunca he sentido una atmósfera tan igualitaria, tan democrática, como la que tenemos en nuestro laboratorio literario en Stanford. Los datos pueden llegar a ser muy objetivos. Están ahí puestos sobre la mesa delante de todo el que quiera verlos, y un estudiante de 20 años puede explicarlos mejor que yo o que otros profesores. Y es inmediatamente evidente si eso ocurre. Así que es un proceso muy democrático. Además es un trabajo colaborativo, es un trabajo en que uno entiende una cosa, la persona a tu lado entiende otra cosa, y un tercero puede entender otra cosa, así que hay una sensación profunda de que el grupo en verdad es más que la suma de sus componentes.

También hay una transformación radical en el acceso a las obras literarias…

Podría haber esa revolución, pero hay una guerra en curso sobre la propiedad intelectual. Sólo trabajamos con obras de los siglos XVIII y XIX, porque las obras del siglo XX todavía mantienen una protección muy fuerte en términos de derechos de autor. Hay derechos que pertenecen a editoriales y hay bibliotecas que temen meterse en problemas legales, y hay ejércitos de abogados que te dicen constantemente lo que puedes o no puedes hacer. Así que potencialmente sí existe la posibilidad para esa revolución de acceso. De hecho hay muchísimo contenido que es accesible, pero la lógica que lo hace accesible es muy opaca. Es un terreno bastante gris y es un problema que está muy lejos de resolverse.

Pero el solo hecho de que se pueda acceder a ese canon, desde cualquier lugar y en cualquier momento, es algo que no tiene precedentes…

Sin duda.

¿Que posibilidades se vislumbra a futuro en este campo?

Las posibilidades son inmensas. Podremos estudiar un corpus literario que es más de 100 veces mayor al que usualmente estudiamos, y hacerlo con una aproximación completamente distinta. Se trata de una revolución intelectual, pero no estoy seguro de que pueda ver las fuerzas necesarias –en la academia, en las universidades, en el mundo-, para que suceda.

Verás, cuando el telescopio se construyó, esa nueva herramienta pudo ser usada por Galileo y otros para terminar de una vez por todas con las controversias sobre los sistemas Ptolemaico y copernicano, que habían durado cien años. En otras palabras, existía un acervo teórico muy fuerte que podía usar esa nueva herramienta inmediatamente para probar sus hipótesis e ideas más importantes. Ahora las cosas han sido distintas, porque a los académicos literarios, historiadores, artistas, o filósofos, nos han dado el telescopio pero no teníamos un sistema copernicano que lo necesitara. Creo que es una buena forma de describir el problema al que nos enfrentamos. Habiendo dicho eso, no se puede quitar valor a la herramienta que es fantástica. Es solo que no está produciendo, todavía, los resultados que uno podría haber esperado y deseado.

¿Siente que hay temor y/o preocupación en sectores de la academia hacía el desarrollo de este campo?

Sí. Sin duda. Están enojados, sienten miedo, hacen todo tipo de cosas para intentar bloquear su crecimiento, caricaturizan lo que estamos haciendo… oh sí, oh sí… Pero no solo es en la Academia. Ahora mismo estoy en Roma y en la última semana he leído dos artículos en dos diarios muy importantes sobre Humanidades Digitales. El primero, era de alguien que copió de blogs norteamericanos, que conozco, y que me criticaba a mí y lo que hago, sin citar una sola palabra de lo que he escrito. Un periodista diciendo que esto está mal, que es una tontería, que está destruyendo el encanto de la literatura… y luego un segundo artículo, que era incluso peor: citaba a ese primer artículo y nuevamente me atacaba sin tomarse la molestia de leer lo que hago. Así que no es solo la academia, en los medios de comunicación también hay recelo y hay gente que ataca lo que hacemos. Aunque no me alegra recibir ataques, cuando veo que soy blanco también digo ‘bueno, estoy haciendo algo, estoy incomodando algo, estoy alterando la paz’. Y eso siempre es una buena señal.

Supongo en realidad se sienten amenazados…

Yo creo eso también.

¿Hay razones para que ellos se sientan amenazados?

Creo que sí hay razones para que se sientan amenazados. Porque si estas aproximaciones ganan fuerza y consiguen buenos resultados, entonces el estudio de la literatura cambiará y será algo distinto a lo que muchas personas que estudian literatura, o que escriben sobre literatura, creen que debería ser. Y cuando la gente ve su moda de hacer las cosas bajo amenaza, reacciona. Es natural y comprensible. Todos se quejan y critican mi idea de lectura distante, y dicen ‘¿qué es la literatura sin lectura atenta?’, pero ni siquiera leen lo que he escrito. Pero está bien.

Hay muchos críticos que defienden la aproximación tradicional a la literatura y dicen que reducir la literatura a un conjunto de datos es arbitrario, equivocado, y que los resultados de algoritmos a la hora de interpretar son confusos cuando no absurdos..

Los algoritmos pueden ser usados por personas que son muy hábiles en computación y lenguajes informáticos, pero que son muy débiles en conocimiento literario. En ese caso, es difícil producir buenos resultados o conocimiento válido. Debe haber un trabajo conjunto. El trabajo de las humanidades digitales, al menos en literatura, pasa por una combinación de habilidades. El que sabe de computación junto a un crítico literario, preferiblemente uno con buen conocimiento formalista, de estilo, de lingüística… en ese caso creo que los resultados pueden ser muy poderosos. Es cierto que muchas personas que trabajan en las humanidades digitales no son muy buenas para el análisis literario. Y en ese caso, no importa cuán poderosos sean los algoritmos, el resultado no será interesante. Eso es un hecho incontestable. En Stanford siempre hemos tratado de combinar la parte computacional con la preocupación por el conocimiento literario y su significado.

Por lo que cuenta, aún hay un papel importante para el crítico literario…

Así es. Porque los datos tiene que estar relacionados a categorías significativas para el análisis literario. Por ejemplo, ahora mismo estamos investigando el uso de la voz pasiva en novelas góticas e históricas, es fascinante y se trata de datos, y un computador puede decirte rápidamente un porcentaje de verbos en la voz pasiva en tal o cual texto, pero al mismo tiempo no puede decirte qué significa la voz pasiva. Para eso tienes que estudiar teoría lingüística… Es una combinación entre datos, gramática, antropología, historia…

Usted conoce los críticos y los argumentos en contra de las Humanidades Digitales. ¿Reconoce algún punto válido en sus críticas?

Honestamente todavía no he encontrado una crítica inteligente. Me encantaría tener ese debate; tener una discusión seria y académica sobre el tema. Me encantaría ser parte de ese debate intelectual. Hasta el momento no lo he podido tener. Y no digo que las HD estén por encima de las críticas, o que todo sea perfecto. Para nada. Pero hasta el momento no se ha dado esa discusión. Hay mucha rabia y hay mucho miedo, pero no ha habido una discusión intelectual todavía.

Este contenido hace parte de la edición impresa. Para leerlo, debe iniciar sesión:

Les informamos a todos nuestros lectores que el contenido de nuestra revista impresa en nuestro sitio web será exclusivo para suscriptores.

Queremos conocerlo un poco,
cuéntenos acerca de usted:

Maria,

Gracias por registrarse en ARCADIA Para finalizar el proceso, por favor valide su correo a través del enlace que enviamos a:

correo@123.com

Maria,

su cuenta aun no ha sido activada para poder leer el contenido de la edición impresa. Por favor valide su correo a través del enlace que enviamos a:

correo@123.com

Para verificar su suscripción por favor ingrese la siguiente información:

No tiene suscripción. ¡Adquierala ya!

Si usted tiene algún inconveniente por favor comuniquese con nosotros en Bogotá al 7421340 o a la línea nacional gratuita 018000-911100 (Lunes a Viernes de 7:00 am a 8:00 pm, Sábados de 09:00 am a 12:00 m).

Su código de suscripción no se encuentra activo para esta publicación