Cervantes usaba el triple de palabras que tú: el primer léxico completo del 'Quijote' revela su gran riqueza lingüística
- Investigadores de España y Japón han organizado las 400.000 palabras de la obra cumbre del español en un trabajo pionero
- Para sus autores, Cervantes "era un gran 'oídor" y reflejaba con maestría la manera de hablar del pueblo
En los cuatro siglos de historia que han transcurrido desde la publicación de Don Quijote de La Mancha no se había acometido la magna tarea de recopilar y ordenar las 400.000 palabras que componen la obra cumbre de las letras españolas, recoger con cuánta frecuencia se pronuncian y qué personaje lo hace. Hasta hoy.
Coincidiendo con el Día del Libro y el aniversario de la muerte de Miguel de Cervantes, sale a la luz el primer diccionario completo sobre el libro, elaborado durante siete años por investigadores de varias universidades bajo la coordinación del catedrático de Lingüística de la Universidad Autónoma de Madrid Antonio Moreno Sandoval y el hispanista de la Universidad de Tokio Hiroto Ueda.
Publicado en un repositorio digital abierto y gratuito, accesible para investigadores y estudiantes, ofrece nueva luz sobre la riqueza lingüística que desplegó el 'manco de Lepanto'.
Portada del 'Léxico del Quijote' CEDIDA
Del lenguaje culto del Quijote al terrenal de Sancho
"A mí lo que más me sorprende y lo que creo que es novedoso es que Cervantes era un gran 'oídor'. Como [Benito Pérez] Galdós, escuchaba muy bien a la gente y captaba sus características sociolingüísticas", explica Moreno en una entrevista con RTVE Noticias.
El diccionario recoge, por primera vez, un recuento completo de todos los personajes que intervienen en una obra "polifónica, coral": 214, muchos más de los que se creía que había hasta el momento, y los ordena según la cantidad de palabras que utilizan.
Gracias a ello, se establecen diferencias en el habla de los personajes según su sexo, edad o clase social. Se puede observar, por ejemplo, que el Quijote pronuncia expresiones cultas ajenas a Sancho, como "Amadís de Gaula" -el libro de caballerías que le inspiró en sus andanzas-, "poeta", "guerrero" o "valeroso".
En cambio, su fiel escudero opta por términos más terrenales y cercanos a su día a día como "tocino", "amo", "cabra", "vino", "queso" o "dinero". Sancho vive una "quijotización", sobre todo en la segunda parte de la obra, algo que ya observó Salvador de Madariaga y que este análisis confirma. A medida que comparte tiempo con el "caballero de la triste figura" se ve cómo adquiere un razonamiento "más complejo", aunque a nivel de léxico sigue manteniendo su "vulgaridad".
El español de Cervantes, parodiado en uno de los cómics de 'Mortadelo y Filemón' de Francisco Ibáñez MORTADELO Y FILEMÓN
Una tarea "imposible" de acometer manualmente
Aunque existían listas completas de las palabras del Quijote, nunca antes se habían presentado organizadas por lemas, las palabras que encabezan las entradas de los diccionarios, lo que muestra la verdadera riqueza léxica de la obra.
Según Moreno, si esto no se había hecho en 400 años es por una razón fundamental: sería "imposible" recopilar y organizar a mano las cientos de miles de palabras usadas en la obra.
Él y Ueda, junto a un equipo en el que participan además investigadores de la Universidad de Granada, la Complutense o la de Alcalá de Henares, han combinado el procesamiento automático con la validación humana, en un trabajo "innovador en la filología digital" que reduce considerablemente el tiempo de elaboración.
Más del triple de palabras de las que usamos en el día a día
Si Shakespeare de alguna manera "inventó" el inglés moderno aportando a la lengua cientos de términos que aparecían en sus obras, Cervantes destacó por su creatividad especialmente a la hora de crear nombres propios -casi 900 en todo el libro-, que en muchos casos han pasado ya a formar parte de la cultura popular española.
"Ahora la gente se maravilla con J.K. Rowling inventándose nombres en Harry Potter, pero Cervantes ya lo hizo", señala Moreno. Rocinante -el flaco caballo del Quijote-, Clavileño, Dulcinea, Altisidora o Espartafilardo del Bosque muestran el genio del autor.
Al coordinador de la obra le ha sorprendido también la gran cantidad de italianismos y latinismos, términos procedentes del italiano y el latín, lo que demuestra que Cervantes era "una persona leída", a la vez que cercano a la gente común.
Arabismos y latinismos, pero no anglicismos
El diccionario halla además una gran influencia en el español del siglo XVII de arabismos -hay que recordar que el autor del Quijote estuvo cinco años cautivo en Argel- y destaca la ausencia de anglicismos, ya que "la influencia del inglés es inexistente" en esa época.
En total, unas 8.555 entradas en el diccionario, cerca del triple de las palabras que usa habitualmente un hispanohablante -entre 2.500 y 3.500-. Por ejemplo, solo entre nombres de oficios y profesiones hay casi un centenar de palabras, entre ellas "alfaquí" (sabio entre los musulmanes), "catarribera" (oficial de justicia) o "boyero" (pastor de bueyes).
La profusión del vocabulario de Cervantes se ve también en sus decenas de términos sobre instrumentos musicales, muchos de ellos ya olvidados: "Caramillo", "churumbela" o "atabal".
¿Es difícil entender el Quijote para un lector actual?
El Quijote es sin duda la obra más famosa de la literatura española, pero paradójicamente, es también un clásico poco leído, según aseguró Andrés Trapiello cuando lanzó, no sin polémica, su adaptación de la obra de Cervantes al castellano actual.
¿Es una lectura ardua para un hispanohablante del siglo XXI? Moreno lo tiene claro: "Es difícil por muchas razones, no solamente por el léxico, sino sobre todo por la longitud de las oraciones". Ahora mismo, señala, estamos "acostumbrados a una sintaxis mucho más reducida".
Pero influye obviamente un léxico propio de otra España, "una sociedad mayoritariamente campesina", por lo que abundan términos del mundo rural ahora desaparecidos o desconocidos.
Por ello uno de los propósitos de los autores de este nuevo léxico es establecer organizaciones por campos semánticos: instrumentos musicales, plantas, aves, etc. Hasta ahora, el trabajo de los estudiosos de Cervantes se basaba en métodos cualitativos, en base a algunas palabras seleccionadas, pero esta obra exhaustiva permite ir más allá. "Al tenerlo todo en un listado, te permite descubrir palabras que se te habían pasado, porque nosotros no leemos palabra a palabra sino que inferimos el significado general de la oración", expone.
Gracias a tener ya elaborada esta recopilación completa de las palabras usadas en la obra, los autores pretenden sacar adelante nuevos trabajos derivados del léxico. Entre ellos, un "ChatGPT del Quijote", al que se le pueda preguntar, por ejemplo, "dame todos los instrumentos musicales que aparecen en la obra", sin necesidad de ir buscando uno a uno -y a diferencia de la popular herramienta de IA, "sin inventarse los resultados"-.
Otro objetivo es crear un modelo de inteligencia artificial adaptado al español del Siglo de Oro, que muestre las diferencias entre el español hablado entonces y ahora.
Otra manera de acercarse a la obra
Este profesor de la Autónoma se ha leído el Quijote "unas cuantas veces", dice, con media sonrisa, sin entrar a poner un número. Primero, por puro placer, y más tarde, en varias ocasiones, para preparar este trabajo. ¿Lo aprecia más ahora? "Lo ves de otra manera".
De normal, leemos verticalmente, y si una palabra no la conocemos, deducimos su significado por el contexto o simplemente la ignoramos. Ahora se fija más en las palabras, apreciando su riqueza.
Y sobre adaptaciones como la de Trapiello, controvertidas por modificar el lenguaje original de Cervantes, cree que suponen una "simplificación", pero se muestra a favor de ellas ya que permiten que "más gente pueda acceder" al libro.
Aun así, insiste en animar a los lectores contemporáneos a acercarse al Quijote, la novela total, una obra "muy rica filosóficamente", y aunque tenga un léxico y una sintaxis que nos resulten lejanos, trata cuestiones "universales acerca de la vida y la condición humana".