Spanish American fiction in the HathiTrust Digital Library

Data and contextual information for “Spanish American Fiction in the HathiTrust Digital Library,” a workset curated by José Eduardo González in collaboration with the HathiTrust Research Center with generous support from the Mellon Foundation.

View the Project on GitHub htrc/scwared-spanish-american-fiction

Introducción: Conjuntos de obras de estilos y géneros narrativos hispanoamericanos para HathiTrust. (6/15/2023)

José Eduardo González
jgonzalez2@unl.edu
ORCID number: 0000-0002-8899-3021
Universidad de Nebraska-Lincoln

Solamente el 6% del contenido de la biblioteca digital HathiTrust es en español y, sin embargo, aún así hay barreras que dificultan encontrar novelas en este idioma para usarlas en un análisis literario. Aunque los volúmenes de ficción aparecen identificados por su país de origen, todavía necesitan ser separados en categorías que sean de utilidad para los críticos literarios. La misma situación se da para todos los volúmenes de la biblioteca, por supuesto, sin importar el idioma en que hayan sido escritas o su tema. Por eso, el propósito del proyecto que aquí se describe es crear listas de las obras disponibles para investigadores que estén interesados en literatura escrita en español, específicamente la narrativa hispanoamericana. Con ese objetivo en mente, he creado varios conjuntos de obras (en inglés, “worksets”), algunos de ellos enfocados en períodos literarios específicos, y otros en los géneros o subgéneros literarios que son frecuentemente estudiados por investigadores interesados en la literatura hispanoamericana. Los conjuntos de obras contienen la información necesaria para obtener de HathiTrust datos de los documentos que son de utilidad para los humanistas digitales (por ejemplo, frecuencias de palabras por página). Algunos de esos géneros literarios hispanoamericanos se enfocan en la literatura de un país, pero otros incluyen obras de diferente países y culturas. En adición he incluido otro grupo de conjuntos que no se enfocan en ningún genero o estilo sino que deben ser considerados como un primer intento de localizar en HathiTrust todas las novelas de esta región disponibles, organizadas usando el concepto de literaturas nacionales. En el presente documento explico las razones por las que he construido estos conjuntos de obras y los describo, es decir, menciono las características que diferencian estos grupos de obras en relación a las literaturas escritas en diferentes idiomas (en especial, a las literaturas en inglés ya que ese es el idioma que ha predominado en los estudios de las humanidades digitales). Además de las características que conectan las obras dentro de cada conjunto, existen también, por supuesto, conexiones histórico-culturales entre las obras de diferentes conjuntos.

Una razón para estudiar estos grupos de obras es que a menudo los estilos o géneros literarios en Hispanoamérica no siguen las divisiones que tradicionalmente se han utilizado para la historia literaria anglo-europea. Ya que el campo de las humanidades digitales ha sido dominado por las investigaciones sobre literatura escrita en inglés, es lógico que los críticos se hayan enfocado en detectar patrones narrativos dominantes en ese mercado artístico, como la novela detectivesca, la novela gótica, y la ciencia ficción, entre otros. Aunque en la literatura hispanoamericana tenemos practicantes de estas formas literarias, cuando se trata de estudiar los cambios más importantes ocurridos en la historia literaria de la región, la atención siempre se ha centrado en géneros o subgéneros que no siguen convenciones establecidas como los antes mencionados, sino que su origen y desarrollo está a menudo estrechamente vinculado con sucesos históricos y nacionales, o con tendencias culturales regionales. La formación de cualquier persona interesada en analizar la historia de la literatura hispanoamericana debe incluir, por necesidad, estudiar las características de “géneros nacionales”, como la novela de la revolución mexicana o la novela de la “Violencia” en Colombia. Por supuesto que también hay otros géneros que trascienden las fronteras nacionales, como la novela indigenista la cual principalmente echa raíces en países que poseen grandes poblaciones indígenas, o, un fenómeno más reciente, la “Narcoliteratura” (o “Narco-novela”) que se ha vuelto importante en más de un campo literario en la región.

Descripciones breves de los estilos literarios y géneros incluidos en este proyecto.

1. Modernismo (1890-1930)

El modernismo representa no solo el primer movimiento o tendencia literaria originario de Hispanoamérica, sino también el primero que tiene influencia fuera de América, y, por lo tanto, ocupa un lugar importante en la historia literaria de la región. Además de estar conscientemente creando una literatura autónoma en relación al campo literario europeo, el modernismo se propuso renovar las letras en español con la incorporación de un nuevo vocabulario y nuevos temas. Se convirtió en uno de los períodos artísticos más influyentes en la historia literaria hispanoamericana y sus efectos se pueden rastrear por varias décadas después de haberse cerrado ese período. Aunque todavía hay desacuerdos en cuanto a las características de las novelas que componen este grupo, es por lo general reconocido que estos autores buscaban crear una prosa artística y diferenciarse de los estilos realistas y naturalistas que se encontraban en la prosa narrativa a principios de siglo. Al igual que los poetas modernistas hacían en su poesía, los narradores modernistas concebían al lenguaje “como un objeto” y buscaban producir oraciones elegantes y adornadas con metáforas y alusiones culturales1. Abundan en su vocabulario el uso de neologismos, de términos eruditos (de origen griego y latino), galicismos, arcaísmos, además de palabras de origen americano.2 Como el modernismo fue el estilo dominante de la escritura por más de cuatro décadas, fue seguida e imitada por toda Hispanoamérica. Un problema que formó parte de las investigaciones literarias sobre el modernismo y que incluso hasta cierto sentido continúa hoy es la discusión sobre quiénes deben ser incluidos en el grupo. Por ejemplo, algunos autores que los primeros críticos que estudiaron este estilo clasificaron inicialmente de precursores del movimiento (o pre-modernistas) han sido más tarde incorporados como miembros. Para citar el caso que nos concierne, el de la novela modernista, algunos críticos limitan la lista de textos representativos a aproximadamente cincuenta novelas, mientras que otros expertos calculan que existen cerca de cien. Y sin duda los críticos que utilicen nuestro conjunto de obras para sus investigaciones tendrán sus propias listas de autores u obras que consideran parte del movimiento modernista. Si bien el modernismo tuvo imitadores en todos los países hispanoamericanos, debemos subrayar la influencia que tuvo en especial en México, Colombia, Perú y Argentina. Algunas de las novelas modernistas más destacadas son Lucía Jerez (1885) de José Martí (Cuba, 1853-95), De sobremesa (1896) de José Asunción Silva (Colombia, 1865-96), Ídolos rotos (1901) de Manuel Díaz Rodríguez (Venezuela, 1871-1927), La rosa muerta (1914) de Aurora Cáceres (Perú, 1877-1958) y La gloria de don Ramiro (1908) de Enrique Larreta (Argentina, 1875-1961). Para la creación de este conjunto de obras me he dejado guiar, en términos generales, por dos estudios críticos que han intentado establecer un canon de la narración larga modernista: el libro A Companion to Spanish American Modernismo de Aníbal González y la tesis doctoral de Alejandro Mejías-López, “La novela modernista hispanoamericana: definición y estudio de sus inicios”. Además de estos dos estudios, también he utilizado información en línea y en volúmenes de historias nacionales de literatura para localizar información detallada sobre narradores de los diferentes países hispanoamericanos que en su campo literario local son considerados modernistas.

2. Novela o narrativa de la revolución mexicana.

Se le da el nombre de novela de la revolución mexicana a un grupo de obras en prosa narrativa que retrata sucesos (ficticios o reales) relacionados con el conflicto armado que ocurrió en México entre 1910 y 1920. El inicio del conflicto fue una revuelta contra el régimen de Profirio Díaz quien había estado al frente del gobierno, directa o indirectamente, por más de treinta años. Como resultado, surgieron una serie de batallas por el poder en diferentes regiones que incluyeron algunas de las figuras históricas más conocidas de la historia mexicana (Villa, Zapata), las cuales a veces hacen una aparición (o son aludidas) en la narración. Por lo general, estas obras en prosa poseen un estilo realista y ocasionalmente son autobiográficas o al menos recuentan experiencias directas de la actividad revolucionaria. Las obras incluidas en esta clasificación varían de crítico a crítico, como es de esperarse, ya que muchas de las características que normalmente se utilizan para detectarlas son muy imprecisas, o son tan generales que otros estilos narrativos también podrían compartirlas. Aunque inicialmente recibieron la etiqueta de “novelas de la revolución”, el grupo incluía, además de obras de ficción, una gran variedad de textos narrativos como biografías, memorias y crónicas periodísticas. Entre las obras que se asocian con este género se pueden mencionar las novelas de Mariano Azuela (1873-1952), Los de abajo (1915), Los caciques (1917) y Las tribulaciones de una familia decente (1918). Así como otras novelas destacadas de la literatura mexicana como El águila y la serpiente (1928) de Martín Luis Guzmán (1887-1976) y Cartucho (1931) de Nellie Campobello (1900-1986). Para construir mi conjunto de obras consulté la antología clásica de Castro Leal, La novela de la revolución mexicana (México: Aguilar, 1969) y el estudio más reciente del género, Avatares editoriales de un género de Danaé Torres de la Rosa. Pero la referencia más importante apareció en 1972, cuando John Rutheford publicó lo que es hasta ahora la bibliografía más complta de las novelas de la revolución, An annotated bibliography of the novels of the Mexican Revolution of 1910-1917. Es posible que la mayoría de estas novelas solo existan en su versión inicial y que nunca hayan sido re-editadas lo que explica que de los 139 textos enumerados por Rutheford, HathiTrust solamente tiene 68 (48%).

3. Indigenismo.

El origen de este género fue el deseo de denunciar la explotación de las poblaciones indígenas en Hispanoamérica y ha tenido seguidores en muchos países de la región, pero es especialmente importante para la historia literaria y cultural de Ecuador, Perú, México, Paraguay y Bolivia. Estos son los países incluidos en este conjunto de obras. Las novelas indigenistas retratan las culturas de los pueblos indígenas de América Latina y se dividen tradicionalmente en dos tendencias principales: la indianista y la indigenista. La literatura indianista tuvo su apogeo durante el siglo XIX y se distinguía por su visión idealizada de los habitantes nativos y un apego romántico al pasado. Entre sus ejemplos podemos incluir Cumandá: o un drama entre salvajes (1877) de Juan León Mera (Ecuador, 1832-1894) y Enriquillo (1879) de Manuel de Jesús Galván (República Dominicana, 1834-1910). Por otra parte, las novelas indigenistas están interesadas en presentar y defender a los grupos indígenas rurales contemporáneos. Entre las novelas más importantes que se incluyen en esta segunda categoría se encuentran Los ríos profundos (1958) de José María Arguedas (Perú, 1911-69), Balún-Canán (1957) de Rosario Castellanos (México, 1925-74), Huasipungo (1934) de Jorge Icaza (Ecuador, 1906-78) y El mundo es ancho y ajeno (1941) de Ciro Alegría (1909-67). Mi fuente principal para la lista de novelas indianistas lo fue el clásico libro de Concha Meléndez, La novela indianista en Hispanoamérica (1832-1889). Mucho más difícil fue la creación de la lista para el conjunto de obras de la novela indigenista. Entre las fuentes consultadas están: David W. Foster, “Bibliografía del indigenismo hispanoamericano”, René Prieto, “The literature of Indigenismo.”, y Julio Rodríguez-Luis, Hermeneútica y Praxis del Indigenismo. De las 102 novelas indigenistas/indianistas que esperaba encontrar en HathiTrust, habían 84, o el 82%.

4. Novela de “la Violencia”.

El nombre de este género viene de un período largo y violento en la historia de Colombia. Su tema principal es la guerra civil que comenzó en 1948 después del asesinato del candidato a la presidencia por el partido liberal, Jorge Eliécer Gaitán, y cuyos dos bandos se alineaban con el partido conservador o el liberal. La mayoría del conflicto ocurrió en las zonas rurales, a veces resultando en enfrentamientos entre los campesinos y las fuerzas del ejército. Además de aspectos e individuos relacionados a los dos partidos políticos, otros elementos que forman parte de la trama de estas narraciones son el ejército nacional, la policía y la Iglesia Católica. La crítica literaria en su mayoría parece estar de acuerdo en que las novelas de este género (sin importar la ideología del autor) tienden a ver en los políticos los culpables de la violencia–son ellos los que tratan de manipular la situación y los que alargan el conflicto. Para algunos críticos de literatura, las únicas novelas que debían pertenecer a este grupo son las que fueron publicadas entre 1946 y 1965. Otros, sin embargo, sostienen que el período literario debía ser más largo e incluyen, por ejemplo, algunas novelas de Gabriel García Márquez. Aunque yo he optado por seguir este último modelo, la mayoría de artículos o libros sobre el tema estudian las narrativas que aparecieron entre 1940 y 1960, lo que hace difícil encontrar novelas que hayan aparecido después de 1970 que podrían clasificarse como parte de este género. Entre las obras más destacadas que pertenecen a este modo narrativo podemos encontrar El Cristo de Espaldas (1952) de Eduardo Caballero Calderón (1910-1993), El día del odio (1952) de José Osorio Lizarazo (1900-1964) y La mala hora (1962) de Gabriel García Márquez (1927-2014). La lista inicial en la que me basé para este conjunto de obras vino de la “Bibliografía Anotada Sobre el Ciclo de la Violencia en la Literatura Colombiana” de Lucila Inés Mena y de la “Cronología y bibliografía de la novelística sobre la Violencia (1949-1967)” de Augusto Escobar Mesa. En esta categoría, se buscaron 92 títulos y se encontraron 80 de ellos, lo que representa un 86% del total.

5. Narrativa del boom y otras obras relacionadas.

El período histórico del boom latinoamericano cubre de principios de los años sesenta hasta mediados de los setenta. Este fenómeno representó un cambio radical dentro de la historia del mercado literario latinoamericano tanto por su modernización de la escritura de la región como por su doble éxito comercial y crítico. Son muchos los aspectos que influyeron en la creación del boom. En términos de los cambios sociales, durante este período la urbanización de América Latina llega a etapas nunca antes vistas debido a la gran inmigración que proviene del campo y se muda a las grandes ciudades. En términos de la cultura popular, la influencia de la industria cultural estadounidense empieza a sentirse a través de los nuevos medios de comunicación masiva. Y, en términos de la política, el triunfo de la revolución cubana en 1959 atrae la atención mundial a esta parte del hemisferio. En parte por el enorme éxito comercial de esta literatura, algo si precedentes en el campo literario latinoamericano, la novela del boom comparte el optimismo de la época, el cual se ve reflejado en la audacia de sus experimentos narrativos. Para algunos de los autores de este período, tener éxito también significó la posibilidad, por primera vez en la historia de su tradición literaria, de convertirse en escritores profesionales, de poder vivir de su oficio. Durante la década de los setenta, eran frecuentes las discusiones sobre cuáles escritores que debían ser parte de este grupo. Obviamente, estar asociado con el boom significaba no solo un aumento en el capital social para los autores reconocidos, sino también, potencialmente, el éxito económico de sus obras. Pero mientras algunos críticos vieron al boom como un club exclusivo al que solo podían entrar unos pocos, otros ampliaron la definición del fenómeno y la volvieron más inclusiva. Para construir este conjunto de obras, opté por utilizar este último acercamiento, incluyendo no solo obras y autores que son considerados miembros del grupo por la mayoría de los críticos, sino también añadiendo otros que solo ocasionalmente son mencionados como parte del boom, o que se considera que continúan la misma tradición o heredan este “estilo”, como en el caso del llamado post-boom. Este acercamiento a la creación del conjunto de obras tiene la ventaja de permitirles a los investigadores interesados en el tema crear una selección del boom según sus propios criterios o intereses. La línea divisoria entre los libros del boom y aquellos que vinieron antes o después de ellos siempre ha sido porosa. A pesar de esto, estoy seguro que algunos críticos encontrarán que hay todavía otros autores que deberían ser añadidos. Este conjunto también difiere de los que han sido mencionados más arriba ya que muchos de los volúmenes en él se entrecruzan con otras categorías (novela de la revolución mexicana, Indigenismo, novela de la “Violencia”).

Algunos ejemplos destacados de la literatura del boom son La casa verde (1966) de Mario Vargas Llosa (Perú, 1936-), La región más transparente (1958) de Carlos Fuentes (México, 1928-2012), El obsceno pájaro de la noche (1970) de José Donoso (Chile, 1924-1996) y Rayuela (1963) de Julio Cortázar (Argentina, 1914-1984). Mi punto de partida para diseñar este conjunto fue el clásico estudio sobre este fenómeno literario, “El boom en perspectiva” de Ángel Rama, pero también utilicé la introducción al tema de Randolph D. Pope, “The Spanish American novel from 1950 to 1975”. La biblioteca HathiTrust tenía un 100% de los volúmenes (un total de 65) .

6. Narcoliteratura.

Este grupo busca incluir narraciones en las que se representen las consecuencias sociales y culturales que acompañan el tráfico de drogas en América Latina. Los textos clasificados en este género son representaciones periodísticas o ficticias y provienen en su mayoría de las tradiciones literarias de México y Colombia y solo ocasionalmente encontramos expresiones literarias que vienen de otros países. Algunos ejemplos notables de este género son La virgen de los sicarios (1994) de Fernando Vallejo (Colombia, 1942-), Trabajos del reino (2004) de Yuri Herrera (México, 1970-), La Santa Muerte (2004) de Homero Aridjis (México, 1940-). Entre los libros consultados para la creación de este conjunto se encuentran El narcotráfico en la novela colombiana de Oscar Osorio y también “Imagining the U.S.-Mexico Drug War: The Critical Limits of Narconarratives” de Oswaldo Zavala. Para más información, véase también la entrada “Literatura del narco” en Wikipedia (https://es.wikipedia.org/wiki/Literatura_del_narco). HathiTrust no posee muchas obras importantes de este género (ver Tabla 1) y es posible que una de las razones por las que la representación de la narcoliteratura en HathiTrust es tan pobre tiene que ver con el hecho que muchos de los títulos son publicaciones recientes y es común que hayan sido publicados por pequeñas editoriales locales. De las 104 novelas que buscaba incluir en el conjunto, solo se encontraron 49, es decir, un 47%.

       
Conjunto de obras Núm. de títulos buscados Núm. de títulos en HT Porciento encontrado
Modernismo 464 304 65%
Revolución mexicana 139 68 48%
Indigenismo 102 84 82%
La Violencia 92 80 86%
Narrativa del boom 64 64 100%
Narcoliteratura 104 49 47%.

7. Conjuntos de novelas sin clasificar

Por último, he creado varios conjuntos de obras dedicados a enumerar las novelas hispanoamericanas que se encuentran disponibles en HathiTrust. En primer lugar, cada conjunto está dedicado a un país diferente, pero las novelas no están clasificadas en géneros o períodos. Los críticos que utilicen estos conjuntos posiblemente reconocerán algunas de las novelas que pertenecen a otros estilos o géneros de la historia literaria hispanoamericana (por ejemplo, la “novela de la tierra”), pero el trabajo de identificarlas y etiquetarlas sobrepasaba los objetivos iniciales de mi proyecto.

Este es un grupo general de novelas que fueron publicadas en diferentes países de Hispanoamérica. No se incluyen las obras encontradas en las seis categorías anteriores. Otra limitación de estos conjuntos–resultado de las fuentes bibliográficas que tenía disponible–es que con un par de excepciones que mencionaré más adelante, incluyen novelas desde el siglo XIX hasta aproximadamente la décda de los setenta. A pesar de esto, los grupos de novelas “sin clasificar” poseen un total de más de dos mil volúmenes. Idealmente estos conjuntos se podrían revisar, modificar y mantener al día en el futuro a medida que HathiTrust añade nuevos volúmenes de literatura hispanoamericana, pero en la práctica puede resultar difícil de hacer. Si bien no es prudente utilizar la información en estos conjuntos para juzgar cuánta ficción hispanoamericana contiene la biblioteca HathiTrust, considero que es un buen punto de partida para este tipo de investigación. Crear colecciones de datos que aspiren a incluir todos los libros de una forma literaria específica (como la novela) es difícil ya que no se puede realizar el trabajo automáticamente. Para crear los conjuntos me beneficié de bibliografías de novelas para que ya existían individualmente para los países hispanoamericano. Aunque con la llegada de la internet este tipo de labor ha caído en desuso, durante una época del siglo XX, la creación de bibliografías centradas en la producción literaria nacional era considerada una contribución valiosa al campo de las letras. El impresionante trabajo de Edna Coll, Índice informativo de la novela hispanoamericana, consta de cinco volúmenes e intenta registrar toda la narrativa novelística publicada en Bolivia, Colombia, Cuba, República Dominicana, Ecuador, Perú, Puerto Rico, Venezuela y varios países de América Central. Por suerte, otros investigadores emprendieron proyectos similares para otros países de la región. Por ejemplo, Alba María Paz Soldán compiló el “Índice de la novela boliviana (1931-1978)” y Cedomil Goic publicó “Bibliografía de la novela chilena del siglo XX” en 1962. Sin duda, los conjuntos que presento aquí se beneficiaron enormemente de estos proyectos titánicos, pero desafortunadamente las bibliografías rara vez incluyen información sobre nuevas publicaciones después de la década de los setenta, lo que explica una de las limitaciones mencionadas antes. Sin embargo, hay dos excepciones. Una es The Argentine Novel. An Annotated Bibliography de Myron I. Lichtblau, la cual es impresionante, no solo por las detalladas entradas que escribe el autor sobre cada una de las novelas registradas, sino también porque le agregó un suplemento en 2002. La otra excepción, aunque por razones muy distintas, es la bibliografía sobre la novela en México. Debido a la fuerte presencia en la Internet de la literatura y crítica literaria mexicanas, la bibliografía sobre la novela de este país es la más actualizada de estos conjunto de obras “sin clasificar”, e incluye información sobre la novelas publicadas en las dos últimas décadas . Algunos sitios en la web, como la “Enciclopedia de la literatura en México” (www.elem.net) poseen información actualizada sobre publicaciones recientes en ese país. Esos son los únicos dos casos (Argentina y México) en los que aparece una cantidad notable de obras recientes. Para otros países de la región, sin embargo, los “conjuntos de novelas sin clasificar” solo nos ofrece una visión de las obras en posesión de HathiTrust desde finales del siglo XIX hasta los años sesenta y setenta.

Objetivos y método de trabajo

El propósito principal de este proyecto es ayudar a fomentar la aplicación de métodos cuantitativos al estudio de la literatura hispanoamericana. Se puede decir que ya se cuenta con una comunidad vibrante de críticos literarios y culturales que tanto en los Estados Unidos como en América Latina están utilizando bancos de datos culturales relacionados a los países hispanoamericanos para realizar sus investigaciones y su presencia se ha comenzado a sentir en el campo de las humanidades digitales. Por ejemplo, la versión en español del proyecto “The Programming Historian” (https://programminghistorian.org/es/) ha creado docenas de lecciones en español (algunas de ellas son traducciones de recursos en inglés pero otras han sido escritas en español exclusivamente para su sitio) para facilitar el aprendizaje de métodos de investigación para usuarios en el mundo de habla española. También han surgido “números especiales” en importantes revistas de humanidades digitales en inglés (http://digitalhumanities.org/dhq/vol/12/1/index.html). Además, existen ya revistas dedicadas exclusivamente a las humanidades digitales en español (http://revistas.uned.es/index.php/RHD/index) cuya misión es no solo difundir conocimiento sobre este campo, sino proporcionar un medio apropiado para la publicación de investigaciones en español. A pesar de estos adelantos, sin embargo, el uso de enfoques cuantitativos para el estudio de la literatura hispanoamericana sigue siendo poco común. Uno de los principales obstáculos que encuentran los críticos interesados en las humanidades digitales está relacionado con el tiempo y el esfuerzo requeridos para crear datos centrados en productos literarios hispanoamericanos. Mi esperanza con este proyecto es hacer una pequeña contribución para remediar esta situación, es decir, crear conjuntos de obras que permitan a los interesados en estudiar la literatura hispanoamericana de manera cuantitativa obtener la información que necesitan de HathiTrust. Espero que mis colecciones de datos sean despierten interés por el hecho que se tratan de temas conocidos o porque están enfocados en áreas de estudio relacionadas a géneros literarios, países y regiones específicas.

Con esto me refiero a que los conjuntos de obras que he seleccionado para este proyecto se centran en períodos o estilos que tradicionalmente estudiados en la historia literaria de la región hispanoamericana. En otras palabras, es el tipo de clasificación que un crítico encontraría en tomos como The Cambridge History of Latin American Literature o en las listas de lecturas de posgrado que los estudiantes de maestría deben tomar en las universidades de los Estados Unidos. El modo en que los he agrupado estas novelas refleja las clasificaciones que han hecho los expertos en las materias. Obviamente, es común que los críticos estén en desacuerdo en cuanto a los libros que deben pertenecer a un grupo u otro, así que mi método de trabajo fue incluir cualquier obra que fuera mencionada por cualquier crítico como parte de un grupo o estilo, incluso si la selección a veces pudiera ser controvertida. En adición, mis selecciones están limitadas por los volúmenes disponibles en HathiTrust. Como he mencionado antes, además de recolectar datos sobre géneros o estilos tradicionalmente estudiados en la historia de la literatura hispanoamericana, también he creado conjuntos de obras más amplios, titulados “Conjuntos de novelas sin clasificar.” El objetivo de estos últimos era incluir la mayor cantidad posible de novelas de diferentes países, sin tener en cuenta el género del autor, su país de origen, ni los temas tratados. Debido a la falta de un mecanismo automático para localizar ficción, mi método de trabajo dependía casi exclusivamente de la información impresa o en línea que estuviera ya disponible sobre las literaturas nacionales que estaba tratando de encontrar. Como he explicado antes, un factor que afectó mi trabajo es que como resultado de varios factores hay más información sobre los libros publicados en algunos países (como México) que en otros (como, por ejemplo, en Ecuador o Paraguay). Pero también existen otros factores que han determinado el contenido de estos conjuntos “sin clasificar”: para empezar, trabajo dentro del ámbito universitario de Estados Unidos, donde los departamentos de estudios hispánicos, por complejas razones históricas y académicas, se han interesado más en ciertas literaturas de la región hispanoamericana que en otras. Nuestro método de trabajo consistió en crear listas de libros relevantes para cada sección del proyecto y la búsqueda de las mismas en el catálogo de HathiTrust. La búsqueda fue realizada de manera algorítmica por Boris Capitanu, Investigador Principal de Desarrollo en el Centro de Investigación HathiTrust (conocido como HTRC, o, en inglés, HathiTrust Research Center). Después de la búsqueda automatizada, se llevó a cabo una búsqueda manual de todos los volúmenes que no fueron encontrados. Para localizar los títulos que pertenecen a cada uno de los géneros o categorías, o en el caso de las novelas “sin clasificar”, compilar una lista de la mayor cantidad posible de novelas de todos los países de habla hispana en América, requirió consultar sitios web, catálogos en línea, historias nacionales o regionales de literaturas, artículos y libros y copiar manualmente los títulos de las novelas y sus autores. Al final de este artículo, el lector encontrará una bibliografía con todas las referencias utilizadas. Dado lo laborioso de la tarea de recopilar miles de títulos de novelas de diferentes tradiciones nacionales y utilizar múltiples fuentes en línea e impresas, es posible que algunos de los conjuntos “sin clasificar” contengan errores. Por ejemplo, algunos de los conjuntos podrían contener volúmenes que no son novelas, sino colecciones de cuentos cortos o prosa no ficticia.

Problemas encontrados

Un problema que encontré al crear los conjuntos de obras fue la necesidad de excluir volúmenes con múltiples obras. Algunos de los textos que quería incluir en los conjuntos solo estaban disponibles en HathiTrust como parte de una edición que contenía varias obras, como, por ejemplo, un volumen de las obras completas de un autor. Utilizar estos textos requería encontrar manualmente la ubicación del principio y el final de la narración que me interesaba, información que a veces solo podía ser aproximada porque obtenerla dependía del tipo de acceso que las leyes de derechos de autor permiten. El número de obras en las “colecciones” creadas para HathiTrust, por esta razón, podría no coincidir con los números en la Tabla 1. Es decir, aunque encontramos la obra, al no poder separarla de las otras obras en el volumen, no está en condiciones que se presten para ser utilizada en minería textual. Por ejemplo, aunque hay ejemplares de Las moscas de Mariano Azuela en HathiTrust, la obra siempre aparece en volúmenes que también incluyen otras novelas del autor. Para fines de una investigación histórico-literaria, utilizar obras que aparecen publicadas junto a otras en un solo volumen resultaría en añadir datos que no son parte del texto analizado.

Si bien muchas novelas hispanoamericanas están ausentes de HathiTrust, en otros casos algunos de los libros incluidos podrían aparecer más de una vez y, en ocasiones, dependiendo de la popularidad de un texto, podría existir más de una versión de la misma edición. Los críticos interesados en utilizar los volúmenes en HathiTrust deben utilizar su propio criterio antes de elegir la “mejor” versión electrónica de un título. Es por supuesto importante tener una digitalización precisa, con pocos errores, para el análisis computacional de texto, pero hay también otros aspectos a considerar. Por ejemplo, hay que excluir ciertas partes del texto, como prólogos e introducciones, lo que puede llevar al crítico a preferir ediciones primera o tempranas que no introduzcan elementos que no pertenecen al texto principal, como sería el caso de ediciones críticas.

Cómo usar estas colecciones.

Estos conjuntos de obras pueden ser utilizados para estudiar problemas de canonicidad y representatividad. Tradicionalmente, los historiadores literarios han estado interesados en determinar las características que hacen que una obra sea aceptada dentro de una clasificación literaria.

En otras palabras, los datos que podemos obtener de HathiTrust pueden ayudar a encontrar evidencia que determine si una obra pertenece a un período o género específico. Aunque utilicé estudios críticos e historias de la literatura para clasificar estas obras en grupos, otros críticos podrían cuestionar mis decisiones y optar por expandir (o limitar) el canon de cualquiera de los grupos que presento.

Los críticos también podrían proponer que algunas de estas obras pertenecen a más de uno de estos grupos, y en ese caso, sería necesario desarrollar una metodología adecuada para estudiar la yuxtaposición entre clasificaciones. También sería posible comprar y contrastar a los diferentes grupos, especialmente si existen conexiones extra-literarias entre ellos. Por ejemplo, tres de los grupos en nuestro proyecto parecen depender de cierta noción de “violencia social” como una característica esencial (la narrativa de la revolución mexicana, la novela de la “Violencia” colombiana y la Narcoliteratura). Eso que no quita que individualmente también podrían ser utilizados para respaldar hipótesis sobre el entorno social que produjo estos géneros. Otro uso sería que estos conjuntos de obras sirvieran de base a partir de la cual se pueden construir listas con otros criterios. Por ejemplo: una lista de obras que ha recibido premios literarios, obras que frecuentemente se utilizan en programas avanzados de estudios literarios, etc. De la misma manera, hay críticos podrían estar interesados en géneros o períodos hispanoamericanos que no han sido incluidos aquí (la novela del dictador, la novela de la tierra, etc.), o hacer colecciones de géneros populares como la novela de detectives, o textos narrativos que muestran la influencia de tendencias literarias globales como el naturalismo o la vanguardia.

Para proteger los derechos de autor, HathiTrust solo puede proveer lo que ellos llaman “atributos extraídos” (Extracted Features) para los volúmenes que han sido publicados después de 1928, es decir información sobre las frecuencias de las palabras en las páginas de un texto a través de su API. Sin embargo, incluso cuando no se tiene acceso directo al texto y no podemos saber el orden y la ubicación original de las palabras, todavía es posible utilizar la información que los “atributos extraídos” ofrecen para obtener resultados significativos en los estudios computacionales de la cultura.

Existen en inglés y otros idiomas numerosos estudios que podrían servir como modelo para los críticos que trabajan con textos hispanoamericanos con un enfoque de humanidades digitales. Al mirar el contenido de estos conjuntos de obras como una totalidad, se vuelve evidente la gran diferencia en términos de atención recibida que existe entre los escritores famosos o populares y los cientos de textos que han pasado al olvido. Esto sugiere, entre otros proyectos, la posibilidad de estudiar similitudes entre obras canónicas, o contrastar el uso del lenguaje literario en el canon de un género con el lenguaje de aquellas obras que permanecen prácticamente desconocidas, incluso para especialistas en el campo.

Bibliografía

Coll, Edna. Índice informativo de la novela hispanoamericana. Vols 1-5. San Juan, Puerto Rico: Editorial Universitaria, 1974.

“Enciclopedia de la literatura en Mexico.” http://www.elem.net

Escobar Mesa, Augusto. “Cronología y bibliografia de la novelística sobre la Violencia (1949-1967)” en Ensayos y aproximaciones a la otra literatura colombiana. Santafé de Bogotá : Fundación Universidad Central, 1997. pp. 332-338.

Goic, Cedomil. “Bibliografía de la novela chilena del siglo XX.” Boletín de Filología de la Universidad de Chile. No. 14 (1962). pp. 51-168.

González, Aníbal. A Companion to Spanish American Modernismo. Woodbrige: Tamesis. 2007.

González Echevarría, Roberto y Enrique Pupo-Walker, editores. The Cambridge History of Latin American Literature. Cambridge: Cambridge University Press, 1996.

Lichtblau, Myron I. The Argentine Novel. An Annotated Bibliography, Scarecrow Press, 1997.

“Literatura del narco” en https://es.wikipedia.org/wiki/Literatura_del_narco.

Mejías-López , Alejandro, “La novela modernista hispanoamericana: definición y estudio de sus inicios.” The University of Michigan, 1995.

Meléndez,Concha. La novela indianista en Hispanoamérica (1832-1889), Río Piedras, 1961. Universidad de Puerto Rico.

Mena, Lucila Inés. “Bibliografía Anotada Sobre el Ciclo de la Violencia en la Literatura Colombiana.” Latin American Research Review, 13, 3, 1978, 95-107.

Mesa, Augusto Escobar. “Cronología y bibliografia de la novelística sobre la Violencia (1949-1967)”, Ensayos y aproximaciones a la otra literatura colombiana. Santafé de Bogotá : Fundación Universidad Central, 1997. pp. 332-338.

Osorio, Oscar. El narcotráfico en la novela colombiana. Cali : Programa Editorial Universidad del Valle, 2014.

Paz Soldán, Alba María. “Índice de la novela boliviana (1931-1978).” Revista Iberoamericana. Vol. LII, núm. 134, enero-marzo 1986.

Pineda Botero, Álvaro, Sandra Isabel Pérez, María Del Carmen Rosero, María Graciela Calle. “Bibliografía De La Novela Colombiana.” Departamento de Humanidades. Grupo de Estudios Culturales. La Novela Colombiana Contemporánea. Universidad Eafit, 2003.

Pope, Randolph D. “The Spanish American novel from 1950 to 1975.”The Cambridge History of Latin American Literature, vol 2, editado por Roberto González Echevarría y Enrique Pupo-Walker, Cambridge UP, 1996, 226-78.

Prieto, René. “The literature of Indigenismo.The Cambridge History of Latin American Literature, vol 2, editado por Roberto González Echevarría y Enrique Pupo-Walker, Cambridge UP, 1996, 138-163,

Rama, Ángel. “El boom en perspectiva.” La novela latinoamericana. Panoramas 1920-1980. Bogotá: Colcultura, 1982, pp. 235–293.

Rodríguez-Luis, Julio. Hermenéutica y praxis del indigenismo: de Clorinda Matto a José María Arguedas. Mexico: Fondo de Cultura Económica, 1980.

Rutheford, John . An annotated bibliography of the novels of the Mexican Revolution of 1910-1917. Truy, Whitston, 1972.

Torres de la Rosa, Jaén Danaé. Avatares editoriales de un “género”: tres décadas de la novela de la revolución mexicana. Mexico: Bonilla Artigas, 2016.

Zavala, Oswald. “Imagining the U.S.-Mexico Drug War: The Critical Limits of Narconarratives.” Comparative Literature, Summer 2014, Vol. 66, No. 3, pp. 340- 360.

  1. González, A Companion to Spanish American Modernismo, p. 27. 

  2. Mejías-López, “La novela modernista hispanoamericana”, p. 99.