Estructura y dinámica de las colecciones digitales (I)

                                                                                                                                     Ariel Morán                                                                                    @Ariel_Moran

Para los humanistas que trabajan habitualmente en el entorno digital, al realizar sus investigaciones, las colecciones digitales se han convertido en recursos sumamente familiares. A pesar de sus rasgos característicos, sus procesos de organización y diseminación aún guardan cierta similitud con los de las colecciones físicas, por lo que puede ser difícil para algunas personas reconocer la novedad o singularidad de las colecciones digitales y las condiciones epistemológicas distintivas en las que se nos presentan.

Para ilustrar esta novedad, se debe tener en cuenta que con una colección digital (a diferencia de una colección física) sus elementos constitutivos ya no son la unidad primaria de significado. Por ejemplo, el visor de n-gramas de Google (https://books.google.com/ngrams) ofrece una perspectiva de la colección de Google Books pero no sólo como un conjunto de textos, sino como un conjunto de grupos de palabras que se pueden filtrar por hora e idioma. Los modelos de visualización son una aproximación a las colecciones en las que se produce la detección de los elementos textuales específicos dentro de una agregación, en vez de sólo el descubrimiento de tendencias, subgrupos y patrones.

Una colección digital puede surgir, por supuesto, como una representación de una colección física (la colección de una biblioteca o la colección de un museo, por ejemplo), pero ¿en qué medida está gobernada aún la dinámica de una colección digital (casi como un vestigio) por la misma lógica y régimen de gestión de las colecciones físicas (ligados a la proximidad)? La digitalización de una colección física se basa en la aparición de un conjunto estándares, métodos y en la capacidad de repetir el acto de la digitalización de una manera consistente a través de los varios elementos que constituyen la colección.

Mientras en una colección tradicional los metadatos son altamente significativos para un usuario por ser una forma eficaz de localizar el elemento específico que se busca, en una colección digital es el usuario quien debe ‘adjuntar’ la mayor parte del significado a la masa contextual. Según la bibliotecóloga Carole Palmer, decana de la Universidad de Washington, en su artículo de 2010 «Beyond size and search: Building contextual mass in aggregations for scholarly use», esta ‘masa contextual’ implica la interconexión que tiene una colección con respecto a un tema o a un programa de investigación específico, a través del cual se pueden mostrar secuencias modeladas que son relevantes e informativamente significativas.

En el mundo del hipertexto, la singularidad de un texto unitario es comprendida a partir de la serie de intersecciones resultantes en relación con la pluralidad del mundo hipertextual a través de un enlace, que no es otra cosa que un símbolo que funciona retóricamente para conducir a un lector de un locus textual a otro, a lo largo de una senda de lectura. Esta estructura rizomática y descentralizada es entienda como la base para una revisión radical de la textualidad y su política.

La lógica estructural de las colecciones digitales sitúa al texto dentro de un aparato de gestión especial. El texto, como unidad, se contextualiza dentro de la pluralidad de la colección a través de metadatos, por medio de un dispositivo de búsqueda y navegación especial para la colección. Estos mecanismos no son parte de la retórica del texto como tal, sino más bien se constituyen como capas de información que pueden operar de forma independiente. Los estándares de datos y los métodos digitales a través de los cuales podría tener lugar este tipo de contextualización, son las de los archivos digitales y las bibliotecas digitales. Se cuentan con ejemplos claros, como la Text Encoding Initiative (TEI), que se puso en marcha en 1987 con el objetivo de proporcionar un lenguaje común para la representación de metadatos y transcripciones de fuentes primarias. También se puede mencionar la Encoded Archival Description (EAD), que inició poco después de la TEI, y que surge como un lenguaje para la representación de los instrumentos de descripción de archivos en formato digital. Esfuerzos de investigación como estos, proveen de estándares de datos para toda una nueva infraestructura de investigación de las ediciones digitales, archivos digitales, colecciones digitales, y proyectos de digitalización.

Esta entrada fue publicada en bibliotecología, Colecciones digitales, humanidades digitales y etiquetada , , , . Guarda el enlace permanente.