Del manuscrito antiguo al nuevo mundo: Transkribus como herramienta metodológica en los estudios de la Historia de la América Colonial
24 marzo 2025
24 marzo 2025
Por Gilson Mateus
La investigación histórica sobre la América colonial requiere un conocimiento profundo de la documentación antigua, a menudo escrita a mano y conservada en archivos que abarcan siglos de historia. Sin embargo, el manejo de fuentes primarias en esta área presenta una serie de desafíos, especialmente en lo que respecta a la lectura, transcripción e interpretación de documentos escritos a mano. La paleografía – la ciencia que estudia la escritura antigua – es una habilidad esencial para los historiadores que trabajan con manuscritos antiguos, pero su práctica puede ser ardua y llevar mucho tiempo. En este contexto, herramientas digitales como Transkribus emergen como aliados para facilitar y acelerar el proceso de investigación.
***
Durante el período colonial, la producción documental en América Latina fue extensa, abarcando desde cartas e informes administrativos hasta registros eclesiásticos, contratos de tierras y correspondencia personal. Estos documentos, escritos a mano en diferentes estilos de escritura e idiomas, como español, portugués e incluso latín, ofrecen un vasto campo de investigación. Sin embargo, debido a las variaciones en la escritura, la degradación física de los documentos y la complejidad del lenguaje, la lectura e interpretación de estas fuentes a menudo se convierten en tareas altamente especializadas.
Uno de los principales obstáculos a los que se enfrentan los investigadores es la transcripción de manuscritos. Además de la dificultad para descifrar la escritura antigua, es necesario comprender las convenciones lingüísticas y gramaticales de la época, que pueden ser bastante diferentes de las formas modernas. El tiempo necesario para transcribir manualmente estos documentos, combinado con la posibilidad de errores de interpretación, limita la velocidad y precisión con la que se puede extraer nueva información de estas fuentes primarias.
***
Transkribus fue desarrollado para ayudar en la transcripción automática de documentos impresos y escritos a mano. Utilizando tecnologías de reconocimiento óptico de caracteres (OCR) y aprendizaje automático, la plataforma tiene la capacidad de “aprender” diferentes patrones de escritura y proporcionar transcripciones de alta precisión, que pueden perfeccionarse a medida que se ingresa más texto y el sistema se adapta a la escritura específica de cada documento.
El software surgió del proyecto europeo READ (Recognition and enrichment of archival documents), financiado por la Unión Europea en el marco del programa Horizonte 2020, cuyo objetivo es desarrollar soluciones tecnológicas innovadoras para el acceso a archivos históricos. El proyecto READ, lanzado en 2016, reunió a una amplia gama de socios, incluidas universidades, centros de investigación, bibliotecas y archivos, todos comprometidos con mejorar la accesibilidad a los documentos históricos.
El transkribus se desarrolló en este contexto como respuesta a la necesidad de automatizar el proceso de transcripción de manuscritos, algo que tradicionalmente requería habilidades paleográficas especializadas y largas horas de trabajo manual. El equipo detrás de Transkribus está formado por investigadores del Centro de Procesamiento de Documentos de la Universidad de Innsbruck en Austria, un centro de excelencia en procesamiento de imágenes y reconocimiento de texto.
A lo largo de los años, el transkribus ha pasado de ser un proyecto académico a una plataforma ampliamente utilizada con miles de usuarios en todo el mundo, incluidos académicos, estudiantes, archiveros y entusiastas de la historia. El proyecto también continuó evolucionando, incorporando nuevas características como entrenamiento de modelos personalizados, la capacidad de manejar múltiples idiomas y escrituras a mano, y una mayor precisión en el reconocimiento de texto.
Aquí te explicaré brevemente el uso de transkribus en la investigación histórica, ya que si bien es una herramienta muy versátil, su uso implica algunos pasos básicos que varían según el proyecto y la naturaleza de los documentos en cuestión. A continuación se detallan los pasos principales para utilizar Transkribus:
- Registro y acceso a la plataforma: El primer paso para utilizar Transkribus es crear una cuenta en la plataforma. Se puede acceder a la interfaz a través del software de escritorio, disponible para descarga, o a través de la versión web.
- Carga de imágenes: Tras registrarse, el usuario deberá cargar los documentos que desea transcribir. Las imágenes de manuscritos o material impreso se pueden cargar en formatos como JPG, PNG o PDF. Cuanto mejor sea la calidad de la imagen, mayor será la precisión del reconocimiento de texto.
- Segmentación del documento: Antes de iniciar la transcripción automática, es posible que el usuario necesite definir “regiones de texto” en las imágenes, es decir, las áreas donde aparece el texto. Este paso es especialmente importante para documentos antiguos con notas marginales o diseños inusuales.
- Transcripción automática con HTR: Transkribus utiliza el reconocimiento de texto manuscrito (HTR) para transcribir documentos. El sistema se basa en redes neuronales entrenadas para reconocer e interpretar escrituras históricas. Se puede optar por utilizar un modelo existente o entrenar un modelo personalizado.
Cabe señalar que, dada la cantidad de formación, la inteligencia se entrena mejor en lenguas germánicas, aunque cada vez se implementan modelos de otras lenguas, especialmente latinas, como el portugués y el español. Este modelo de formación es fundamental para el desarrollo de software. Para entrenar un modelo, el usuario debe proporcionar transcripciones manuales de una muestra de páginas (normalmente entre 50 y 100 páginas). A partir de estas transcripciones, el programa ajusta su algoritmo de reconocimiento para aprender el patrón de escritura. Cuantas más páginas se utilicen para el entrenamiento, más preciso será el modelo.
También se recomienda que, tras la transcripción automática, sea importante revisar el texto generado para corregir posibles errores. Aunque Transkribus tiene una precisión bastante alta, especialmente en modelos bien entrenados, siempre será necesario realizar una revisión, especialmente en documentos con escritura inusual o texto dañado. La interfaz Transkribus permite a los usuarios editar fácilmente la transcripción mientras ven el manuscrito original y una vez completada la transcripción, el usuario puede exportar el texto en varios formatos (como TXT, PDF o XML), haciéndolo accesible y con capacidad de búsqueda. Además, Transkribus le permite realizar búsquedas de palabras clave directamente en textos transcritos, lo que facilita la investigación en grandes volúmenes de documentos.
Ante esto, podemos inferir que la inteligencia de la plataforma facilita la investigación histórica, permitiendo acceder rápidamente a grandes volúmenes de documentos antes inaccesibles, permitiendo el descubrimiento de nuevos datos e información sobre el pasado; Permite una mejor conservación de las colecciones y sus respectivos documentos, ya que al digitalizar y transcribir documentos antiguos, Transkribus contribuye a la preservación de los archivos históricos. Se minimiza el manejo de documentos físicos, lo que reduce el riesgo de daños y permite una mayor difusión de estos materiales en formato digital, permitiendo a investigadores de todo el mundo acceder a fuentes que antes estaban confinadas a bibliotecas y archivos específicos.
***
En este contexto, he utilizado la plataforma basada en mi investigación titulada “Derechos de la propiedad en los Andes: las composiciones de tierras ya conformación del espacio andino colonial (siglos XVI-XVII)”, donde, en general, se busca investigar cómo el mecanismo jurídico de las composiciones territoriales, los títulos de propiedad agraria, fue fundamental en la formación del espacio colonial en la región de los Andes, en América del Sur. La plataforma ha sido fundamental para el desarrollo paleográfico de los documentos investigados, en su mayoría en español, lo que también ha contribuido a la mejora del software de transcripción del idioma.
Ante esto, Transkribus tiene varias ventajas. En primer lugar, la herramienta permite a los historiadores manejar grandes volúmenes de material documental en un tiempo mucho más corto del que sería posible con la transcripción manual. Esto significa que fuentes primarias que antes eran prácticamente inaccesibles debido a su formato manuscrito ahora pueden analizarse más rápidamente, ampliando el número de documentos disponibles para su estudio en un solo proyecto de investigación.
Además, el uso de modelos paleográficos específicos en Transkribus, basados en manuscritos de la época colonial, puede aumentar significativamente la precisión de las transcripciones. Como resultado, los documentos coloniales que presentan desafíos paleográficos, como los textos en español o portugués antiguo, se pueden procesar de manera más efectiva. Esto permite una lectura más accesible de los textos, contribuyendo a una interpretación más precisa de los acontecimientos históricos.
***
La herramienta también favorece la democratización del acceso a las fuentes históricas, como ya se ha comentado. Anteriormente, el acceso a documentos escritos a mano requería la presencia física del investigador en archivos y bibliotecas especializados, a menudo en países lejanos, donde algunos de estos investigadores no tenían recursos económicos para viajar. Ahora, utilizando plataformas como Transkribus, es posible transcribir y digitalizar grandes colecciones de documentos, que pueden compartirse en bases de datos digitales accesibles a investigadores de todo el mundo.
La facilidad de acceso y la aceleración del proceso de transcripción abren puertas a nuevas formas de colaboración interdisciplinaria. Los investigadores de diferentes regiones pueden colaborar de manera más eficiente, utilizando las mismas fuentes documentales digitalizadas y transcritas. Esto promueve una visión más integral de la historia colonial a medida que más investigadores pueden contribuir al análisis de fuentes compartidas. Además, proyectos de investigación colaborativos que involucran a historiadores, lingüistas y expertos en ciencia de datos pueden explorar las posibilidades que ofrece Transkribus para profundizar en el estudio de temas como la administración colonial, la vida cotidiana y la interacción entre colonizadores y poblaciones indígenas, así como el corpus documental jurídico y eclesiástico. , haciendo más lúcido y representativo nuestro conocimiento sobre el pasado.
***
El uso de Transkribus tiene implicaciones importantes para el estudio de la América colonial. Al acelerar el proceso de transcripción y aumentar el acceso a documentos primarios, la herramienta puede contribuir a una reinterpretación más amplia de la historia colonial. Más fuentes disponibles para el análisis significan que se escuchan más voces, especialmente aquellas de sectores menos documentados de la sociedad colonial, como los pueblos indígenas, los africanos esclavizados y los campesinos.
Por ejemplo, el acceso a la correspondencia y a los documentos administrativos locales puede revelar matices sobre las interacciones entre diferentes grupos sociales y la gestión de las colonias, ofreciendo una visión más detallada de las estructuras de poder y las dinámicas sociales de la época. Los documentos eclesiásticos, como los registros de bautismo o matrimonio, pueden proporcionar información sobre la resistencia de las poblaciones locales o las estrategias de adaptación a las imposiciones coloniales y religiosas. En este sentido, el software ayuda a explorar nuevas capas de la historia colonial, que anteriormente permanecían oscuras debido a la dificultad de acceder y leer las fuentes.
***
Si bien Transkribus aporta grandes beneficios, es importante reconocer también sus limitaciones. La herramienta todavía depende del entrenamiento inicial de los modelos para que pueda reconocer con precisión manuscritos antiguos. Esto significa que para cada nueva colección de documentos, los investigadores necesitan invertir tiempo en “entrenar” el sistema, corregir errores y ajustar parámetros para obtener mejores resultados. Además, Transkribus aún puede encontrar dificultades al tratar con manuscritos extremadamente degradados o con ortografías muy idiosincrásicas, donde incluso los paleógrafos humanos enfrentan desafíos.
Otro punto es que el uso de herramientas automatizadas no reemplaza completamente la interpretación humana. Aunque el software puede transcribir el contenido de un manuscrito, interpretar los significados, contextos e implicaciones históricas de estos textos aún requiere el conocimiento especializado de los historiadores. Por lo tanto, la herramienta debe verse como una ayuda en el proceso de investigación y no como un sustituto de la experiencia académica. Es esencial que esta tecnología se integre en el trabajo analítico de los historiadores, complementando, pero no reemplazando, el papel fundamental de la interpretación humana en el estudio del pasado.
***
Semblanza: Estudiante de Maestría en Historia del Programa de Posgrado en Historia (UFRN); Participó en el programa de perfeccionamiento de Paleografía y Humanidades Digitales de la Universidad de Texas, Austin; Es licenciado en Historia (UFRN) y tecnológico en Administración (CENEP/SEEC). Como investigador y vocalista forma parte de la Red de Humanidades Digitales de la Universidad Autónoma de México (UNAM), registrada bajo el registro RDH0249. Miembro del Laboratorio de Experimentación de Historia Social (LEHS/UFRN), con foco en proyectos sobre Humanidades Digitales, Bases de Datos e Historia Agraria en América Latina e Historia del Derecho, con enfoque en derechos de propiedad de la tierra. También es investigador del proyecto Mapeo de Colecciones Etnográficas en Brasil (UFF), que tiene como objetivo mapear y difundir colecciones de objetos de poblaciones originarias y tradicionales en museos brasileños. Además, forma parte del Laboratorio de Historia y Patrimonio Cultural de Minas Gerais (PUC-MG). Forma parte del consejo editorial de la revista Espacialidades (UFRN/PPGH), de la revista CLAD vinculada al Centro Latinoamericano de Administración para el Desarrollo, Reforma y Democracia y becario de la CAPES. Sus intereses de investigación incluyen Historia Latinoamericana; Historia del Derecho; Historia agraria; Museología, Memoria y Patrimonio; Colecciones etnográficas; Teoría decolonial y humanidades digitales.
Recientes
arte (2) commons (5) Congresos (4) conocimiento abierto (2) cultura digital (9) Derechos de autor (4) Digital Humanities (9) digitalización (9) DíaHD (2) edición (4) educación (10) educación a distancia (3) educación en línea (11) educación permanente (4) ENEO (3) entorno digital (2) Estudios literarios (4) Eventos (2) Filosofía (8) genealogía (5) Global DH (5) Heidegger (2) Humanidades Digitales (47) Kathleen Fitzpatrick (2) Knowledge society (2) lectura (8) lenguaje (2) literatura (3) medios digitales (3) Modificación de prácticas (15) Multidisciplinariedad (2) México (3) open knowledge (3) preservación digital (3) Procomún (3) redes sociales (4) RedHD (19) sociedad de la información (5) sociedad del conocimiento (6) Tecnología (6) tecnología educativa (14) traducción (3) Twitter (2) UNAM (3) Wikipedia (4)