Memoria digital: la importancia de la preservación de fuentes nacidas digitales
27 julio 2025
27 julio 2025
Por Daniela Dulce Mostacero
Introducción
La sociedad del siglo XXI está dejando sus huellas en entornos digitales. Lo digital no solo se ha integrado en la cotidianidad de nuestras vidas, sino que se ha convertido en un espacio donde esta se desarrolla, se transforma, e incluso, puede verse afectada. En estos entornos se produce y reproduce tanto el conocimiento como las emociones humanas. No cabe duda de que gran parte de la historia de nuestro tiempo será reconstruida utilizando los rastros digitales que hemos creado y almacenado en este ecosistema, caracterizado por generar información de forma constante, masiva y acelerada.
En el presente ensayo exploro cómo lo digital no solamente actúa como un medio de interacción, sino también como un archivo que guarda, parcialmente y de forma fragmentada, la memoria de la experiencia humana contemporánea. Para poder abordar esta memoria digital, compuesta principalmente por fuentes nacidas digitales, es necesario preguntarnos: ¿qué ocurre con toda esa información que se crea y circula en el medio digital? ¿quiénes acceden a ella en el presente y, quienes podrán acceder a ella en el futuro? ¿quiénes la almacenan, y por lo tanto, la controlan? Acaso, ¿toda la información que generamos es conservada? ¿qué información se está dejando de lado? ¿qué usos le dan y qué usos podrían tener mañana?
No se pretende dar respuestas definitivas a estas dudas, pero al plantearlas y ofrecer algunos recursos, se desea que el lector reflexione críticamente sobre la importancia de la preservación de las fuentes nacidas digitales para nuestra propia historia.
La Web 2.0 y las redes sociales, nuevos espacios de sociabilidad y oportunidad de memoria
En la genealogía de la web, el cambio hacia la arquitectura de la Web 2.0 marcó una transformación relevante, que no se reduce a lo técnico, sino que trasciende a lo cultural, social y político. De un modelo estático, en el que los usuarios eran meros receptores pasivos de información, se transitó hacia un modelo participativo e interactivo, que permitió a todos las personas con acceso a internet: crear, interactuar y compartir contenido (Manrique Gálvez, 2016).
El giro a la Web 2.0 se produjo en la década de 2000, con la aparición de plataformas como los blogs, las wikis, las redes sociales, entre otras. Los internautas fueron adaptándose y construyendo espacios donde ampliaron sus posibilidades de ser leídos, de expresar e intercambiar ideas y conocimientos, individuales o colectivas, —así como de perpetuar nuestros prejuicios y estereotipos al ámbito digital—. Se construyeron comunidades digitales influenciados o no por algoritmos. Es decir, con el desarrollo de la Web 2.0 y, específicamente, la propagación de las redes sociales, nuestras formas de sociabilización se extendieron al entorno digital y con ello surgieron nuevas formas de interacción, dominadas por las dinámicas propias del mundo virtual1 y el notable aumento de la participación en línea.
Desde entonces, el número de usuarios de estas plataformas ha crecido exponencialmente y, con ello, las huellas digitales que dejan. Solo en las redes sociales, en 2025, según un reciente informe publicado por We Are Social y Meltwater, el 63.9% de la población las utiliza2: esto es, 5.24 mil millones de usuarios están creando diariamente una inmensa cantidad de datos con sus publicaciones y su actividad en línea. Este cúmulo de información posee un valor incalculable, no solo para las empresas que la comercializan, sino también para las investigadoras e investigadores en humanidades y ciencias sociales que la emplean para analizar el comportamiento de los usuarios, las dinámicas de interacción, discursos políticos, prácticas sociales y culturales en entornos digitales, entre otros.
Si bien esta información es de gran relevancia, es necesario establecer los marcos contextuales en las que ha sido producida. Uno de ellos, y probablemente el más determinante, es el entramado de intereses y políticas bajo los cuales operan las grandes empresas tecnológicas que controlan y explotan el espacio digital. Con ello, se desea advertir que esta nueva conexión no es neutral, responde también a lógicas económicas, comerciales y de poder que condicionan la manera en que interactuamos, especialmente en las plataformas de redes sociales. Por esta razón, es importante reconocer críticamente el espacio en que se crea y circula el registro de la sociedad del siglo XXI, denominada como fuentes nacidas digitales.
Fuentes nacidas digitales: definición y desafíos para la memoria digital
Las fuentes nacidas digitales emergen y solo existen en un entorno digital. A diferencia de los objetos culturales digitalizados, no tienen un equivalente físico y solo es posible acceder a ellas mediante un dispositivo tangible como las computadoras. Además, al igual que otros objetos digitales, para su interacción y reproducción es necesario el uso de programas o sistemas de software.
Actualmente, existe una gran diversidad de fuentes nacidas digitales. Entre ellas se encuentran materiales textuales como revistas y libros digitales, blogs, páginas web, entre otros; correos electrónicos; contenido multimedia como música, videos, imágenes, audios; videojuegos; documentos administrativos digitales, e incluso los propios softwares. También se incluyen en este grupo los datos nacidos digitales, generados a partir de la interacción humana con aplicaciones o plataformas: por ejemplo, el registro de actividad en línea; datos geoespaciales; datos provenientes de redes sociales o servicios de streaming; datos bancarios, entre otros.
Las fuentes nacidas digitales poseen características específicas que deben ser consideradas para su uso, valorización y preservación. El primer rasgo es su volatilidad. La naturaleza de lo digital hace proclive que estas fuentes puedan ser modificadas sin dejar rastro visible, lo que representa un desafío para su análisis. Un caso concreto son las modificaciones que se producen en las notas periodísticas digitales, si bien en diferentes medios de noticias se añade la fecha de publicación y actualización, no se especifica qué partes del texto han sido editadas o eliminadas. Lo mismo ocurre con las redes sociales, donde las publicaciones, comentarios e interacciones pueden ser modificados o borrados por completo, alterando su trazabilidad. Por ejemplo, en el Perú algunos «críticos digitales» del gobierno actual, al ser convocados a ocupar cargos públicos, borraron sus cuentas en X (antes twitter), donde habían expresado críticas contra la gestión de Dina Boluarte; en especial, por su accionar desmedida e ilegal contra los ciudadanos que protestaban. A esta volatilidad de las redes sociales se suma el carácter efímero de algunas publicaciones que están diseñadas para desaparecer después de un tiempo corto.
La volatilidad también se encuentra ligada a la dependencia a empresas tecnológicas. Gran parte de la información que generamos se almacena en servidores controlados por corporaciones como Google, Meta, X, entre otras. Cuando estas plataformas deciden cerrar servicios o cambiar sus políticas, los contenidos pueden simplemente desaparecer. Estas decisiones pueden responder a criterios técnicos o comerciales, pero no siempre se limitan a juicios neutrales. También pueden reflejar decisiones políticas o ideológicas que responden a censuras. Un caso actual fue la suspensión de cuentas palestinas en X en el 2023, estas cuentas informaban sobre la situación en Gaza durante el conflicto con Israel. Esto evidencia cómo la memoria digital puede verse afectada por intereses corporativos que no rinden cuentas ante sus usuarios y la ciudadanía en general.
Sobre la volatilidad de las webs y su contenido, en el 2024, Pew Research Center3 publicó un interesante informe sobre lo efímero de la información en línea. Analizaron páginas webs de los archivos de Common Crawl4 entre 2013 y 2023, descubriendo que el 25% de todas las páginas ya no se encuentran accesibles, y este porcentaje aumentaba con la antigüedad de las páginas. El análisis incluyó sitios web gubernamentales, de noticias, así como la sección de referencias de Wikipedia, concluyendo la existencia de una alta tasa de perdida de información digital. Esto puede deberse a que las fuentes dejan de estar alojadas en el servidor donde originalmente se publicó o porque el url cambió. Contrario a lo que comúnmente se cree, el espacio digital es vulnerable a la desaparición y al olvido.
Un segundo rasgo relacionado con su desaparición es la obsolescencia tecnológica. Los objetos digitales dependen totalmente de la tecnología. Los formatos de archivo, software y hardware utilizados para crear y almacenar fuentes digitales cambian rápidamente, al desactualizarse se corre el peligro de ya no acceder a la información. Por ejemplo, un archivo en formato pdf que hoy puede abrirse sin problemas puede volverse inaccesible en el futuro si el programa o dispositivo que lo lee queda obsoleto.
Por último, como tercer rasgo, y asociado con el surgimiento de la web 2.0, es la abundancia. Como se ha mencionado anteriormente, en los entornos digitales (incluyendo el Dark Web) se crea información de forma constante, masiva y acelerada. Múltiples plataformas producen contenidos en diversos formatos, lo que da lugar a una sobreproducción que genera desorden y saturación informativa (Eiroa, 2018, p. 92). Frente a este panorama, se hace evidente la necesidad de nuevas figuras profesionales como el archivista digital, que pueda estructurar, clasificar y gestionar esta enorme cantidad de datos para garantizar su accesibilidad y uso en el futuro.
Preservar para recordar ¿con qué estudiaremos el siglo XXI en el futuro?
El historiador francés Lucien Febvre (1878-1956), uno de los fundadores de la Escuela de los Annales, amplió el concepto de fuente al afirmar que «todo lo que, siendo del hombre, depende del hombre, sirve al hombre, expresa al hombre, significa la presencia, la actividad, los gustos y las formas de ser del hombre» (1982, p. 232). Esta definición rompió con la concepción tradicional de hacer historia exclusivamente a partir de documentos oficiales y escritas. Hoy, frente al crecimiento exponencial del rastro digital, el planteamiento de Febvre adquiere una renovada vigencia. Si todo vestigio que testimonia la experiencia, la emoción o el conocimiento humano puede ser considerado una fuente histórica, entonces, ¿qué lugar ocupan los registros digitales?
Sin duda, las fuentes nacidas digitales forman (o formarán) parte de los instrumentos para escribir el pasado del siglo XXI. Como señala Anaclet Pons, nunca los historiadores habíamos «dispuesto de tantos y tan variados textos personales» (2011, p. 58) planteando, además, algunas cuestiones que se deberá atender al abordarlos, considerando que con estas nuevas fuentes «por primera vez podremos ver cómo se reaccione ante los grandes acontecimientos en tiempo real» (Pons, 2011, p. 59). Pero el problema no solo será cómo estudiarlos, sino como preservarlos ¿qué medidas se están planteando para salvaguardarlas? Primero, cabe indicar que, al igual con lo que sucede con las fuentes analógicas, es muy probable que las nacidas digitales pasen por procesos de clasificación, selección y descarte, prácticas habituales en bibliotecas y archivos. Ya que, guardar y ordenar todo lo que se genera en el mundo virtual será una tarea inviable, no solo por el almacenamiento, sino también por sostenibilidad.
Actualmente, existen iniciativas orientadas a la protección o preservación de las fuentes nacidas digitales, en su mayoría impulsadas desde el Norte Global. Un ejemplo, es el proyecto de Internet Archive y sus dos herramientas: Archive-It y Wayback Machine. La primera, guarda versiones de las páginas webs; mientras que la segunda permite crear colecciones temáticas de sitios web seleccionados. Otra iniciativa proviene de la Library of Congress de Estados Unidos, que ha ido recolectando materiales digitales desde el 2000. No obstante, incluso esta institución depende de la voluntad de las empresas tecnológicas para preservar parte de la cultura moderna. La donación realizada por Twitter (ahora X) en 2010 es un ejemplo ilustrativo de esta dependencia5.
Asimismo, la Universidad de California ha desarrollado un proyecto que invita a las personas a donar y transferir los datos de cuentas en redes sociales como Instagram o Facebook6, como una forma de capturar las memorias digitales personales.
Reflexiones finales
La memoria digital es todo ese conjunto de información y datos (en diferentes formatos y plataformas) que hemos ido generando en los entornos digitales, y que son de gran relevancia para construir la historia del siglo XXI. No obstante, si no se interviene oportunamente con políticas de preservación, a parte del marco de las empresas tecnológicas, se creará brechas en el registro histórico que podía dejar afuera realidades, voces y experiencias.
Preservar implica tomar medidas preventivas para garantizar la durabilidad y accesibilidad de los materiales a largo plazo. Se trata de minimizar los riesgos o deterioro, lo que implica planificación y voluntad política, institucional y personal. Es necesario asumir una responsabilidad hacia la historia futura, ya que, en gran medida, dependerá del esfuerzo que hoy se realicen para proteger las diversas memorias del presente.
Hasta este punto se ha argumentado, con la mayor claridad posible, la posición de los materiales nativos digitales como fuentes de investigación histórica para el siglo XXI. Sin embargo, esto no implica exclusividad. En la actualidad, lo digital convive con materiales físicos que forman parte del testimonio de la vida social, cultural y política del ser humano y, por lo tanto, son parte del análisis de la historia. Esta coexistencia plantea un escenario híbrido, donde el historiador debe desarrollar nuevas competencias que le permita abordar tanto los materiales analógicos como los materiales digitales en función a las preguntas que guiará su investigación.
Notas a pie de página
1 Cabe precisar que, nuestras formas de sociabilización no se trasladan al entorno digital como una simple reproducción de las prácticas del mundo físico. Por el contrario, han sido transformadas e influenciadas por las dinámicas propias del espacio virtual. Ejemplos de ello son la inmediatez de la comunicación y el anonimato que los usuarios pueden recurrir para evadir las consecuencias de sus discursos.
2 Digital 2025: Informe Global Global — DataReportal – Global Digital Insights
4 Common Crawl, fundado en el 2007, es una institución sin fines de lucro que rastrea y recopila la información pública disponible en internet. Guarda copias del contenido (enlaces, metadatos, texto) y con ello crea una gran base de datos.
5 Twitter dona todo el archivo de tuits a la Biblioteca del Congreso | Biblioteca del Congreso
6 Donar tus redes sociales – Biblioteca de UCSF
Referencias
Eiroa, M. (2018). El pasado en el presente: El conocimiento historiográfico en las fuentes digitales. Ayer. Revista de Historia Contemporánea, 110(2). https://doi.org/10.55509/ayer/110-2018-04
Febvre, L. (1982). Combates por la historia. Editorial Ariel.
Manrique Gálvez, N. (2016). Una alucinación consensual. Redes sociales, cultura y socialización en internet.
Pons, A. (2011). “Guardar como”. La historia y las fuentes digitales. Historia Crítica, 43. https://doi.org/10.7440/histcrit43.2011.04
Semblanza: Daniela Dulce Mostacero, bachiller en Historia por la Universidad Nacional Mayor de San Marcos (Perú), con máster en Historia y Humanidades Digitales por la Universidad Pablo de Olavide (España). Miembro de la Red de Humanidades Digitales y de la Asociación Peruana de Historia y Estudios Sociales de la Ciencia, la Tecnología y la Salud. Participó en el proyecto de recuperación del patrimonio bibliográfico documental del incendio de 1943 en la Biblioteca Nacional del Perú. Me he desempeñado como asistente de investigación para diferentes profesiones e instituciones académicas. He sido voluntaria en la identificación del archivo de María Jesús Alvarado (1878-1971). Actualmente, ocupo el cargo de coordinadora general y líder digital de Coordenadas de Mujeres, proyecto de historia pública digital que cartografía espacios con nombres de mujeres. Mis investigaciones versan sobre políticas de población, salud sexual y reproductiva, crímenes pasionales y humanidades digitales.
Recientes
arte (2) commons (5) Congresos (4) conocimiento abierto (2) cultura digital (9) Derechos de autor (4) Digital Humanities (9) digitalización (10) edición (4) educación (10) educación a distancia (3) educación en línea (11) educación permanente (4) ENEO (3) entorno digital (2) Estudios literarios (4) Eventos (2) Filosofía (8) genealogía (5) Global DH (5) Heidegger (2) Historia (3) Humanidades Digitales (50) Kathleen Fitzpatrick (2) Knowledge society (2) lectura (8) lenguaje (2) literatura (3) medios digitales (3) Modificación de prácticas (15) Multidisciplinariedad (2) México (3) open knowledge (3) preservación digital (4) Procomún (3) redes sociales (4) RedHD (19) sociedad de la información (5) sociedad del conocimiento (6) Tecnología (6) tecnología educativa (14) traducción (3) Twitter (2) UNAM (3) Wikipedia (4)