“Todos los registros de autoridad tendrán que vincularse a wikidata o terminarán siendo irrelevantes”: entrevista a Tomás Saorín, profesor en la Universidad de Murcia

Archivoz asistió al Wikidata Glam Workshop con motivo del 6º aniversario del proyecto Wikidata de la fundación Wikimedia, celebrado el pasado 25 de octubre en el Archivo general de la Región de Murcia. Unas jornadas enfocadas a los y las profesionales de la información, de los archivos y las bibliotecas. Para entender cómo puede ayudar esta herramienta colaborativa a los profesionales de los archivos contamos con Tomás Saorin, coordinador de las jornadas.

(Archivoz)- Tomás, ante todo gracias por atendernos, ¿En qué se diferencia Wikidata de Wikipedia?

(Tomás Saorin)- Es muy sencillo. Wikipedia es algo con mucha tradición en su formato: artículos de enciclopedia. Para cada asunto notable hay un artículo que es diferente en cada idioma. Un artículo en alemán puede ser muy bueno, y el mismo artículo en portugués estar muy incompleto, porque están hechos por comunidades de editores diferentes. Los artículos entre sí no están sincronizados, tienen un ciclo de vida propio. Wikidata es, por el contrario, una base de datos estructurada (un grafo de conocimiento) donde se almacenan en un único sitio los datos factuales que deberían ser iguales para un mismo contenido: la fecha de fallecimiento de una persona, las coordenadas de una ciudad, etc. Para cada concepto, objeto o hecho Wikidata almacena sus datos factuales, que luego podrán ser reutilizados en cualquier Wikipedia, porque son independientes del idioma.

(Archivoz)- ¿Y qué utilidad tienen estos datos, si lo que los usuarios leen son los artículos de Wikipedia?

(TS) Tienen mucho valor. Cuando buscamos en Google a menudo localizamos documentos, de cuya lectura obtenemos información o respuestas. Pero cuando queremos respuestas concretas del tipo ¿Cuál es la temperatura de ebullición del agua? sabemos que hay respuestas concretas, y no un conjunto de páginas en las que podemos leer la respuesta. Muchos de esos datos se están volcando de manera colaborativa y abierta en la plataforma Wikidata, de forma que numerosas aplicaciones podrán interactuar con ella para enriquecerse de significados y datos precisos. Las grandes empresas están creando sus grafos, pero son cerrados. Este es un grafo de alcance universal y con un formato y diseño abierto. Y además de abierto, semántico, es decir, que puede ser entendido por máquinas y puede servir para almacenar y compartir muchos tipos de conjuntos de datos que ahora están encerrados en silos: podríamos tener toda la catalogación de las obras de Mozart, o la lista de todos los bienes declarados de interés cultural en una zona, o el lugar donde han estudiado los diputados de una legislatura, y además combinarlo todo.

(Archivoz)- ¿Pero de verdad Wikidata es relevante para los archivos, o solo para el ámbito de la comunicación relacionada con las industrias culturales (medios, bibliotecas, patrimonio)?

(TS)- Los archivos poseen un acervo de documentos y fondos relevantes para la historia social y cultural de sus comunidades, y su acceso es laborioso. Una de las formas de acceso son las autoridades personales, de familia y de organizaciones, y para estas tres entidades, Wikidata permite enriquecimiento de datos que los sistemas de archivos por sí solos no pueden alcanzar. Además, integrarse en las redes de datos enlazados abiertos permite descubrir contenidos partiendo desde una fuente en el campo patrimonial (museo) y que terminemos en una fuente de información de archivos: supone pasar de un nicho especializado a estar presentes en cualquier otro ámbito de información que explote la web semántica. Se multiplican las posibilidades de descubrimiento. Los registros de autoridad convencionales de bibliotecas y archivos poseen información de valor que puede elevar la calidad de los registros de Wikidata, y a la inversa, en Wikidata hay numerosos aspectos de valor que mejoran la calidad de los registros de autoridad. Hay un beneficio espectacular, visible cuando se alcance cierta masa crítica en contenidos y cierto éxito de algunos proyectos demostrativos de consumo e interconexión de datos. Más pronto que tarde todos los registros de autoridad tendrán que vincularse a Wikidata o terminarán siendo irrelevantes.

(Archivoz)- ¿Todos esos datos no están ya disponibles en la web?

(TS)- En la web hay un caos accesible, podemos encontrar algo de casi todo, pero no siempre en un formato que nos permita usarlo en aplicaciones. La búsqueda en la web obtiene documentos, textos, discurso. La búsqueda en Wikidata nos da resultados, tablas, conjuntos de datos estructurados. Y no es un recurso ajeno, podemos enriquecer y editar sus datos, ampliar la cobertura y obtener beneficio de la vinculación entre datos de contextos diferentes. Nuestro registro de autoridad puede contener un elemento sobre los músicos Albéniz o Granados y su fecha de fallecimiento, pero al conectarse con Wikidata también podemos saber la causa de su muerte, de modo que nuestros sistemas de información permitan descubrir información a partir de elementos no previstos: documentos de personas que hayan fallecido en un accidente naval.

(Archivoz)- Como profesor de la facultad de Comunicación y Documentación de la Universidad de Murcia, ¿Cómo ves el futuro de los profesionales de los archivos?

(TS)- Pues los requisitos de formación son cada vez  más exigentes, pero veo una importante diferencia entre quienes ya forman parte de la profesión, y por lo tanto pueden acceder a acciones de formación continuada dentro de su contexto, y quienes están fuera buscando acceder al mercado de trabajo. Hay dos perfiles, el gestor de documentos, que cada vez necesita una mayor comprensión de los elementos tecnológicos del ciclo de vida de los documentos, seguridad, interoperabilidad, etc. y aquellos centrados en los fondos históricos. Estos últimos tienen que integrar sus colecciones en la web semántica; los portales de memoria han de mejorar mucho para tener cierta relevancia – o, digamos, oportunidad de atención, en la web y generarse servicios más creativos que combinen información propia con externa. El trabajo de descripción tiene que generar más valor, conectando fondos propios con externos, evitando el efecto silo. Y eso requiere que el archivero que lidere proyectos de difusión digital, portales de memoria, tiene que conocer cómo publicar con calidad en la web de datos, cómo publicar conjuntos de datos. Y eso requiere combinar destrezas de áreas de publicación digital que en muchos proyectos digitales de archivos y patrimonio no terminan de plasmarse en toda su potencia. Edición digital, publicación web, aplicación de ontologías, discovery, …
El perfil de gestor de documentos puede llegar a ocupar posiciones estratégicas en la gestión de información de las organizaciones, con participación en la mejora de procesos y flujos de trabajo. La línea de formación de la ESAGED define un área profesional muy relevante, con un perfil de analista que aporta mucho valor a las organizaciones.

Un taller en el que se pudo comprobar las inquietudes de los profesionales de la información, bibliotecarios y archiveros de la Región de Murcia vinculados al patrimonio cultural y los datos abiertos en las sucesivas intervenciones de los asistentes y las repuestas que obtuvieron de los organizadores del Wikidata Glam Worshop.