Manuel Blázquez Ochando

Profesor y premio extraordinario de Doctorado por la Facultad de Ciencias de la Documentación de la Universidad Complutense de Madrid. Sus líneas de investigación están orientadas al estudio de la recuperación de información, el desarrollo de aplicaciones documentales, la automatización de unidades de información, la webmetría, redifusión masiva de contenidos y métodos de transmisión de catálogos bibliográficos.

La búsqueda y recuperación de información: una materia transversal en la archivística moderna

¿Es la recuperación de información, una materia transversal en la archivística moderna? ¿Hasta qué punto es relevante para un archivero conocer los métodos de búsqueda de información en Google? Para dar respuesta justa a estas preguntas, lo primero que hay que considerar es el concepto de Documentación-Archivística y ser plenamente conscientes del contexto en el que vivimos. La archivística es la disciplina encargada del análisis documental de los documentos, generados por las personas físicas y jurídicas en el ejercicio de sus funciones. En este ejercicio, la archivística adapta técnicas ampliamente desarrolladas en los procesos documentales, tales como la catalogación, la clasificación, la indización, y otras específicas como los cuadros de clasificación funcional y orgánicos, los principios de procedencia, herencia descriptiva o de transferencia. Pero el lector no debe olvidar que la razón de ser, tanto de la Archivística, Biblioteconomía y Documentación es, sobre todo, la recuperación de los documentos. Las Ciencias de la Documentación lo son, no por el estudio de la historia del libro o del documento, si no por razones muchas más prácticas; para encontrar la información que se necesita en cada momento. Puntualizo este asunto, ya que existe gran debate y confusión sobre lo que resulta esencial en nuestras disciplinas ¿Cuál es el objetivo final de la biblioteca o el archivo? ¿Para qué se catalogan o clasifican los documentos? ¿Para qué existen las normas y reglas de catalogación? ¿Para qué se ha diseñado toda la tecnología y software de gestión documental? ¿Qué es lo que desean habitualmente los usuarios e investigadores de las bibliotecas y archivos? La clave de todo, está en la búsqueda y recuperación de la información, o de los expedientes y series documentales que cada tipo de usuario demanda. Estas razones son el corazón de los profesionales de la información. Se dice “profesionales”, por su nivel y capacidad para encontrar la información demandada, en corto espacio de tiempo, con precisión y relevancia.

Volviendo al caso de los archivos, probablemente, la localización de una agrupación documental, dependerá de muchos factores. Por ejemplo, del conocimiento de las autoridades que figuran en el documento y, por ende, en la descripción archivística del fondo. Pero también, de la materia, data tópica, palabras clave presentes en la motivación del documento, quizás por alguna de las palabras clave que figuran en las referencias bibliográficas que citan o mencionan el documento en cuestión. En resumen, dependemos de los puntos de acceso, que un experto archivero, tuvo que detectar y referir en la ficha catalográfica de la agrupación documental. Pero tampoco hay que olvidar, que la ficha está automatizada gracias a un software de gestión, inspirado por las Ciencias de la Documentación, y que ha sido programado de tal forma, que resulta óptimo para la recuperación de dichos puntos de acceso. ¿Tarea de informático? No, rotundo. Tarea de archivero con conocimientos en tecnologías de la información y sobre todo “Recuperación de Información”. Así debería de ser, aunque la realidad no lo refleje hoy en día. Sólo un profesional de la archivística con los conocimientos en programación e informática necesarios, puede crear el instrumento perfecto para recuperar de forma eficiente la información y satisfacer las necesidades de la institución para la que trabaja. El conocimiento de la teoría y práctica del archivo, resulta en todo caso, esencial. Por tanto, puede afirmarse que la “Recuperación de Información” es o debería ser nuclear en el desarrollo de cualquier plan de estudios de una carrera de Documentación, tanto en grado como en máster.

Llegados a este punto del artículo, falta responder a la segunda pregunta relativa a los conocimientos de búsqueda de información en Google. Si bien “Recuperación de Información” es una disciplina científico-técnica que aborda los procesos algorítmicos del cálculo de similaridad de los documentos de una colección, su proyección e ingeniería de programación, así como el estudio de la experiencia del usuario y su automatización; la “Búsqueda de Información” es la disciplina que estudia el diseño de estrategias de búsqueda en los distintos sistemas de recuperación de información, también denominados “Buscadores”. Dicho de otra forma, se encarga del diseño óptimo de consultas, para mejorar la pertinencia y relevancia de los resultados obtenidos en cada caso. Por ello, también resulta clave en la formación de los archiveros y por extensión, de todos los bibliotecarios y documentalistas, el conocimiento de tales técnicas y estrategias que favorezcan la recuperación efectiva de la información. Uno de los paradigmas de la búsqueda de información es Google, dada su extensa base de conocimiento y su capacidad para modular los intereses de cada usuario. Google puede ser empleado para buscar contenidos de interés para el archivero, por ejemplo:

http://www.google.es/search?q=inurl:ParesBusquedas+intext:%22Búsqueda+del+usuario%22

Con este enlace de tipo RESTful, el usuario realizará una búsqueda directa en el Portal de Archivos Españoles PARES, sin necesidad de acceder a su página principal, reduciendo el tiempo de ejecución de la búsqueda y optimizando los resultados del buscador. La consulta en cuestión se compone de un operador “inurl” que contiene un fragmento de la dirección URL de la página web PARES, presente en los resultados de las búsquedas efectuadas con su aplicación. Si se añade el operador “intext” y las comillas dobles para “búsqueda literal”, se puede especificar una frase, expresión o palabra compuesta, que deberá estar presente entre los documentos recuperados. Este sencillo ejemplo, demuestra que el conocimiento, tanto de los operadores de búsqueda, como del funcionamiento del buscador Google, pueden ser una baza muy favorable para el archivero. Pero observemos un ejemplo real:

http://www.google.es/search?q=-direccion+-calle+-domicilio+intext:%22Hernan+cortes%22+america+(site:gob.es+OR+site:doi.org)

En este caso, se define la recuperación de documentos en los que se menciona expresamente “Hernán Cortés” y su actividad en América. Sin embargo, es necesario eliminar el ruido relativo a las calles, direcciones, domicilios en los que puede figurar su nombre. Por otra parte, se declara que la recuperación debe restringirse a sitios web del dominio del gobierno de España y artículos científicos publicados con numeración de tipo DOI. Probablemente el resultado de la recuperación, sea pertinente para estudiar algún hecho concreto del conquistador, en relación a unos legajos recientemente hallados en el Archivo de Indias. En conclusión, se evidencia la importancia de la búsqueda avanzada o experta en buscadores, y de la recuperación de información, para el desempeño profesional en nuestra área de conocimiento. Quiero finalizar este artículo con una cita de Friedrich Nietzsche que ya advirtió la importancia del asunto aquí tratado “Desde que me cansé de buscar he aprendido a hallar”.


 

Estrategias de búsqueda experta en Google

El profesor Manuel Blázquez ha publicado recientemente el libro titulado “Estrategias de búsqueda experta en Google” en el que aborda la base teórica y práctica de la búsqueda de información, los operadores de consulta de Google y más de 200 ejemplos de búsquedas avanzadas para el entrenamiento de las habilidades de recuperación de información. El libro puede adquirirse en Amazon en formato eBook y en Paperback.

El Archivo digital está permitiendo ahorrar un tiempo precioso al investigador: Entrevista a Manuel Blázquez, profesor de la UCM

El profesor Manuel Blázquez Ochando de la Facultad de Ciencias de la Documentación de la Universidad Complutense de Madrid, es un conocido investigador en el ámbito de las tecnologías de la documentación. Sus principales líneas de investigación son el desarrollo de herramientas documentales, la automatización de unidades de información, webmetría, técnicas de sindicación de contenidos aplicada a la gestión de catálogos bibliográficos, recuperación de información, fuentes de Información especializadas en ciencia y tecnología y desarrollo de nuevas tecnologías.

(Archivoz) Hola Manuel, gracias por participar en esta breve entrevista con Archivoz. Iré al grano: El avance tecnológico ha supuesto un cambio importante en la gestión archivística y documental, ¿En qué aspectos crees que ha tenido mayor impacto?

(Manuel Blázquez) La automatización y la digitalización de los archivos es la clave. Desde mi perspectiva, la de profesor de Ciencias de la Documentación, puedo afirmar que los sistemas de gestión de archivos son la base para el mejor aprovechamiento de la documentación permanente. Esto no sólo se limita a la digitalización de los documentos, también la descripción, transcripción, identificación de autoridades, asignación de metadatos, que favorecerán la recuperación a texto completo de la colección. Estos procesos son los que han constituido el cambio de paradigma en los archivos en los últimos 10 años.

(Archivoz) Sin duda, lo que señalas ha transformado el acceso a los documentos, pero ¿Qué impacto han tenido la digitalización y la automatización para el investigador?

(MB) Creo que la introducción de nuevas tecnologías en el archivo ha favorecido los procesos de consulta e investigación de los fondos y agrupaciones documentales. Acceder a un expediente hace 20 años, podía considerarse una tarea complicada, lenta, sujeta a las restricciones del acceso físico. Hoy en día la digitalización, la introducción de bases de datos para la recuperación a texto completo, métodos automatizados de gestión del ciclo vital de los documentos, entre otros, ha permitido que cualquier investigador pueda consultar la documentación desde su despacho con todo detalle, incluso entrar en contacto con los archiveros para realizar otras operaciones. La necesidad de digitalizar y mejorar la automatización en los archivos, también ha ayudado a mejorar el control sobre las colecciones, descubriendo fallos de descripción, colecciones no identificadas y todo tipo de problemas que se han podido subsanar o que están en vías de ser solucionados. Esto significa que una mayor digitalización y descripción de las colecciones, ayuda al Archivo a reafirmar su control y dominio sobre los contenidos e instituciones a las que da servicio. 

(Archivoz) ¿El desarrollo tecnológico, por tanto, disminuye la consulta presencial de los documentos?

(MB) En efecto, el Archivo digital está permitiendo ahorrar un tiempo precioso al investigador, evitándole viajes innecesarios al archivo. La consulta al archivo físico tendrá lugar cuando el fondo al que pretenda acceder no se encuentre digitalizado, o bien, debido a la naturaleza del estudio, sea necesario un análisis de los soportes y materiales en los que se materializó el documento, incluso si existe la necesidad de cotejo. Sin embargo, lo que es seguro, es que la visita al Archivo Histórico se verá cada vez más reducida conforme avancen los proyectos de digitalización. Aunque también es necesario advertir que, de acuerdo a los fondos y financiación disponible, ésta sea una tarea a largo plazo.

(Archivoz) ¿Se tenderá, por tanto, hacia la consulta online de documentos?

(MB) Imagine que los investigadores ahora no van a necesitar pasar las páginas de un legajo o un incunable de incalculable valor, o bien un libro tumbo. Esto va a favorecer la conservación de los documentos y ser más selectivos con las consultas al documento físico, sólo en aquellos casos en que la naturaleza de la investigación lo justifique.

(Archivoz) Todo ello será clave en la preservación de documentos, ¿verdad?

(MB) La clave de la preservación de los documentos en el contexto del archivo es la organización del sistema archivístico de cada país. Parece razonable determinar un plan de identificación de documentos vitales para las instituciones en base a sus valores y usos, que dé como resultado un catálogo con los tipos de documentos “Salvables” que siempre deberán ser preservados, desde un punto de vista físico y digital. Esto significa que los documentos deben ser controlados, incluso antes de su nacimiento, para que su ciclo vital pueda ser derivado a los archivos que corresponda, hasta que pueda corroborarse su valor, transferencia o expurgo si fuera necesario. Esto ayudaría a evitar las duplicaciones documentales cuando la documentación es transferida al Archivo Central y sobre todo a reducir el volumen documental, que en muchos casos es inasumible. Esto significa que, quizás el modelo más conveniente para la gestión de la documentación archivística es una síntesis de la tradición alemana, americana y española. El método alemán debido a la capacidad para predecir la documentación que se generará en cada trámite y proceso administrativo y a la organización en los archivos. El método americano, por su pragmatismo y efectividad en el discernimiento de los documentos históricos y los documentos esenciales para el funcionamiento del gobierno. El modelo español por la diferenciación correcta de las edades del documento de archivo y su razonable proceso de maduración. Como puede desprenderse, no hay un sistema perfecto, y en todo caso, la clave de la preservación pasa por definir correctamente el modelo archivístico del país y sobre todo los procesos de tramitación inter-archivos.

(Archivoz) ¿Cuáles serán los próximos avances en materia de automatización?

(MB) Aún hay mucho trabajo que hacer en materia de automatización de Archivos. Por ejemplo, software que permita gestionar el ciclo vital de los documentos desde su génesis hasta su depósito en el archivo histórico; mejores sistemas de control físico de los documentos en los archivos, métodos de búsqueda semántica a través de metadatos de archivo, etc. Creo que los profesionales de la Documentación y, por ende, de los Archivos, necesitan adquirir más conocimientos en tecnologías para pasar de ser meros consumidores de software a ser desarrolladores activos que puedan plasmar sus ideas y métodos de funcionamiento. Esto es no depender únicamente de la concepción de un profesional de la informática y disponer de nuestros propios especialistas en tecnologías, que sean capaces de desarrollar sistemas más adaptados y adecuados a nuestras necesidades. Creo que se tiene que hacer una apuesta formativa importante en esta línea y adaptar los planes de estudio, conforme a los conocimientos de los principales especialistas en nuestro país.