La búsqueda y recuperación de información: una materia transversal en la archivística moderna

¿Es la recuperación de información, una materia transversal en la archivística moderna? ¿Hasta qué punto es relevante para un archivero conocer los métodos de búsqueda de información en Google? Para dar respuesta justa a estas preguntas, lo primero que hay que considerar es el concepto de Documentación-Archivística y ser plenamente conscientes del contexto en el que vivimos. La archivística es la disciplina encargada del análisis documental de los documentos, generados por las personas físicas y jurídicas en el ejercicio de sus funciones. En este ejercicio, la archivística adapta técnicas ampliamente desarrolladas en los procesos documentales, tales como la catalogación, la clasificación, la indización, y otras específicas como los cuadros de clasificación funcional y orgánicos, los principios de procedencia, herencia descriptiva o de transferencia. Pero el lector no debe olvidar que la razón de ser, tanto de la Archivística, Biblioteconomía y Documentación es, sobre todo, la recuperación de los documentos. Las Ciencias de la Documentación lo son, no por el estudio de la historia del libro o del documento, si no por razones muchas más prácticas; para encontrar la información que se necesita en cada momento. Puntualizo este asunto, ya que existe gran debate y confusión sobre lo que resulta esencial en nuestras disciplinas ¿Cuál es el objetivo final de la biblioteca o el archivo? ¿Para qué se catalogan o clasifican los documentos? ¿Para qué existen las normas y reglas de catalogación? ¿Para qué se ha diseñado toda la tecnología y software de gestión documental? ¿Qué es lo que desean habitualmente los usuarios e investigadores de las bibliotecas y archivos? La clave de todo, está en la búsqueda y recuperación de la información, o de los expedientes y series documentales que cada tipo de usuario demanda. Estas razones son el corazón de los profesionales de la información. Se dice “profesionales”, por su nivel y capacidad para encontrar la información demandada, en corto espacio de tiempo, con precisión y relevancia.

Volviendo al caso de los archivos, probablemente, la localización de una agrupación documental, dependerá de muchos factores. Por ejemplo, del conocimiento de las autoridades que figuran en el documento y, por ende, en la descripción archivística del fondo. Pero también, de la materia, data tópica, palabras clave presentes en la motivación del documento, quizás por alguna de las palabras clave que figuran en las referencias bibliográficas que citan o mencionan el documento en cuestión. En resumen, dependemos de los puntos de acceso, que un experto archivero, tuvo que detectar y referir en la ficha catalográfica de la agrupación documental. Pero tampoco hay que olvidar, que la ficha está automatizada gracias a un software de gestión, inspirado por las Ciencias de la Documentación, y que ha sido programado de tal forma, que resulta óptimo para la recuperación de dichos puntos de acceso. ¿Tarea de informático? No, rotundo. Tarea de archivero con conocimientos en tecnologías de la información y sobre todo “Recuperación de Información”. Así debería de ser, aunque la realidad no lo refleje hoy en día. Sólo un profesional de la archivística con los conocimientos en programación e informática necesarios, puede crear el instrumento perfecto para recuperar de forma eficiente la información y satisfacer las necesidades de la institución para la que trabaja. El conocimiento de la teoría y práctica del archivo, resulta en todo caso, esencial. Por tanto, puede afirmarse que la “Recuperación de Información” es o debería ser nuclear en el desarrollo de cualquier plan de estudios de una carrera de Documentación, tanto en grado como en máster.

Llegados a este punto del artículo, falta responder a la segunda pregunta relativa a los conocimientos de búsqueda de información en Google. Si bien “Recuperación de Información” es una disciplina científico-técnica que aborda los procesos algorítmicos del cálculo de similaridad de los documentos de una colección, su proyección e ingeniería de programación, así como el estudio de la experiencia del usuario y su automatización; la “Búsqueda de Información” es la disciplina que estudia el diseño de estrategias de búsqueda en los distintos sistemas de recuperación de información, también denominados “Buscadores”. Dicho de otra forma, se encarga del diseño óptimo de consultas, para mejorar la pertinencia y relevancia de los resultados obtenidos en cada caso. Por ello, también resulta clave en la formación de los archiveros y por extensión, de todos los bibliotecarios y documentalistas, el conocimiento de tales técnicas y estrategias que favorezcan la recuperación efectiva de la información. Uno de los paradigmas de la búsqueda de información es Google, dada su extensa base de conocimiento y su capacidad para modular los intereses de cada usuario. Google puede ser empleado para buscar contenidos de interés para el archivero, por ejemplo:

http://www.google.es/search?q=inurl:ParesBusquedas+intext:%22Búsqueda+del+usuario%22

Con este enlace de tipo RESTful, el usuario realizará una búsqueda directa en el Portal de Archivos Españoles PARES, sin necesidad de acceder a su página principal, reduciendo el tiempo de ejecución de la búsqueda y optimizando los resultados del buscador. La consulta en cuestión se compone de un operador “inurl” que contiene un fragmento de la dirección URL de la página web PARES, presente en los resultados de las búsquedas efectuadas con su aplicación. Si se añade el operador “intext” y las comillas dobles para “búsqueda literal”, se puede especificar una frase, expresión o palabra compuesta, que deberá estar presente entre los documentos recuperados. Este sencillo ejemplo, demuestra que el conocimiento, tanto de los operadores de búsqueda, como del funcionamiento del buscador Google, pueden ser una baza muy favorable para el archivero. Pero observemos un ejemplo real:

http://www.google.es/search?q=-direccion+-calle+-domicilio+intext:%22Hernan+cortes%22+america+(site:gob.es+OR+site:doi.org)

En este caso, se define la recuperación de documentos en los que se menciona expresamente “Hernán Cortés” y su actividad en América. Sin embargo, es necesario eliminar el ruido relativo a las calles, direcciones, domicilios en los que puede figurar su nombre. Por otra parte, se declara que la recuperación debe restringirse a sitios web del dominio del gobierno de España y artículos científicos publicados con numeración de tipo DOI. Probablemente el resultado de la recuperación, sea pertinente para estudiar algún hecho concreto del conquistador, en relación a unos legajos recientemente hallados en el Archivo de Indias. En conclusión, se evidencia la importancia de la búsqueda avanzada o experta en buscadores, y de la recuperación de información, para el desempeño profesional en nuestra área de conocimiento. Quiero finalizar este artículo con una cita de Friedrich Nietzsche que ya advirtió la importancia del asunto aquí tratado “Desde que me cansé de buscar he aprendido a hallar”.


 

Estrategias de búsqueda experta en Google

El profesor Manuel Blázquez ha publicado recientemente el libro titulado “Estrategias de búsqueda experta en Google” en el que aborda la base teórica y práctica de la búsqueda de información, los operadores de consulta de Google y más de 200 ejemplos de búsquedas avanzadas para el entrenamiento de las habilidades de recuperación de información. El libro puede adquirirse en Amazon en formato eBook y en Paperback.