Comparación de dos Bancos de Datos para apoyar procesos técnicos: Bibliofile y CD-Marc Bibliographic


Filiberto F. Martínez Arellano

Centro Universitario de Investigaciones Bibliotecológicas de la Universidad Nacional Autónoma de México

Jorge Gómez Briseño

Dirección General de Bibliotecas de la Universidad Nacional Autónoma de México


Antecedentes

Sin duda alguna, la aparición en 1985 de Bibliofile, el primer banco de datos producido en disco compacto conteniendo los registros MARC de la Biblioteca del Congreso de los Estados Unidos, vino a revolucionar las actividades de procesos técnicos en las bibliotecas. Previamente a su aparición, las bibliotecas tenían que hacer uso de costosos sistemas en línea como OCLC (Online Computer Library Center) o RLIN (Research Libraries Information Network), para efectuar sus actividades de catalogación.

Cabe mencionar que estos sistemas estaban fuera del alcance de nuestras bibliotecas, por lo que hasta entonces habíamos utilizado como herramientas básicas para apoyar nuestros procesos técnicos los registros del catálogo de la Biblioteca del Congreso de los Estados Unidos (NUC-National Union Catalog), en papel o microficha, o bien el MARC Fiche, catálogo que incluía los mismos registros pero producido por The Library Corporation.

El banco de datos Bibliofile contiene registros que son de extrema utilidad para realizar las actividades de catalogación, clasificación y asignación de encabezamientos de materia, por lo que hacia finales de 1988, el Departamento de Procesos Técnicos de la Dirección General de Bibliotecas de la UNAM tomó la decisión de adquirirlo por considerar que sería una adecuada herramienta para apoyar la catalogación de los aproximadamente 50,000 títulos que adquieren anualmente las 164 bibliotecas de este enorme sistema bibliotecario.

A partir de esa fecha, Bibliofile fue utilizado como la herramienta básica para efectuar los procesos técnicos.

Por otro lado, en septiembre de 1991, la Biblioteca del Congreso de los Estados Unidos anunció la aparición de CDMARC Bibliographic, un banco de datos que contendría los registros MARC de la Biblioteca del congreso, el cual sería producido por la propia Biblioteca del Congreso y distribuído a través de su Cataloging Distribution Service (Library of Congress, 1991b).

Este hecho vino a revolucionar de nueva cuenta las actividades de procesos técnicos en las bibliotecas, pues podrían contar con un disco compacto producido por la Biblioteca del Congreso conteniendo sus propios registros MARC.

Adicionalmente, otros dos discos, CDMARC Names y CDMARC Subjects, los cuales incluyeron los catálogos de autoridad de esta biblioteca fueron también puestos a disposición de otros bibliotecas. Respecto a las características de CDMARC Bibliographic, Khurshid (1991) ha señalado una serie de ventajas de éste sobre Bibliofile: mayor cantidad de registros, numerosos puntos de acceso y de más facilidad en las búsquedas, debido a la incorporación de diversas opciones para recuperar la información.

No obstante que Bibliofile había sido utilizado exitosamente dentro del Departamento de Procesos Técnicos de la Dirección General de Bibliotecas de la UNAM, la mayor cantidad de información contenida en CDMARC Bibliographic y la gran diversidad de opciones para buscar y recuperar la información, motivaron su adquisición. Se consideró que CDMARC Bibliographic podría ser una mejor opción para apoyar las actividades de catalogación y clasificación.

Aunque se asumió que CDMARC Bibliographic tendría ventajas sobre Bibliofile, era necesario comprobar lo anterior, por lo que en los últimos meses de 1992 se llevó a cabo un estudio para determinar cual de los dos bancos de datos era de mayor utilidad para apoyar las actividades de procesos técnicos.

Este artículo presenta los resultados de ese estudio, cuyo objetivo fue comparar CDMARC Bibliographic y Bibliofile en relación al número y porcentaje de registros catalográficos encontrados en ambos bancos, así como en relación al tiempo utilizado para localizar los registros.

Por otra parte, llevar a cabo este estudio fue considerado importante, pues si bien es cierto que se han realizado diversos trabajos para comparar la efectividad de Bibliofile con otros bancos de datos conteniendo registros catalográficos (Allan, 1990; Brennan, 1989; Giesbrecht, 1988), sólo uno de ellos ha sido comparado con CD-MARC Bibliographic (Khurshid, 1991) 

Banco de datos Bibliofile

Al efectuar este estudio, Bibliofile estaba integrado por seis discos compactos que contenían cerca de cuatro millones y medio de registros correspondientes a libros, mapas, publicaciones periódicas, música, material audiovisual y publicaciones oficiales editados en los Estados Unidos y Canadá.

A la fecha, el número de discos, al igual que el número de registros incluidos en éstos, ha crecido considerablemente. Cuatro de los discos compactos incluían los registros de material en Inglés (Bibliofile English) y dos contenían los registros pertenecientes a los materiales en otros idiomas (Bibliofile Foreign Language).

Los índices de los registros estaban incluidos en el disco con el número más alto dentro de cada grupo, el disco número 4 para los materiales en inglés y el disco número 6 para los materiales en otros idiomas. Este banco de datos tiene una actualización mensual y cuatrimestral.

El software de Bibliofile permite efectuar búsquedas a través de seis puntos básicos de acceso: título, autor (el cual puede ser combinado con el título), LCCN (Número de tarjeta de la Biblioteca del Congreso), ISBN (Número internacional del libro), ISSN (número internacional de serie) y GPO (Número para las publicaciones del gobierno de los Estados Unidos).

Bibliofile no cuenta con la capacidad de emplear operadores booleanos en sus búsquedas, a excepción de uno implícito "AND" cuando se utilizan calificadores en algunos tipos de búsqueda. La utilidad de estos calificadores es limitada, pues únicamente permiten al usuario añadir una o dos letras del nombre del autor en una búsqueda por título, o bien un año o rango de años, páginas o tipo de publicación. En las búsquedas por autor y título es posible utilizar truncación. Asimismo, al emplear LCCN es factible omitir los ceros y en el ISBN los guiones pueden ser eliminados ("Bibliofile", 1987; Morrow, 1988).

Bibliofile permite al catalogador efectuar búsquedas en el banco de datos, editar los registros encontrados, agregando o modificando datos de acuerdo a las necesidades de la biblioteca, salvar estos registros en un disco flexible para su posterior revisión, o bien exportarlos a un banco de datos local.

Por otro lado, en Bibliofile se ha incluido un programa que permite la creación de registros catalográficos nuevos, es decir, se puede utilizar como un sistema de catalogación en línea. Asimismo, es posible imprimir juegos de tarjetas y etiquetas que pueden incluir la clasificación de las obras (Andres, 1993)

Para su manejo, Bibliofile requiere una computadora IBM PC o compatible, Sistema Operativo MS DOS 3.0+, Lenguaje Microsoft C versión 5 y una capacidad en disco duro de 512K. El software fue escrito para consola lectora de discos compactos Hitachi CD-ROM, por lo que este tipo de equipo lector es necesario (Matthews, 1991; Morrow, 1988). La existencia de una impresora es indispensable si se desea obtener tarjetas, etiquetas o registros impresos.

Banco de datos CDMARC Bibliographic

En el momento en que se efectuó este estudio, CDMARC Bibliographic estaba integrado por siete discos compactos, que contenían cerca de cinco millones de registros correspondientes a libros, mapas, publicaciones periódicas, materiales audiovisuales, música, publicaciones oficiales y programas para computadora. CDMARC Bibliographic incluye registros de materiales editados en la mayoría de los idiomas del mundo.

Adicionalmente, diversos materiales en idiomas que utilizan alfabetos no romanos han sido incorporados dentro de este banco de datos (Library of Congress, 1991B). Su actualización se efectúa cuatrimestralmente.

CDMARC Bibliographic permite la localización de los registros por numerosos puntos de acceso: autor personal, autor corporativo, nombres de congresos y conferencias, título, serie, temas, editor, número de clasificación de la biblioteca del Congreso, número de clasificación Dewey, número de registro, número internacional del libro (ISBN), Número internacional de serie (ISSN), número de publicación para música, idioma, país de publicación, año de publicación, formato, descripción física.

También es factible una combinación de todos los puntos de acceso anteriormente señalados, al igual que la utilización de los operadores booleanos AND NOT y NOT. La utilización de palabras claves es posible en todos los campos indizados(Library of Congress, 1991a; Library of Congress, 1991b).

Para su manejo CDMARC Bibliographic requiere del siguiente equipo: una computadora PC/XT/AT/PS2 modelo 30 o compatible, sistema operativo DOS versión 3.1 o superior, 5 megabytes libres en el disco duro de la computadora, 530 bytes libres de memoria RAM, una consola lectora de discos compactos marca Hitachi que sea compatible con el sistema operativo Microsoft 2 (Library of Congress, 1991a).

Metodología del estudio

Para llevar a cabo el estudio se seleccionó una muestra de 200 títulos, que pertenecían al material que ingresaba al Departamento de Procesos Técnicos para su catalogación y clasificación. La muestra incluyó materiales en inglés así como en otros idiomas. Respecto a la fecha de publicación de los materiales, se tuvo el cuidado de elegir únicamente aquellos publicados a partir de 1965, puesto que ese es el periodo que cubren los registros incluidos en Bibliofile y CDMARC Bibliographic.

La búsqueda de los 200 títulos seleccionados fue efectuada por un catalogador con experiencia en el uso de ambos bancos de datos. Aunque CDMARC Bibliographic cuenta con una gran diversidad de puntos de acceso, únicamente se utilizaron en las búsquedas el ISBN, LCCN, autor y título, ya que ambos bancos de datos cuentan con estas posibilidades.

La información que se procuró localizar fue:

  1. Registros idénticos. Ficha correspondiente a la obra por catalogar.
  2. Registros de otras ediciones. Fichas incluyendo el título en el mismo idioma, pero que presentaban variantes tales como: diferente número de edición, diferente nombre de la serie, o bien, otro lugar de publicación, editorial o ISBN.
  3. Registros en otros idiomas. Fichas correspondientes a los títulos originales de las obras por catalogar, o bien, ediciones publicadas en otros idiomas. En el caso de obras publicadas en español, las fichas buscadas generalmente fueron las correspondientes a ediciones en inglés, francés, italiano y alemán.
  4. Registros similares. Fichas correspondientes a obras con títulos similares cuyos temas y clasificación podían ser de utilidad para el proceso de catalogación.

Primeramente se buscaron los materiales en el banco de datos Bibliofile y posteriormente en CDMARC Bibliographic. Al efectuar la búsqueda en Bibliofile no se imprimieron los registros de los títulos localizados, ni tampoco se copiaron datos de las portadas de los materiales.

Lo anterior tuvo la finalidad de no influir y afectar la búsqueda en CDMARC Bibliographic, pues se consideró que si se hubiesen tenido esos datos, el catalogador encargado de esa tarea hubiera tratado forzosamente de recuperar el registro en la segunda búsqueda sin importarle el tiempo utilizado. A diferencia de la búsqueda en Bibliofile, al efectuar la búsqueda en CDMARC Bibliographic se imprimieron las fichas encontradas.

Las búsquedas fueron realizadas a lo largo de una semana. En ambas fases del estudio se registró el tipo de información obtenida en cada una de las búsquedas y la duración de las sesiones en que se llevaron a cabo, con la finalidad de poder efectuar la tabulación y análisis de los datos al final.

Resultados

Como se mencionó con anterioridad, el objetivo de este estudio fue comparar el número y porcentaje de registros catalográficos encontrados en CDMARC Bibliographic y Bibliofile que eran de utilidad para efectuar las actividades de catalogación; así como el tiempo empleado en dichas búsquedas.

La tabla 1 presenta los resultados en relación al primer aspecto y la tabla 2 los correspondientes al segundo.

 Tabla 1. Comparación entre materiales localizados y no localizados.

 

Bibliofile

CDMARC Bibliographic

Registros localizados 157    (79%) 180   (90%)
Idénticos   47     (24%)   59   (30%)
Otras ediciones   17   (8%)   21 (10%)
Otros idiomas   19     (10%)   28     (14%)
Similares   74     (37%)   72 (36%)
Registros no localizados   43     (21%)   20     (10%)
Tota 200 (100%) 200 (100%)

 Al analizar los resultados obtenidos, podemos darnos cuenta que en CDMARC Bibliographic se encontró una mayor cantidad de registros para apoyar las actividades de catalogación.

En Bibliofile únicamente se localizó información para 157 títulos (79%) mientras que en CDMARC Bibliographic se encontraron registros para 180 títulos (90%).

Por otra parte al observar los resultados correspondientes a cada uno de los diversos tipos de registros, podemos darnos cuenta que en CDMARC Bibliographic hubo un incremento en el número de fichas localizadas en cada una de las diferentes categorías, excepto en el caso de los registros para títulos en otros idiomas.

Los resultados muestran que en Bibliofile se localizaron 47 (24%) fichas correspondientes a registros idénticos y en CDMARC Bibliographic 59 (30%)

De igual forma, en CDMARC Bibliographic se localizaron mayor cantidad de registros correspondientes a otras ediciones, 17 (8%), mientras que en Bibliofile el número fue menor, 21(10%)

Respecto a los registros de títulos en otros idiomas, se localizaron en Bibliofile únicamente 19 (10%), en tanto que en CDMARC Bibliographic se encontraron 28(14%).

Finalmente, los datos para los registros de títulos similares muestran que se localizaron en Bibliofile 74 (37%) fichas, mientras que en CDMARC Bibliographic fueron solamente encontradas 72 (36%).

Si se comparan los resultados anteriores, podría afirmarse que el banco de datos CDMARC Bibliographic presenta mayores ventajas sobre Bibliofile, puesto que se recuperó un mayor porcentaje de registros útiles para fines de catalogación; sin embargo, es importante analizar los tiempos empleados para la búsqueda y recuperación de los registros.

 Tabla 2. Comparación entre el tiempo utilizado en las búsquedas.

  Bibliofile CDMARC Bibliographic
Registros buscados 200 títulos 200 títulos
Tiempo utilizado en las búsquedas 422 minutos 845 minutos
Tiempo promedio por búsqueda 2 minutos 4 minutos

En relación al tiempo empleado para la localización de los registros, es conveniente señalar que la búsqueda en Bibliofile fue realizada en siete sesiones, que sumaron 422 minutos (7 horas, 2 minutos), en tanto que la correspondiente a CDMARC Bibliographic se llevó a cabo en nueve sesiones utilizando un tiempo de 845 minutos (14 horas, 5 minutos). Evidentemente, el tiempo usado para las búsquedas en CDMARC Bibliographic fue sustancialmente mayor (100%).

Por otro lado, al tomar en cuenta el número de títulos y el tiempo empleado para su búsqueda, podemos observar que el tiempo promedio por cada título localizado en Bibliofile fue de dos minutos, en tanto que en CDMARC Bibliographic se incrementó a cuatro a pesar que en CDMARC Bibliographic se localizó una mayor cantidad de registros para la catalogación de los materiales, el tiempo invertido en su localización fue notablemente mayor.

El hecho de haber localizado un mayor número de registros en el banco de datos CDMARC Bibliographic puede ser atribuido al número de títulos que contenía, pues como se ha mencionado, en este banco de datos se han incluido cerca de medio millón de registros más que en Bibliofile.

Por otra parte, el incremento en el tiempo pudo deberse a los procedimientos empleados para buscar la información, ya que la lectura de los discos se realizó en una unidad lectora de un solo disco, siendo necesario efectuar una serie de pasos, que requerían inversión de tiempo.

Los pasos para efectuar las búsquedas en Bibliofile fueron dos: primeramente una búsqueda en el disco que incluía el índice y posteriormente la localización del registro en el disco respectivo. En comparación, las búsquedas en CDMARC suponen tres o cuatro pasos: primeramente cargar el software que se encontraba en el disco uno; posteriormente realizar una búsqueda en la primera parte del índice en el disco dos y en caso de no encontrarse en éste continuar la búsqueda en el disco tres; finalmente buscar los registros en el disco correspondiente.

Como puede observarse, los pasos para localizar información en CDMARC Bibliographic empleando un lector de una unidad, fueron más que en Bibliofile, lo cual pudo repercutir en el tiempo invertido para la localización y recuperación de los registros.

Conclusiones

Al comparar las características de Bibliofile y CDMARC Bibliographic, podemos darnos cuenta que estos bancos de datos presentan una serie de similitudes y diferencias, que han sido abordadas de una manera amplia en el estudio de Khurshid (1991).

Tomando en cuenta el contenido de estos bancos, podemos señalar que la información que incluyen es básicamente la misma, puesto que ambos bancos de datos están conformados por los registros MARC de la Biblioteca del Congreso de los Estados Unidos; sin embargo, CDMARC Bibliographic contiene mayor cantidad de registros. No obstante lo anterior, Bibliofile presenta ventajas sobre CDMARC Bibliographic puesto que su actualización se efectúa en forma mensual y cuatrimestralmente y no cada cuatro meses como en el caso de este último.

Asimismo, CDMARC Bibliographic ofrece mayores puntos de acceso y cuenta con la posibilidad de utilizar operadores booleanos, lo que no es posible en Bibliofile. Adicionalmente, la combinación de algunos puntos de acceso como el idioma y el país con el título, permiten mejores opciones para restringir las búsquedas en CDMARC Bibliographic.

En Bibliofile únicamente es válido usar la fecha de publicación y el formato del material como limitante para restringir las búsquedas. No obstante la existencia de éstas posibilidades de recuperación en el software de CDMARC Bibliographic, estas opciones parecen ser de poca utilidad en la localización de información para fines de catalogación y clasificación bibliográfica.

Los resultados del estudio reportado en este artículo indican, que bajo las condiciones de operación descritas, el banco de datos Bibliofile resultó ser una herramienta de mayor utilidad para apoyar los procesos técnicos, pues a pesar de que se encontró un porcentaje menor de registros, 20% los tiempos invertidos para localizar esta información fueron sustancialmente menores en comparación con CDMARC Bibliographic. Al cambiar las condiciones y manejar estos bancos de datos en una unidad lectora de varios discos compactos, los resultados podrían ser diferentes.

Este estudio representa un primer paso en la evaluación de estos dos bancos de datos para apoyar los procesos técnicos en nuestras bibliotecas. Continuar realizando este tipo de evaluaciones, particularmente en una situación donde se manejen estos bancos de datos en un lector de discos múltiple, permitirá obtener datos adicionales para una mejor comprensión sobre su utilidad. Asimismo, sería importante incluir en futuros estudios, además de la cantidad de registros encontrados y el tiempo, otras variables tales como costos y calidad de los registros. La realización de este tipo de estudios ayudaría a determinar cuál es el banco de datos que presenta mayores ventajas y cuál es el idóneo para apoyar los procesos técnicos en nuestras bibliotecas.

Referencias

ANDRES, Mark. (1993) Original cataloging with Bibliofile: Some experiences and their implications. Library Software Review, 12 (4), 6-9.

ALLAN, Ann. (1990). Chassing MARC: Searching in bibliofile, Dialog, OCLC, and RLIN. Journal of Academic Librarianship, 15(6), 339-343.

Bibliofile : Introductory guide (1987) Washington, D.C. : The Library Corporation

BRENNAN, Cindy L. (1989). LaserCat vs Bibliofile: A comparison in the small public library. CD-ROM Librarian, 4(7), 10-17.

GIESBRECHT, Walter. (1988). Comparison of three CD-ROM cataloguing tools: Bibliofile, LaserCat, LaserQuest. School Libraries in Canada, 9, 23-27.

KHURSHID, Zahiruddin. (1991). Bibliofile versus CDMARC Bibliographic. CD-ROM Librarian, 6(11), 26-31.

MATTHEWS, Joseph R. Et al. (1990). Test report: Bibliofile. Library Technology Reports, 26(2), 175-185.

MORROW, Blaine V. (1988). Library corporation’s Bibliofile.CD-ROM Librarian, 3(1), 25-29.

Library of Congress, E.U. (1991ª). CDMARC Bibliographic Reference Manual. Washington, D.C. : Library of Congress. Cataloging Distribution Service.

Library of Congress, E.U. (1991b). New from Cataloging Distribution Service. LC. Information Bulletin, 50(7).