Avances de la implementación de la Estrategia de integración de la información de catálogos de fichas impresas al espacio de datos enlazados de la Biblioteca Digital Nacional de Cuba
MSc Pedro Urra González
CONTEXTO
Desde finales de los años 1990 se generalizó el uso de catálogos automatizados en muchas bibliotecas cubanas con la extensión del uso del MicroIsis, no obstante, a partir de la información recabada sobre los catálogos de las principales bibliotecas del país, se ha constatado que un volumen considerable de las descripciones bibliográficas de las colecciones documentales de la nación se encuentran aún en catálogos de fichas impresas. En el caso de la Biblioteca Nacional, la mayoría de los documentos que ingresaron a sus fondos antes de 1996, salvo conjuntos seleccionados, no cuentan con descripciones legibles por computadoras en bases de datos y por tanto no es posible consultarlos a través de Internet. Una situación similar tiene la Biblioteca Central de la Universidad de la Habana y la del Instituto de Historia de Cuba.
Esta situación convive con la implementación de sistemas automatizados de gestión bibliotecaria que tienen entre sus funcionalidades principales la mantención de catálogos en línea de sus acervos. Es decir, que la tarea de la inclusión de los registros bibliográficos de los catálogos impresos en estos sistemas sigue teniendo gran importancia. Sin la inclusión del total de los documentos coleccionados se limitan las ventajas de implementar estos sistemas y se duplican las funciones de gestión de documentos para la prestación de servicios, tanto para los usuarios como para los propios trabajadores de servicios en estas instituciones. Al propio tiempo, la importancia de las colecciones nacionales y la calidad de las descripciones bibliográficas acumuladas en estos catálogos, descartan la opción de desechar estos registros aduciendo hipotéticas ventajas del acceso a catálogos internacionales. Todo esto le otorga una alta prioridad a los procesos para recuperar la información de los catálogos impresos para su incorporación al mundo digital en red.
El proyecto de construcción de una biblioteca digital nacional en el país está condicionado en parte por esta realidad. Ello ha llevado a realizar un pilotaje para diseñar una estrategia que permita completar la conversión de catálogos en estas bibliotecas. La propuesta combina técnicas de digitalización masiva, procesos de reconocimiento óptico de caracteres (OCR), anotación en red y uso de las técnicas de datos enlazados. Los catálogos impresos se han convertido así en objetos de digitalización dado su valor como testimonio de los procesos de construcción histórica de colecciones bibliográficas y como instrumentos para avanzar en la vinculación de los datos bibliográficos de las colecciones al espacio de datos enlazados.
OBJETIVO
En la presente ponencia se comparten un grupo de elementos de la estrategia para la integración de catálogos impresos al espacio de la biblioteca digital, la situación en la que se encuentra la iniciativa y se reflexiona sobre la relación con procesos paralelos de desarrollo de catálogos en línea, bibliotecas digitales y repositorios digitales del patrimonio cultural destacando las oportunidades del uso de técnicas de datos enlazados para estos fines. Estos resultados han sido presentados para publicación. En esta ponencia se adelantan algunos aspectos del trabajo que puedan resultar de interés para los participantes en el Taller.
EL NUEVO CONTEXTO PARA LA CONVERSIÓN DE LOS CATÁLOGOS IMPRESOS
La conversión retrospectiva de catálogos de bibliotecas que fue una tarea a la que se dedicó muchos esfuerzos en décadas pasadas. Esto generó un grupo de experiencias, herramientas y conocimientos que constituyen un antecedente de cualquier esfuerzo en esta dirección. No obstante a lo anterior, el escenario y las estrategias de estos procesos debe ajustarse a nuevas realidades entre las que pueden citarse la generalización del uso de Internet y en particular del WWW como plataforma para el acceso a la información, y el crecimiento de la disponibilidad de datos bibliográficos normalizados en catálogos de bibliotecas nacionales e internacionales como el Worldcat de OCLC (http://www.worldcat.org/) y los ficheros de autoridades asociados a los mismos (http://www.viaf.org/). (OCLC, s. f.)
A esto se suma el desarrollo de nuevos enfoques y técnicas para la gestión de los datos en las que tiene particular importancia la maduración y el creciente uso de las técnicas de datos enlazados por la comunidad bibliotecaria y de otras instituciones del patrimonio cultural. Solo a manera de ejemplo, la última guía desarrollada por IFLA para las bibliografías nacionales dedica un apartado especial al uso de las técnicas de datos enlazados.(«Best Practice for National Bibliographic Agencies in a Digital Age | IFLA», s. f.) Igualmente, OCLC y un grupo importante de bibliotecas nacionales han comenzado a exponer sus datos bibliográficos siguiendo estas pautas y la Biblioteca del Congreso de los Estados Unidos ha lanzado la iniciativa BIBFRAME, que supone un cambio fundamental en cuanto a las estrategias para la catalogación de las colecciones bibliotecarias, en las que reconoce a los datos enlazados como una oportunidad para revitalizar las funciones de las Bibliotecas en la era de Internet.(Kroeger, 2013)(Zapounidou, Sfakakis, & Papatheodorou, 2014a)(Zapounidou, Sfakakis, & Papatheodorou, 2014b)
Otro elemento a considerar como parte del contexto de los procesos de conversión de catálogos de bibliotecas es el surgimiento y desarrollo de las iniciativas para la construcción de Bibliotecas Digitales y Repositorios Digitales.(Borgman, 2002) Hoy prácticamente todos los países de la región Latinoamericana y caribeña han desarrollado proyectos de este tipo. Sin embargo, salvo excepciones, coexiste un número considerable de colecciones parciales e incompletas, se duplican contenidos, y los datos de los acervos bibliográficos siguen estando desconectados entre sí y entre colecciones distintas. La disponibilidad de catálogos de calidad sigue siendo una carencia. Este proceso se multiplica y extiende y aunque crece aceleradamente la disponibilidad de copias digitales de documentos producidos en países latinoamericanos y caribeños integrados a repositorios globalizados, quedan ocultas importantes colecciones atesoradas localmente y se pierde la riqueza de los contextos culturales e históricos y las trazas asociadas a la vida social de dichos documentos en cada uno de los países y regiones.
Esto convive con una ofensiva por parte de los sectores empresariales por apropiarse de forma privada de los beneficios que genera el uso de la información acumulada en los fondos documentales de las bibliotecas. Lo anterior pone de relieve la importancia que tienen estos fondos no sólo en términos científicos y culturales sino también como activos económicos y plataforma para el desarrollo de números servicios.(Rieger, 2008) La renovada Estrategia Europea para el desarrollo de la Biblioteca Europeana es un ejemplo de enfoque en la dirección de rescatar y reforzar el papel proactivo de las bibliotecas y otras instituciones patrimoniales en la protección de los bienes públicos de carácter cultural y en su puesta al servicio de la comunidad.
Las iniciativas de bibliotecas y repositorios digitales, más que acciones desconectadas deben formar parte de un esfuerzo articulador e integrador vinculado a la defensa de la identidad cultural como base de una mejor convivencia entre los pueblos y las naciones. En este contexto también se pueden citar los esfuerzos para el rescate, la preservación y diseminación del patrimonio documental representado en la iniciativa Memoria del Mundo de la UNESCO y sus instancias regionales, subregionales y nacionales.(«Memory of the World | United Nations Educational, Scientific and Cultural Organization», s. f.)
BASES TEÓRICO PRÁCTICAS DE LA ESTRATEGIA
Se tuvo en cuenta la acumulación de conocimientos en procesos de conversión retrospectiva de catálogos impresos , se combinó la revisión profunda de la bibliografía disponible con la realización de entrevistas a expertos y grupos de discusión para identificar particularidades del escenario cubano e identificar prácticas y experiencias concretas. Se concluyó básicamente que en las condiciones de Cuba era necesaria una adecuación de la estrategia que tomara en cuenta las particularidades del entorno nacional. (Brian Schottlaender, s. f.)
Un estudio de fortalezas, oportunidades, amenazas y debilidades identificó una situación muy particular en la que junto a las limitaciones del acceso a Internet, la falta de equipamiento y recursos financieros, y las restricciones para el acceso a servicios y bases de datos internacionales convivían el legado de catálogos desarrollados de manera sistemática y con calidad, la existencia en las colecciones de documentos valiosos únicos o escasos, la disponibilidad de fuerza de trabajo calificada, experiencias anteriores de procesos de digitalización y desarrollo de sistemas y la emergencia de nuevos paradigmas y posibilidades técnicas que ofrecen un espacio para la innovación y aprendizaje. Como se señaló, el pilotaje con los Catálogos se inserta en el marco de una estrategia más global para el desarrollo de una Biblioteca Nacional Digital de Cuba, que se alinea al propio tiempo con estrategias regionales y globales en esta dirección. También es parte de un proceso de aprender haciendo o construyendo.
El trabajo con los catálogos se abordó como un problema de integración de estos recursos al espacio abierto de los datos bibliográficos y no como un clásico problema de conversión retrospectiva que es lo que prevalece en la literatura y la práctica acumulada sobre el tema.(Malmsten, 2008) En lugar de hacer un proceso de conversión de los registros bibliográficos para obtener registros MARC como meta directa, se adoptó un proceso de iteraciones que permitiera incorporar progresivamente los datos de esos catálogos al espacio de Internet y lograr su interrelación con los datos existentes en la red. Aunque no se renunció a la posibilidad de obtener las representaciones normalizadas de las descripciones bibliográficas, en formato MARC, y poder incorporarlas a los Sistemas de Gestión Bibliotecaria de cada institución, se priorizó la digitalización de las fichas de los catálogos y su integración en un repositorio para una vez disponibles en Internet en formato digital, realizar procesos continuos de anotación con técnicas de datos enlazados.
Existen experiencias de desarrollo de los denominados “Card Images Public Access Catalogs” tratadas de manera detallada por (Oberhauser, 2002). Se trata de la creación de representaciones “virtuales” de los catálogos impresos que de manera pragmática, ofrecen una representación digital en línea de los mismos mediante imágenes digitales de las fichas ordenadas de manera similar o muy parecida a la forma en que existen físicamente. Así, sin alterar el orden original de los catálogos, se capturan las fichas bibliográficas y se disponen en un espacio Web de manera que el usuario pueda navegarlas en una lógica similar o bastante parecida a los catálogos en línea con la ventaja de estar en Internet, globalizando el acceso a los datos de las colecciones y potenciando la consulta a las mismas.
Estos catálogos, cuya primera experiencia documentada se remonta a los años 1990, aparecieron como una alternativa a los costosos procesos de conversión retrospectiva total de grandes bibliotecas y en algunos casos sirvieron como pasos intermedios de apoyo al completamiento de procesos de este tipo. En importantes bibliotecas siguen siendo la única alternativa para poder consultar desde Internet importantes colecciones. Existe un directorio de este tipo de catálogos disponibles en http://cipacs.vfi-online.org/. Los mismos funcionan además como repositorios de imágenes de fichas que preservan la memoria documental y conservan trazas valiosas del funcionamiento de las instituciones bibliotecarias.
Algunos de los catálogos, por sus características particulares, su antigüedad y grado de preservación constituyen patrimonio del hacer bibliotecario del país y testimonio de la evolución histórica de los procesos técnicos, la sistematicidad del trabajo institucional y hasta testigos de etapas de abundancia y escasez reflejada en las características de las fichas (importadas o hechas localmente), calidad de la mecanografía, alcance de las anotaciones y otros aspectos que dan para investigaciones disciplinarias muy interesantes.
La caracterización de los catálogos fue entonces uno de los pasos iniciales del proceso. Esta caracterización se realizó mediante revisiones en sitio de los catálogos, la entrevista con responsables y personas vinculadas con su custodia y su historia. Se vieron los aspectos técnicos, materiales y socio culturales vinculados a los mismos así como su importancia dentro de la colección de las Bibliotecas. En el caso de la Biblioteca Nacional, se decidió por la dirección y el personal especializado de la institución hacer el pilotaje con la Sala Cubana Siglo XIX, considerando el valor de sus colecciones y también el tamaño relativamente menor (aproximadamente 130 gavetas) con respecto a la colección general (más de 700 gavetas). En el caso de la Biblioteca Central de la Universidad de la Habana, se decidió comenzar por el catálogo oficial de la Colección general por tener un tamaño manejable (92 gavetas) y estar en condiciones de conservación relativamente buenas. En el caso del Instituto de Historia, se seleccionó el único catálogo disponible el cual estaba en buen estado de conservación y tenía una cifra manejable (50 gavetas).
La experiencia de construcción de CIPAC, combinada con la aplicación de técnicas de datos enlazados apareció entonces como una alternativa interesante y viable en las condiciones cubanas lo cual fue presentado y discutido con expertos y en talleres en las instituciones involucradas. Se decidió entonces desarrollar un pilotaje para evaluar su viabilidad y aprender del proceso.
RESULTADOS PRELIMINARES
En consecuencia con los principios del proyecto de la Biblioteca Nacional Digital de Cuba, las intervenciones que se realizaron se orientaron a desarrollar capacidades locales y hacer un uso innovador y racional de los recursos disponibles. Estos principios guiaron la realización del pilotaje. A continuación se resumen algunos ejemplos que ilustran los resultados en este sentido:
- Hacer el trabajo con el personal propio de las bibliotecas y que estuviera directamente vinculado con las colecciones que se seleccionaron y con acompañamiento de expertos.
- Se decidió emprender el pilotaje con personal directamente relacionado con los procesos técnicos de la biblioteca y en el caso de la Biblioteca Nacional con personal integrado a la propia Sala Cubana.
- El personal de otras áreas como la de informática, áreas de digitalización y otras, apoyaría el proceso, capacitaría pero el trabajo se controlaría y lideraría desde el área responsable de la colección y sus catálogos.
- Se realizaron acciones de capacitación en la práctica y se vincularon a las personas de las tres instituciones estimulándose el apoyo mutuo y el entrenamiento de pares.
- Acompañamiento especializado del proceso por personal de más experiencia.
- Realización de acciones de control de calidad durante todo el proceso.
- Tratar de utilizar al máximo los recursos técnicos y materiales disponibles y fomentar la cooperación con otras áreas.
- Se identificaron recursos locales que servirían para realizar tareas de digitalización.
- Se combinó el uso de computadoras disponibles y solo en el caso de la Biblioteca Nacional se dedicó una computadora nueva completamente al proceso de procesamiento del material digitalizado, en las otras instituciones se compartió tiempo de máquina.
- Se realizaron innovaciones como el diseño y construcción de “estaciones de captura digital” muy sencillas que facilitaran la digitalización de las fichas y que consideraban este formato. Estas estaciones se diseñaron de manera que pudieran utilizar una cámara digital comercial estándar con determinadas prestaciones y con el único criterio de que capturaran imágenes que posteriormente pudieran visualizarse correctamente y hacerle procesos de OCR. Dadas las características de las fichas, su tamaño y relativa uniformidad se experimentaron y evaluaron diferentes alternativas hasta llegar a un prototipo con el que se han capturado hasta la fecha más de 100 mil fichas.
- Utilizar la infraestructura de las instituciones participantes incluida la infraestructura informática y de comunicaciones y en caso de no contar con ella buscar el apoyo de otras instituciones del proyecto global de la Biblioteca Nacional Digital. Los catálogos que ya están en línea están hospedados en una de las instituciones que colabora con el proyecto, dadas las facilidades para este fin. Adicionalmente cada institución posee copias de trabajo en sus redes locales que se sintonizan regularmente con el servidor principal.
- Combinar técnicas y metodologías avanzadas con métodos tradicionales en función del objetivo.
- Se modeló y diseñó un sistema accesible en el WEB para la gestión de CIPACs que se fue desarrollando progresivamente con la filosofía de beta permanente para la exposición de los catálogos y para la incorporación de anotaciones progresivas. Disponible en http://bnjm.sld.cu/).
- Se seleccionó una muestra probabilística de las obras representadas en el catálogo oficial de la Colección Cubana usando un muestreo por conglomerados (gavetas) bietápico con selección sistemática en la segunda etapa (las fichas) para estudiar el catálogo y estimar la cantidad de fichas que contaban con registros bibliográficos en forma de datos enlazados en la base de datos WorldCat, arrojando un 48 por ciento. Esto justificó la estrategia de enlazar las anotaciones de las fichas con esta base de datos para el posterior completamiento del proceso. Ilustración 3 Grafo informal de los triples básicos del modelo
- Se estudiaron, e incorporaron técnicas de datos enlazados para diseñar la estrategia de exposición de datos en la WEB y desarrollar una WEBAPI para acceder a los datos. Como resultado de la etapa de integración de los datos de los catálogos al espacio de datos enlazados abiertos estará disponible una WEBAPI Restful con datos RDF serializados en JSON-LD.(Markus Lanthaler & Gütl, 2012)(M. Lanthaler & Gütl, 2013) Esta está en fase de desarrollo. Se seleccionó el uso del vocabulario BIBFRAME propuesto por la Biblioteca del Congreso de los Estados Unidos como vocabulario base para la representación de los datos.
- Se diseñó un flujo de trabajo a partir de mejores prácticas ajustadas a los propósitos del proyecto, para la digitalización y procesamiento de las fichas y la progresiva incorporación de los textos de las fichas como anotaciones combinando técnicas de OCR (en lotes e interactivo), anotación en red y revisión descentralizada. Se integró la interfaz WEB con el uso de aplicaciones de escritorio para realizar el OCR y anotar cada ficha.
- Se puso a funcionar un cosechador de datos y motor de búsqueda usando Lucene/SOLR para el procesamiento de los textos de la ficha que se fueran incorporando al espacio de datos del sistema y que permitiera la búsqueda a texto completo en el cuerpo del texto de las fichas procesadas.(Breeding, 2007)(Beccaria & Scott, 2007) La interfaz de búsqueda y navegación puede accederse en http://bnjm.sld.cu/.
- Ofrecer productos y servicios de beneficio directo de usuarios, bibliotecarios y otros especialistas desde etapas tempranas del proceso.
- La versión “virtual” de los catálogos están en línea y se exponen en dependencia del avance del proceso de captura.
- Las anotaciones de los textos se están realizando usando esta plataforma en red. De hecho los especialistas que realizan los procesos de control de calidad trabajan desde sus conexiones a la red. Las personas que realizan la captura, optimización, OCR y anotación de las tres instituciones tienen acceso a los catálogos y pueden visualizar su avance y colaborar técnicamente.
- Paralelamente al proceso de captura de las imágenes de las fichas se comenzó a exponer en línea, primero en la Intranet y luego en Internet, un portal para acceder a los resultados de la construcción de los catálogos y para su propia construcción mediante la anotación en red de las fichas.
- El 24 de diciembre de 2014, 10 meses después de iniciada la captura de las primeras fichas, se había completado la incorporación del texto de todas las fichas del catálogo oficial de la Sala Cubana de la Biblioteca Nacional con lo que desde entonces es posible la búsqueda a texto completo en los contenidos de dichas fichas.
Finalmente se hace una breve reseña de lugar del uso de las técnicas de datos enlazados en el proyecto y su importancia como proceso innovador y de aprendizaje en relación con la integración de datos de catálogos impresos al espacio abierto del Web, y en particular al espacio abierto de los datos enlazados. No es posible exponer de forma detallada estas técnicas. Existe una abundante literatura sobre el tema en general y sobre su aplicación al mundo de las bibliotecas, archivos y museos. (Konstantinou & Spanos, 2015), (Papadakis & Kyprianos, 2012) (Zapounidou et al., 2014b) (Subirats et al., 2012) Se hará referencia al lugar de estas técnicas dentro de la estrategia y a su aplicación concreta en la integración progresiva de los datos de los catálogos al espacio de la WEB.
En línea con la filosofía de construcción progresiva del proyecto, una vez que se obtiene el texto completo de las fichas combinando técnicas de OCR y revisión manual, éste texto se trata como anotaciones de existencia en las bibliotecas respectivas de acuerdo con el modelo BIBFRAME. Cada ficha se enlaza con el registro bibliográfico correspondiente en WorldCat. Estos datos se serializan en JSON-LD.(Consortium & others, 2014) De esta forma se abre un vínculo con el espacio abierto de datos enlazados con las consiguientes posibilidades de anotaciones sucesivas y de recuperación de datos normalizados que pueden integrarse al catálogo del sistema de gestión bibliotecaria local.
Lo anterior se adoptó como estrategia, dada la complejidad que implica la transformación de los textos libres de las fichas a una estructura del tipo MARC21.(Kroeger, 2013) Nótese que para el caso del catálogo oficial de la Sala Cubana, la muestra permitió estimar que el 48% de las fichas cuenta con un registro RDF en esta base de datos. Este abordaje reduce la cantidad de las fichas cuyos datos tienen que adicionarse manualmente al catálogo local. En el caso del catálogo oficial de la Sala Cubana de la Biblioteca Nacional la reducción es de casi la mitad del total de las fichas. Al propio tiempo se preservan las anotaciones locales para las fichas que se importaron y se abren posibilidades de vínculos con otros recursos siguiendo la ruta de los enlaces proporcionados por una base de datos de alta centralidad como WolrdCat. Por esta vía se tiene acceso además a datos complementarios como las autoridades en bases de datos como el Virtual International Authorities File (http://viaf.org) y otras. La identificación de las fichas que cuentan con registros en el catálogo WorldCat se realiza combinando técnicas automatizadas con la revisión humana.
Finalmente, como parte de la visión progresiva de tratamiento de los datos, se están desarrollando herramientas complementarias de anotación. Se ha estudiado la experiencia de otros proyectos de datos enlazados y en particular de la plataforma de datos enlazados de Europeana, la Digital Public Library of América y la BBC. Una de las herramientas busca “exprimir” datos del texto de las fichas para identificar entidades nombradas y poder representar estos datos como “datos enlazados”. Esto permitiría continuar adicionando valor a los registros y exponer los datos resultantes en la WEBAPI antes mencionada.
La experiencia de incorporación de las técnicas de datos enlazados a los procesos de desarrollo de repositorios y bibliotecas digitales está funcionado como un proceso de aprendizaje y ha permitido dar respuestas adecuadas al problema de la integración de catálogos impresos al espacio digital. Los resultados de la investigación en curso están en proceso de publicación en una revista científica. Las presentes consideraciones se han expuesto como avances a socializar en el presente taller.
BIBLIOGRAFÍA
- BBC - Blogs - Internet blog - BBC News Lab: Linked data. (s. f.). Recuperado 6 de diciembre de 2014, a partir de http://www.bbc.co.uk/blogs/internet/posts/BBC-News-Lab
- Beccaria, M., & Scott, D. (2007). Fac-back-OPAC: An open source interface to your library system. COMPUTERS IN LIBRARIES-WESTPORT-, 27(9), 6. Recuperado a partir de http://www.collectionscanada.gc.ca/obj/thesescanada/vol2/OSUL/TC-OSUL-270.pdf
- Best Practice for National Bibliographic Agencies in a Digital Age | IFLA. (s. f.). Recuperado 5 de octubre de 2014, a partir de http://www.ifla.org/ES/node/7858
- Borgman, C. L. (2002). Challenges in building digital libraries for the 21(st) century. En E. P. Lim, S. Foo, C. Khoo, S. Urs, T. Costantino, E. Fox, & H. Chen (Eds.), Digital Libraries: People, Knowledge, and Technology, Proceedings (Vol. 2555, pp. 1-13).
- Breeding, M. (2007). Dispatches from the Field: Recasting Library Catalogs. American Libraries, 43–43. Brian Schottlaender (Ed.). (s. f.). Retrospective Conversion: History, Approaches, Considerations editado por por Brian Schottlaender. Recuperado a partir de http://books.google.com.cu/books?id=nU674BpbAfgC&pg=PA17&dq=Library+retrospective+conversion+ocr&hl=es&sa=X&ei=Wu6VU5j6L5TB0gWZ34DgDw&ved=0CDEQ6AEwAA#v=onepage&q=Library%20retrospective%20conversion%20ocr&f=false
- Consortium, W. W. W., & others. (2014). JSON-LD 1.0: a JSON-based serialization for linked data. Recuperado a partir de http://travesia.mcu.es/portalnb/jspui/handle/10421/7478
- HathiTrust and Digital Public Library of America as the future. (s. f.). Recuperado 1 de febrero de 2015, a partir de http://www.infotoday.com/OnlineSearcher/Articles/Features/HathiTrust-and-Digital-Public-Library-of-America-as-the-future-88089.shtml
- Konstantinou, N., & Spanos, D.-E. (2015). Introduction: Linked Data and the Semantic Web. En Materializing the Web of Linked Data (pp. 1-16). Springer International Publishing. Recuperado a partir de http://link.springer.com.proxy.cc.uic.edu/chapter/10.1007/978-3-319-16074-0_1
- Kroeger, A. (2013). The Road to BIBFRAME: The Evolution of the Idea of Bibliographic Transition into a Post-MARC Future. Cataloging & Classification Quarterly, 51(8), 873-890. http://doi.org/10.1080/01639374.2013.823584
- Lanthaler, M., & Gütl, C. (2012). On using JSON-LD to create evolvable RESTful services. En Proceedings of the Third International Workshop on RESTful Design (pp. 25–32). ACM. Recuperado a partir de http://dl.acm.org/citation.cfm?id=2307827 Lanthaler, M., & Gütl, C. (2013). Model your application domain, not your JSON structures. En WWW 2013 Companion - Proceedings of the 22nd International Conference on World Wide Web (pp. 1415-1420). Recuperado a partir de http://www.scopus.com/inward/record.url?eid=2-s2.0-84893083272&partnerID=40&md5=896ecf0a8edd95428deef3fc4a4c8cd2
- Malmsten, M. (2008). Making a library catalogue part of the semantic web. Universitätsverlag Göttingen, 146. Recuperado a partir de http://www.google.com/books?hl=en&lr=&id=kUEGX-tiGYUC&oi=fnd&pg=PA146&dq=FRBR+%22LINKED+DATA%22&ots=uyoPlGUe5f&sig=EFNo-0O9ckFSzJ092bGTok4lELY
- Memory of the World | United Nations Educational, Scientific and Cultural Organization. (s. f.). Recuperado 18 de abril de 2015, a partir de http://www.unesco.org/new/en/communication-and-information/flagship-project-activities/memory-of-the-world/homepage/
- Oberhauser, O. C. (2002). Card-image public access catalogues (CIPACs): a critical consideration of a cost-effective alternative to full retrospective catalogue conversion. Recuperado a partir de http://eprints.rclis.org/handle/10760/8552
- OCLC. (s. f.). VIAF. Recuperado 10 de marzo de 2015, a partir de http://www.oclc.org/viaf.en.html
- Papadakis, I., & Kyprianos, K. (2012). Providing LOD-Based Functionality in Digital Libraries. En J. M. Dodero, M. Palomo-Duarte, & P. Karampiperis (Eds.), Metadata and Semantics Research (pp. 13-24). Springer Berlin Heidelberg. Recuperado a partir de http://link.springer.com.proxy.cc.uic.edu/chapter/10.1007/978-3-642-35233-1_2
- Philip, B. (1990). Special Issue on Retrospective Conversion, Retrospective Cataloguing and Retrospective Bibliography. International Federation of Library Associations Journal, 16(1), 27. Recuperado a partir de http://ifl.sagepub.com/content/16/1
- «Retrospective Catalogue Conversion» - Google Académico. (s. f.). Recuperado 24 de junio de 2015, a partir de http://scholar.google.com/scholar?hl=es&q=%22Retrospective+Catalogue+Conversion%22&btnG=&lr=
- Rieger, O. Y. (2008). Preservation in the age of large-scale digitization. A White Paper. Recuperado a partir de http://www.clir.org/pubs/reports/reports/pub141/pub141.pdf
- Subirats, I., Malapela, T., Dister, S., Zeng, M., Goovaerts, M., Pesce, V., … Keizer, J. (2012). Reorienting Open Repositories to the Challenges of the Semantic Web: Experiences from FAO’s Contribution to the Resource Processing and Discovery Cycle in Repositories in the Agricultural Domain. En J. M. Dodero, M. Palomo-Duarte, & P. Karampiperis (Eds.), Metadata and Semantics Research (pp. 158-167). Springer Berlin Heidelberg. Recuperado a partir de http://link.springer.com.proxy.cc.uic.edu/chapter/10.1007/978-3-642-35233-1_17
- Zapounidou, S., Sfakakis, M., & Papatheodorou, C. (2014a). Integrating library and cultural heritage data models: the BIBFRAME-EDM case. En Proceedings of the 18th Panhellenic Conference on Informatics (pp. 1–6). ACM. Recuperado a partir de http://dl.acm.org/citation.cfm?id=2645805 Zapounidou, S., Sfakakis, M., & Papatheodorou, C. (2014b). Library Data Integration: Towards BIBFRAME Mapping to EDM. En Metadata and Semantics Research (pp. 262–273). Springer. Recuperado a partir de http://link.springer.com/chapter/10.1007/978-3-319-13674-5_25