特色数据库建设是公共图书馆发展的重要方向,是提升图书馆信息资源利用率和服务水平的有效途径,其目的是为了解决图书馆特色馆藏收藏与利用的矛盾,在展示本馆及本地特色的同时,更好地满足读者阅读需求,提供更加精准、便捷、高效、个性化的服务。现探讨了公共图书馆特色数据库建设的意义、实践探索、关键技术、研究方法及未来建设思考等内容,并以太原市图书馆《太原日报》老报纸资源库建设为例,提出数据库建设实践思路与构想,以供参考。
公共图书馆作为城市文化建设的重要组成部分,承担着普及知识、促进文化交流的重要职责,并在地方文化建设中扮演着重要角色。随着信息技术的快速发展,公共图书馆在服务理念、服务方式、服务内容上不断创新和改进。公共图书馆特色数据库的建设可以更好地服务于地方文化传承、普及和推广工作,增强公共图书馆在地方文化建设中的地位和作用。
公共图书馆特色数据库建设意义
保护纸质珍贵馆藏,提高馆藏资源的利用率
通过将纸质资源数字化处理,图书馆可以将珍贵馆藏文献转化为数字资源,避免因频繁借阅或保存不当而造成的损坏,从而起到保护纸质珍贵馆藏的作用。同时,特色数据库的建设,可以将分散、零星的馆藏资源进行整合、梳理和提炼,形成具有系统性和连续性的资源体系,通过互联网进行传播和利用,提高了资源的利用率,也为更多读者提供了获取珍贵馆藏的机会。
拓展文献服务领域,实现数字化转型
在数字化时代,图书馆需要不断探索和创新,实现数字化转型和高质量发展。特色数据库建设是图书馆数字化转型的重要内容之一,通过建设特色数据库,可以突出本地化特色,提升图书馆的信息服务能力和水平,为读者提供更加高效、便捷的信息服务。
提供个性化服务
图书馆可以根据读者的需求和兴趣,为其定制专题资源,提供有针对性的信息服务。并利用大数据技术,分析读者的阅读行为、借阅记录等信息,形成用户画像,以便为其推荐相关领域的最新研究成果、学术动态等,帮助读者更好地了解该领域的发展状况和趋势。图书馆可以建立专业的咨询服务队伍,并利用AI大语言模型技术,为读者提供个性化的咨询服务,帮助读者解决在利用特色数据库过程中遇到的问题和困难。
促进学术交流与合作
特色数据库可以展示本地区历史人文、经济发展、社会变迁、民风民俗和科技动态等多样性知识,为相关领域的学者和研究人员提供科研、交流与合作的平台。通过特色数据库的建设,可以促进学术交流与合作,推动该领域的发展和进步。
提升图书馆的社会影响力
特色数据库是图书馆对外展示自身优势和特色的重要窗口,通过不断地推广使用,可以提高图书馆的社会知名度和影响力。同时,特色数据库可以吸引更多的用户关注和利用图书馆,提高图书馆的借阅量和用户满意度。
公共图书馆特色数据库建设方法与实践
资源收集突出特色
公共图书馆要注重地方文献工作,这不仅是其自身发展的重要任务,也是完善整个公共文化服务体系的重要环节。图书馆要进行充分调研和分析,了解本地特色,收集具有鲜明地方特色的文献资源,包括地方史志、地方年鉴、地方文献汇编、地方报刊等。对于图书馆来说,特色文献资源建设是针对读者需求,以某一学科专题人物或某一个历史时期为研究对象,将文献信息资源进行收集整理、存储、分析、评价,是一个整体的过程。同时,要按照一定的标准规范进行组织管理,使其成为本图书馆独有或其他图书馆少有的资源库。每一个地域、每一个图书馆都应该有自己的特色,只有具有特色才能够产生区别。因此,我们更应该把特色作为公共图书馆发展、建设、壮大的重要抓手和内容。
太原市图书馆自成立之始就将《太原日报》的收集、整理和利用作为报刊收藏的重点工作,并持续开展。目前,太原市图书馆收藏有《太原日报》1951年9月1日试刊至今的报纸,是全国收藏《太原日报》纸质版最全的单位。《太原日报》忠实记录了太原的历史变迁、文化发展、生产实践等综合性知识,是反映太原地区政治、经济、文化、社会发展、风土民情及自然风貌等的重要地方报纸,具有很高的保存及研究价值,是太原市图书馆的珍贵特色馆藏。
文献数字化处理
根据特色文献资源的类型和重要性,制订合适的数字化策略,选择适合的扫描设备和OCR识别软件,确保数字化处理的质量和效率。对特色文献资源进行扫描、OCR识别、数据清洗等,将纸质资源转化为数字资源。按照一定的分类标准,对特色文献资源进行整理和分类,便于后续管理和使用。将数字化后的资源存储在安全的数据库中,并建立相应的管理机制,确保资源的可用性和安全性。对数字化处理的过程进行质量控制,确保数字资源的准确性和完整性。在数字化处理完成后,根据使用反馈和数据分析结果,不断优化数字化策略和方法,提高数字资源的品质和可用性。
老旧报纸数字化,即通过数字出版技术把纸质报纸的内容进行扫描、文字识别以及插入音视频或动画进行版面重构等一系列步骤,转换成可以被电脑、手机、平板等多终端使用的格式,通过互联网展现的一种基于PDF版面的多媒体数字报。由于《太原日报》早期的报纸纸质脆化,20世纪50年代的老报纸在移动及翻阅过程中已经出现受损掉渣的情况。近年来,读者对老报纸的查阅需求在不断提升,图书馆亟待解决老旧文献的保存和利用之间的矛盾。因此,对纸质版文献修复和数字化处理提上了图书馆的工作日程,这样既保护了珍贵馆藏,又解决了频繁利用的问题。太原市图书馆于2019年起对《太原日报》老报纸开展了全文数字化加工,建设项目采用与山西同方知网数字出版技术有限公司合作的形式开展。对老旧装订报纸采用边修复边扫描加工的方式进行。图像扫描采用大幅面非接触式扫描仪及数码相机完成,图像分辨率设置不低于300pdi,在确保纸质文献不受损坏的前提下,保证采集图像的清晰度。采集后的图像经过纠偏、去噪、裁切等处理,形成可用的对象数据。采用OCR识别软件对图像进行版面分析、全文识别,并进行人工校改,形成双层PDF文件。全文数据经过篇名、作者、关键词、出版日期、版次等字段的标引,形成元数据。
建立数据库展示平台
根据地方特色建立相应的数据库,采用适合的数据库管理系统,如SQL Server、MySQL、Oracle等。建立方便用户检索的检索系统,包括网页端和移动端检索系统,提供便捷的检索方式和搜索结果展示。
太原市图书馆建设的“《太原日报》老报纸展示平台”底层使用中国知网提供的TPI信息资源建设与管理平台。展示平台可实现报纸的原貌阅读、关键词检索、全文检索、组配检索、繁简对照、放大缩小等功能。平台同步设计了PC版、手机微信版及触摸屏版展示界面,以满足读者不同场合的查阅需求,形成通过互联网展现的一种基于PDF版面的多媒体数字报。《太原日报》特色资源库的建设对保护太原市图书馆珍贵馆藏文献,加快纸质资源数字化改造与使用,突破图书馆馆舍的限制,结合公共数字文化建设实现资源共享,拓宽延伸服务领域,满足读者多元化需求具有重大意义。
数据评估、更新维护
特色数据库建设需要定期评估其建设效果、收集用户反馈,以便不断优化和完善数据库。并且,需要建立完善的更新维护机制,及时更新数据库内容,确保资源的准确性、完整性和实用性。
《太原日报》老报纸数据库一期建设完成后,太原市图书馆对已建资源内容及平台功能先由馆员进行审核把关,通过网络和在图书馆现场收集读者的反馈意见,了解数据的使用情况和潜在问题,根据反馈进行必要的数据调整和功能改进。对于暂未加工资源,积极筹措资金、规划建设,以推动数据库的不断完善。
推广宣传
通过多种渠道进行推广宣传,如通过图书馆官方网站,微信、微博等社交媒体等,提高地方特色数据库的知名度和利用率。
太原市图书馆在官网及官微的显眼位置,设置自建特色数据库的入口,并在微信或者网站的首页进行推广。同时,发布关于特色数据库的使用方法和最新更新内容,吸引读者的关注,帮助读者快速上手。
注重知识产权
图书馆在收集和处理特色资源时,应注意遵守相关法律法规和知识产权规定,避免侵权行为。
《太原日报》老报纸数据库选取已进入公有领域的文献开展建设阶段。在进行数字化加工时,为尊重原作者的著作权,不会对文献进行修改、删节,并保证所采集数据的质量,包括图像、文字、格式等,以确保资源的可用性和准确性。
未来公共图书馆特色数据库建设构想
随着信息技术和互联网的不断发展,以及大数据、人工智能、云计算等数字化技术的不断涌现和应用,人类社会逐渐进入了智能化、数字化的时代。图书馆特色数据库建设也需要运用相关技术,逐步建设细颗粒度知识资源,为读者提供更为智能、便捷的智慧图书馆知识服务。
国家图书馆于2021年出台了《智慧图书馆知识资源数据建设指南》,为全国各级图书馆开展智慧图书馆知识资源建设提供了可行的参考依据。该指南旨在指导各级图书馆在智慧图书馆知识资源建设过程中,如何科学合理地规划、组织、整合、保护和利用知识资源,提高知识资源的利用效率和服务水平。它涵盖了知识资源的分类、采集、加工、存储、传输、共享和安全等方面,提供了具体的技术和方法建议,帮助图书馆更好地实现知识资源的数字化、网络化和智能化。
资源的细颗粒度建设
数字图书馆时代,公共图书馆已建设积累了图书、期刊、报纸、古籍、音视频等多种类型的基础数字资源。资源的细颗粒度建设就是在基础数字资源上,开展知识资源精细化标引及关键知识点的标签和标引。对基础资源的著录,一般以文献“种”为著录粒度;而细粒度文献著录,则一般以篇章(包括封面、封底、目录等)、片段作为著录粒度。资源的细颗粒度建设即更为精细化的资源著录,对图书、期刊、报纸、古籍、音视频等基础数字资源,进行片段化、章节化标引,以形成基于文献片段内容的语料库。
文献关键知识内容抽取是指充分利用自动化手段分析文献内容,建立知识抽取模型,确定知识抽取方法,从文献中抽取人物、机构、事件、地理名称,以及其他具有标目意义的专题、实物等内容,开展知识标引工作,以形成基于文献知识内容的语料库。
知识组织与知识服务
通过对文献基础数字资源开展细颗粒度内容标识、关键知识点的标签和标引建设,可以实现资源精细化揭示的知识组织和知识管理。通过关联数据形成专题化的知识图谱,可以将文献中分散的知识点连接起来,形成一个完整的知识体系。知识图谱本质上是语义网络,表示现实世界中存在的实体、概念及其相互关系,是一种基于图的数据结构。知识图谱的出现改变了传统的知识获取模式,将知识工程由“自上而下”的方式转变为挖掘数据、抽取知识的“自下而上”方式。这样的知识图谱使得用户的阅读不仅仅停留在文献本身,而是能够充分挖掘文献中的知识点,并展示各知识点之间的关联,还能揭示知识的层次结构和演变过程,从而为用户提供更为全面、直观、深入的知识服务。
新型数字资源建设
本文的新型数字资源建设是指充分利用多种数字创意技术,如VR(虚拟现实)、AR(增强现实)等技术,打造的全新数字资源。这种新型数字资源阅读内容不再局限于平面的文字和图片,而是在三维立体空间中形象地还原原始纸质文献的初始风貌,通过数字技术进行故事化的解读,赋予了原始文献新的生命,为读者提供虚拟化、交互式、立体化和沉浸式的多维度阅读体验。通过视觉、听觉、触觉三维立体的共同感觉,让读者与虚实场景深度融合,使读者身临其境,从而能更深入地理解原始文献,了解文献背后的故事,感受其中蕴含的文化和历史价值。
公共图书馆特色数据库建设是提升图书馆信息资源利用率和服务水平的有效途径。公共图书馆特色数据库建设应注重以下几方面。首先,要结合《全国智慧图书馆体系建设方案》,并根据本馆的实际情况,确定特色数据库的建设方向和内容,保证其与图书馆的定位和服务需求相匹配;其次,要运用好现代数字信息技术,构建实用性强、使用便捷、访问高效智慧的资源体系;再次,加强数据库的更新和维护工作,确保数据库的内容充实和准确;最后,要提升用户体验,搭建友好易用的数据库使用界面,帮助用户快速准确地获取所需信息。在实践中,公共图书馆要注重与相关机构、学术界的合作,共同推动特色数据库建设的深入发展。同时,要不断加强人才队伍建设,培养专业的数据库管理人员,提升公共图书馆信息服务的专业化水平。
总的来说,公共图书馆特色数据库建设实践是一个复杂而系统的工程,需要各方的共同努力和现代信息技术的支持,只有这样,公共图书馆才能更好地发挥其在文化建设中的作用,为社会大众提供更加优质的服务。
(作者单位:太原市图书馆)