罗希莹,张燕,王华平,马鹏飞,胡笳
(昆明医科大学图书馆,云南 昆明 650500)
0 引 言近年来,随着新一代信息技术的飞速发展,智慧图书馆已成为业界的热门议题,对于智慧图书馆的定义,也是众说纷纭,研究者们认为:智慧图书馆专注于图书馆的管理与服务的智慧化。面对图书馆当前的智慧化发展趋势,可将智慧图书馆概括为一种集技术、资源、服务、馆员和用户于一身,实现智慧化服务和管理的新一代图书馆模式。它是一个由智慧平台、智慧空间和智慧服务三部分有机结合,构成的智能化“图书馆生态体系”。
智慧图书馆的建设时期是高校图书馆服务升级转型的良好机遇期,服务是图书馆实现其功能和宗旨的重要途径,提供满足用户需求的优质服务是智慧图书馆建设和发展的最终目标。随着高校图书馆用户信息行为和信息需求的不断变化,当前高校图书馆的服务更强调“以用户为中心”“可持续发展”“模式创新”等。本文以昆明医科大学机构知识库的开发应用为例,分享交流在建设医学机构知识库过程中的经验做法,以期共同推动高校机构知识库的建设及可持续发展。
1 高校图书馆的智慧服务信息化时代的高校图书馆的智慧服务主要有新理念、新能力和新服务方式三个方面的特征。目前,图书馆智慧服务主要有智能性、知识性、理念性三种概念及内涵。智能性的图书馆智慧服务主要指信息技术(智能化)在图书馆服务等相关领域的结合和应用,例如,图书馆馆藏资源的数字化、机构特色书籍、文献的电子化等,以智能化的方式构建图书馆的服务网络,提升读者用户的体验感。知识性的图书馆智慧服务主要是指图书馆的高级知识服务,是对于图书馆转型的重要挑战,例如,嵌入式服务、学科服务等。理念性的图书馆智慧服务是指图书馆在服务理念、定位上构想,及馆员职业精神的体现等,例如,“读者至上 快乐服务”等等,展现图书馆人的职业精神。
2 基于机构知识库的高校知识服务模式知识服务是图书馆发挥知识组织功能,以学科为基础,以文献、信息、数据等各类资源为目标,收集、提炼、整理、组织、保存和传播知识,在用户需求目标驱动下,为教学科研提供专业化和个性化的支撑服务。高校是才人培养的重要阵地,图书馆智慧服务的基础是有效的知识管理。规范化、科学化的知识管理能有效地提高机构成果资源和图书馆资源的利用率,具有极大的推动作用。在智慧图书馆和数字校园的建设背景下,如何实现机构现有成果的有效管理和挖掘利用,使其发挥积极作用,是我们亟须思考的重要课题。
近年来,国内外对机构知识库的研究相当重视,从中国知网中利用“机构知识库”为主题检索出的研究文献量来看,呈现逐年上升的趋势(从2009年以后,年均发文量在130篇左右),机构知识库作为开放获取实现的重要途径之一,在经过十几年的持续增长发展后,其数量和内容都已初具规模。
在教育部印发的《高等学校数字校园建设规范(试行)》的通知中指出,机构知识库是基于全球开放理念而形成的一种新型学术交流与资源共享模式,目前已成为保存、管理和传播机构知识资产的重要工具与机制。要将机构知识库的建设纳入高校数字校园建设中。
机构知识库(Institutional Repository, IR)又称机构库、成果库、典藏库等,是由特定机构(如大学、研究所、图书馆、博物馆等)通过收集、整理、长期保存本机构成员所产生的学术成果,并利用网络、相关技术建立起来的数字化成果交流平台,通过将这些数据资源进行规范化的分类、标引、分析后供本机构成员或合作机构成员免费使用。机构知识库的建设是高校图书馆提供智慧化知识服务的有效载体,是数字校园建设的重要组成部分,也是高校“双一流”建设的基础设施。
图书馆作为学校教学和科研服务的文献信息中心,是学科建设的重要支撑力量,因此,如何适应“双一流”建设背景下医学学科建设、新医科建设的需要,构建医学学科文献信息资源体系,自觉地参与到学校一流学科建设,是当前医学图书馆建设和发展面临的机遇与挑战,也是高校医学图书馆建设智慧图书馆,创新知识服务模式的重要举措。尤其是医学高校图书馆建设机构知识库,是促进和服务健康产业、医疗卫生事业创新发展的重要方式,也是图书馆提供特色医学信息服务的重要手段。
3 知识服务模式创新与运用——以昆明医科大学机构知识库的开发应用为例昆明医科大学机构知识库的建设遵循了机构知识库建设的基本理论和方法,借鉴参考国内外高校机构知识库建设的经验和失败教训,并针对昆明医科大学成果产出的类型、特征、规律和形式,研究设计了具有个性化功能和特征的昆明医科大学机构知识库建设方案,在具有丰富相关经验的软件公司的协助下,对系统平台进行研究开发,反复测试,建成具有本校特色的昆明医科大学机构知识库服务平台,如图1、图2所示。利用该平台对学校医疗、教学、科研以及管理人员提供服务,帮助学校各级各层次人员在利用成果申报各种基金奖励,科研管理、科研合作、提升成果揭示度和学者影响力、本校各学科之间的对标比较分析等方面发挥了巨大作用。
图1 机构知识库系统架构
图2 昆明医科大学机构知识库首页
3.1 调研设计阶段调研与设计是机构知识库建设的第一步,决定了机构知识库建设的定位和目标。首先对机构知识库需求进行了调研,调研的部门包括各学院、各系、研究所、附属医院以及行政管理部门,调研对象包括师生、临床医生和行政管理人员。在给调查对象充分宣讲机构知识库建设的目标和意义的同时,注意收集和听取他们对机构知识库建设的理解、对机构知识库的个性化需求以及未来机构知识库应该如何发展等具体意见和建议。另外,还对现有IR系统平台进行了调研,了解有哪些开源系统和商业系统平台,这些系统和平台的功能和性能如何,是否有数据清洗机制,如何采集和处理元数据,各自有哪些优缺点等等;还对学校各行政部门的信息系统进行了调研,如科研管理系统、人事管理系统的系统开放性、数据共享、接口对接等等。在遵循机构知识库基本结构和功能的基础上,结合昆明医科大学的特点和需求,以及调研的结果,设计合理、可行、实用的昆明医科大学机构知识库的结构、内容和功能等。
3.2 本机构知识库的主要优势与特色3.2.1 机构成果典藏库
广泛采集昆明医科大学科研成果产出数据,通过对本机构所拥有的所有类型、所有文件格式的知识产品的收集整理形成了“昆明医科大学成果典藏库”。这些知识产品包括公开出版和未正式发表的,形式有:期刊论文、研究报告、教材专著、会议论文、病案(病例)分析、专利和学位论文等成果元数据内容全面,支持引证元数据,包括标题、主要责任人、次要责任人、责任人机构、来源、标识码、关键词、摘要、被引频次、影响因子等几十项。数据采集来源主要包括Web of Science(SCI)、PubMed、中国知网、万方等多种数据源。采集过程中,注意元数据规范和数据质量,建立数据质量控制体系,确保采集数据的完整全面。对采集到的各种类型的研究成果分门别类地导入软件系统的后台数据库中。如图3所示。
图3 机构成果典藏库
3.2.2 机构学者库
机构学者库是本机构知识库的一个重要组成部分,提供从“昆明医科大学”学者的维度去揭示本机构知识成果,揭示本机构学者的综合实力和学术竞争力。学者库的外在表现形式为本机构每个学者都有自己的个人学术主页,内容包括每个学者的全部详尽信息,特别是有关的学术信息。学者库是相对独立模块,其中学者与机构典藏库中的数据相关联。学者文章列表中分别对发表日期、文献(成果)类型、收录情况进行显示、排序。对学者学术历程、合作者、发布期刊进行可视化展现。可提供学者成果引用情况和列表。学者主页信息包括学者的个人简介、学者唯一识别号、研究热点、学术成果、合作关系、研究主题、关联信息、被收录引用下载情况、著作、研究项目/课题等。并将学者的科研产出以可视化的成果图谱进行展示,如图4所示。
图4 机构学者库
3.2.3 提供多维度多层次多类型的检索与浏览
本机构知识库提供多维度多层次多类型的检索与浏览服务,可以对本机构成果进行全方位的揭示与挖掘,使用户对本机构成果有一个更深的了解和理解。
支持全文检索、一键检索、复杂检索、智能联想检索;同时还可以进行包括发表日期、文献类型、发文语种、所属学科、收录类型、全文/无全文的分面浏览。同时支持相关度、题名、年份、被引次数、影响因子等排序方式。在检索结果的显示页,每条成果按题名、作者、来源、收录引用数量、替代计量指标图、推荐数量等进行显示;在成果详细显示页面,显示该成果所有详细元数据信息、引用该数据的格式、与该成果关联的其他成果等。
3.2.4 以数据和图表的形式进行可视化展现
展现与揭示功能能够提供给用户更深层的角度去了解本机构的成果和产出。包括检索结果多种排序方式;每条成果显示内容丰富;多维多层次聚类分析、分面统计;可视化分析展示;学者成果列表;学者成果引用情况列表;可视化展现学者的学术历程、相关合作者、发表期刊等;ESI学科评价、趋势分析等,如图5所示。
图5 可视化分析
3.2.5 有效对接、整合数据资源
对接与整合功能是机构知识库与外界系统进行数据交互的环节,是扩大机构知识库作用和影响的重要功能,也是机构知识库价值的体现。本机构知识库的对接与整合分为三个方面,一是与WoS、ESI、Incites等商业数据库的对接与整合,实时获得本机构成果在相关商业评价数据库中的评价数据信息;二是与科研管理、人事、教学系统进行对接,在实现统一的系统用户认证的同时,实现数据交换,避免用户数据和成果数据重复建设,实现机构内的数据共享和一致,避免形成信息孤岛,大大节省人力和物力。三是与学科评价和趋势分析系统对接,实现数据交换,从而保证评价系统数据的准确性和精确度,确保评价和预测系统结果的真实性和正确性,也提高了学科评价系统和趋势分析系统的实用价值和可信度。
3.2.6 引入人工智能技术进行数据清洗
数据清洗一直是行业内在建设机构知识库过程中必须要面对的困难和瓶颈。很多机构库都是因为没有对数据进行有效清洗,从而导致最终的机构成果不可信、不可靠而失败或停滞不前。
数据清洗技术是一项比较复杂的数据处理技术,本机构知识库开创性地采用合作网络分析技术、语义挖掘技术、语义关联和联想技术等人工智能技术进行数据的清洗和优化,力求使清洗的数据达到一个极高的准确率,并保证依据此数据做出的各种聚类统计和分析结果准确无误,真实反映学校某个院系、学科或者学者的真实状况和实际学术影响力。目前,本机构知识库的消歧率可达98%,且机构的学术成果皆可准确分配至二级学院及各附属医院。
从各种数据来源采集的数据往往存在机构名称、作者姓名的变异表达,同名同姓、不同作者英文名相同等大量歧义现象和错误,很多研究成果如果不加处理很难定位到某一院系(医院)或特定作者,因此要对采集的数据进行清洗和规范化,这样才能保证机构库统计分析的结果真实可信。数据清洗主要分为机洗和手洗,以机洗为主,手洗为辅。机洗即根据数据歧义或错误的原因和特点,编制相应的计算机程序对有关数据进行智能判断和归类、聚类,从而消除原始数据带来的歧义现象。对于偶发错误导致的歧义,辅以手工清洗(即手洗)纠正,最终保证数据的全面完整和准确。
3.2.7 机构知识库的可持续发展
一是数据更新机制。机构知识库数据能否及时更新和清洗是机构库可持续发展的关键。本机构知识库提供了三种数据更新模式,一是每周从数据中心自动更新;二是用户手动更新,通过填写SCI检索式同步更新(需要SCI使用权限),被引用频次、热点论文、高被引论文实时更新;三是从相关来源数据库下载XLS批量上传更新。归纳起来,本机构知识库提供二种数据更新方式。其一,依托后台的强大功能每周自动数据更新,各院系、学者文献根据检索式自动认领。其二,为管理员开发强大灵活的工具,可以针对某类或某二级机构的定向更新,做到查漏补缺,与第一种方式配合完美实现机构库数据的持续更新。
二是应用多维度多层次聚类统计和分析技术。聚类统计分析的维度和层次越多,对系统的快速聚类、归纳组合、分类等数据处理能力要求就更高。本机构知识库为每项成果提供全方位的信息展示,包括基本信息,各类评价信息等,这些评价数据实时更新。同时提供多维度、多层次的聚类统计分析,为学校各层级管理者和所有学者提供多种视角的数据支撑服务。系统提供作者、地址、第一作者地址、通讯作者地址、期刊、年代、院系、科室、学科、被引频次、影响因子、关键词、医学主题词等30多项聚类项供用户选择,并能够对前一个聚类结果进行多层次不同维度的反复聚类,直到得到自己需要的特定结果。
三是推广应用阶段主要以“政策约束”和“利益引导”的方式实现校内“人人关注、人人参与”后续数据维护的运行方式,保证机构知识库的可持续发展。在推广至全校各学院、各院系、各附属医院的全体师生和管理人员使用时,注意收集反馈意见和建议,不断修正和完善机构知识库,及时在系统平台中进行纠正和更新。
4 结 论为了适应当前智慧图书馆的建设,更好地解决机构科研能力产出分析的难题,更好服务学校一流学科建设,积极探索图书馆创新知识服务模式,本机构知识库在遵循IR基本结构和功能的基础上,结合昆明医科大学实际和特点,通过SWOT分析法来确定IR的建设需求,以用户需求为中心,突出学科评价功能,应用多维度多层次聚类统计和分析技术可视化呈现本机构知识成果。同时,为保证数据的全面完整和准确,引入人工智能数据清洗技术,开创性地采用合作网络分析技术、语义挖掘技术、语义关联和联想技术等人工智能技术进行数据的清洗和优化,真实反映本机构知识成果和学者的学术影响力。高校机构知识库的建设、维护和使用是一项长期的系统工程,高校图书馆应敏锐地把握信息技术发展的趋势,将大数据、互联网、区块链、人工智能等技术融入图书馆的智慧服务中,创新知识服务模式,不断提高高校图书馆的服务能力。