大数据是继互联网、云计算之后的又一场信息技术革命,正在对各行各业产生深远影响。大数据不仅数量巨大,而且类型多样,具有Volume(大量)、Variety(多样)、Velocity(高速)、Value(价值)4V特征。在大数据时代,数据已经成为继土地、劳动力、资本、技术之后的第五大生产要素,谁掌握了数据,谁就掌握了发展的主动权。档案是组织或个人在社会活动中直接形成的原始记录,具有凭证、查考和保存价值,是一种特殊的信息资源。传统档案大多是纸质文件,随着信息技术的发展,电子文件、数字档案日益增多。如何适应大数据时代要求,充分挖掘和利用蕴藏在海量档案中的价值,是摆在档案工作者面前的一个重大课题。
大数据环境下档案数据化管理的内涵
档案数据化管理是指运用大数据理念和技术,对档案收集、整理、保管、利用的全过程进行数据化改造,将档案信息转化为数据资源,提高档案管理的精细化、智能化水平,更好地服务于决策和社会民生的一种新型管理模式。其核心要义在于三个转变。一是从事后管理向事前防范、事中控制、事后监督的全过程管理转变;二是从被动响应向数据感知、智能分析、快速反应的主动服务转变;三是从单纯的档案保管向知识归纳、深度利用、价值提供的知识服务转变。
具体而言,大数据环境下的档案数据化管理主要包含以下几方面。档案数据的标准化采集,运用物联网、移动互联等新技术手段,开发个性化采集工具,提高档案数据采集的全面性、准确性和时效性;档案数据的规范化管理,建立科学的档案数据分类体系和元数据框架,规范数据的编目、著录、存储格式,提高数据质量;档案数据的关联化整合,利用大数据技术,打破档案业务系统间的壁垒,实现跨系统、跨部门、跨地域的数据汇聚融合,形成互联互通的档案数据中心;档案数据的智能化分析,运用数据挖掘、机器学习等技术,对档案大数据进行分析、预测、优化,提炼知识,发现规律,为科学决策提供参考;档案数据的立体化利用,创新服务方式,开发特色数据产品,通过网站、App、自助终端、可视化大屏等渠道,为政府和社会提供个性化、精准化的档案数据服务。
档案数据化管理是大数据时代档案工作的新模式,通过数据化管理,可有效破除档案管理中的数字鸿沟、信息孤岛等障碍,实现档案信息资源的集约管理和高效利用,这不仅是提高档案管理水平、适应信息化发展大势的现实需要,更是主动融入国家大数据战略、服务经济社会发展的必然选择。
大数据环境下档案数据化管理面临的挑战
推进档案管理数据化转型,是大数据时代赋予档案工作的崭新使命,但从目前情况看,档案数据化管理还面临诸多亟待破解的难题和挑战。
档案数据采集标准不统一,数据质量参差不齐
档案数据是开展档案数据化管理的基础,采集质量的高低直接影响后续管理和利用的效果。当前,档案数据采集缺乏统一的标准规范,不同系统、不同时期采集的数据,在格式、编码、属性等方面差异较大,不同类型载体形成的档案在数字化处理方面也缺乏统一要求,造成数据质量参差不齐,后续数据整合共享难度大。同时,重要的档案信息如历史档案、纸质档案等数字化程度不高,信息损失严重,海量的非结构化数据如音频、视频、图像等,缺乏规范的元数据描述,数据价值难以发掘。
档案数据治理体系不健全,数据共享利用难度大
科学完善的数据治理体系是保障档案数据化管理有序开展的关键。然而,目前档案大数据缺乏顶层设计,数据管理职责分散在不同部门,缺乏统筹协调,档案数据标准规范不健全,数据质量控制和评估机制不完善。档案数据共享机制不顺畅,部门间信息壁垒突出,“数据烟囱”屡见不鲜,尤其是涉密、敏感档案数据与开放数据的界限模糊,共享和安全的平衡点难以把握。再加上档案工作人员整体的数据治理意识和能力不强,数据资产管理观念淡薄,直接影响档案数据开发利用的广度和深度。
档案数据安全面临新的风险与挑战
随着档案数字化进程的不断加快,档案数据逐渐从线下向线上迁移,由内网向外网延伸,接入点日益增多,攻击面持续扩大,数据泄露、毁损、篡改等安全风险加剧。部分档案部门的数据安全意识淡薄、制度不健全、措施不到位,存在账户权限混乱使用、日志审计缺失、身份鉴别不严、访问控制不当等问题,内部人为泄密等现象也时有发生。同时,部分档案数据脱敏不彻底,导致个人隐私、商业秘密等敏感信息存在被二次识别的风险隐患,特别是随着移动互联网、物联网等新技术在档案领域的渗透应用,数据采集环节的不确定性、开放性增强,黑客攻击、病毒侵害等安全风险进一步加剧。
档案数据分析利用水平不高,增值服务能力不足
档案大数据蕴藏着巨大的应用价值,但目前档案部门普遍存在数据分析不深入、开发利用不充分的问题。受制于专业数据分析人才匮乏、数据分析工具落后等因素,部分档案部门难以从海量数据中及时挖掘有价值的信息,数据利用大多局限在检索查询层面,知识发现和深度分析能力不足,数据增值服务短板明显。同时,档案数据开放共享的广度和便捷度不够,社会公众获取和利用档案的渠道不畅,传统的档案利用方式单一,服务模式陈旧,档案的经济效益和社会效益难以充分释放。如何创新利用模式,开发有特色的档案数据产品,提升档案数据化管理的价值转化能力,是新形势下档案部门面临的现实课题。
大数据环境下档案数据化管理的关键任务
应对挑战、破解难题,需要系统谋划、创新驱动、多管齐下、协同推进,笔者认为,要推动档案数据化管理迈上新台阶,重点要抓好以下几方面。
加强顶层设计,健全档案数据治理体系
当前,大数据时代给传统档案管理模式带来诸多挑战,档案工作必须与时俱进,站在战略和全局的高度,通盘考虑、系统谋划,科学制订契合时代要求的发展蓝图和路线图。这就要求各级档案部门要把加强顶层设计摆在突出位置,统筹规划、整体推进,构建权责明晰、运转协调、制度完备的档案数据治理体系,为档案事业长远发展提供根本遵循。
首要任务是制订档案数据治理总体方案,档案部门要充分借鉴国内外大数据治理的先进经验,立足本地区、本部门实际,研究制订切实可行的中长期发展规划和年度工作计划。发展规划要着眼长远、统揽全局,明确未来一个时期档案数据治理的指导思想、发展目标、重点任务,特别是要对标数字化发展趋势,提出推进档案数据治理数字化转型的时间表、路线图,年度计划要细化量化规划目标,突出阶段性、操作性,为各项任务落地见效提供可靠抓手。规划和计划的制订要坚持开门问策、凝聚共识,充分听取各方意见建议。组织保障是顶层设计的关键一环,建议参照大数据管理的通行做法,成立由分管领导任组长、相关处室负责人参加的档案数据治理委员会,作为统筹协调、指导推进的领导机构,领导小组要加强统筹谋划和宏观指导,及时协调解决工作中的重大问题,理顺档案、政务信息资源等相关部门的职责边界,建立统一领导、分工协作、齐抓共管的工作机制,要明确牵头部门,负责档案数据治理的日常组织实施。
创新采集方式,提升档案数据质量
档案数据质量是大数据应用的生命线。当前,不少地方和部门的档案数据存在着来源单一、质量不高、缺失较多等问题。提升数据质量,既需要创新思路、拓宽渠道,也需要规范流程、强化管理,多措并举构建全方位、多层次的数据质量保障体系。统筹利用多渠道多方式采集是档案数据质量提升的重要途径,传统档案数据主要依靠人工采集,耗时费力、效率不高。大数据时代,海量数据无处不在、无时不在,档案采集要顺应时代潮流,借力物联网、移动互联、社交媒体等新技术和新渠道,通过智能设备自动采集、网上登记归集、社会众包等灵活多样的方式,最大限度吸纳第一手的真实数据。要坚持线上线下一体化采集,将实体档案数字化采集与网上信息资源归集相结合,确保档案资料全覆盖、无遗漏,为后续数据治理和利用夯实基础。科技赋能是提高数据采集质量和效率的关键所在。当前,档案数据呈现海量化、多样化、非结构化的鲜明特点,传统人工采集方式已难以为继,迫切需要运用现代科技手段破解瓶颈制约。要紧跟信息技术发展前沿,综合运用人工智能、语义分析、模式识别等新兴技术,开发集成度高、识别准确率高的智能化采集工具,针对性解决档案图片、音频、视频等特殊载体档案的采集难题,最大限度减少人为失误,不断提高采集的自动化和智能化水平。
完善共享机制,促进档案数据开放利用
打通数据壁垒,营造数据要素自由流动的制度环境,最大限度地释放档案数据红利,是新时期档案工作的应有之义。建立健全档案数据共享机制,制订本地区、本部门档案数据共享管理办法,明确共享原则、共享内容、共享方式、共享程序等,依托政务信息资源共享交换平台,加快档案信息系统互联互通,促进档案与政务、公安、民政、人社等部门数据的共享交换。丰富档案数据社会化开放途径,主动对接“互联网+政务”服务,将档案数据服务事项纳入网上政务服务事项清单。利用大数据、云计算等技术,建设功能完备的网上档案大厅,开通网上查档、掌上档案等服务,让档案数据“走出去”,服务“跑得快”。创新开发档案数据融合产品,聚焦党史、军史以及口述历史、名人档案、家谱族谱等专题,开发特色档案大数据产品。面向智慧城市、智慧交通、智慧旅游等应用场景,开发档案数据增值服务,提升档案数据的经济价值和社会价值,坚持安全与开放并重,分级分类编制档案开放目录,细化开放条件,做到应开尽开、应密则密。严格落实数据脱敏技术标准规范,防止隐私泄露,全面梳理数据共享开放的风险点,完善防控措施,筑牢数据安全防线。
强化安全防护,保障档案数据安全
档案数据是国家重要的战略资源,其安全事关国家安全和利益,要把数据安全摆在档案数据化管理的突出位置,强化风险意识,健全制度措施,全面提升档案数据安全防护能力。健全数据安全管理制度,制订数据分类分级、数据脱敏、个人信息保护、数据备份等管理制度,规范数据血缘管理,明确岗位数据安全责任,严格执行信息系统等级保护制度,常态化开展风险评估、安全审查、检查整改等工作,加强数据全生命周期安全防护。在数据采集、传输、存储、处理、交换、销毁等环节严密防控,综合运用身份认证、访问控制、加密保护等技术手段,构建全流程数据安全防护体系,强化数据基础设施安全防护,提高数据中心、机房等重要数据存储与运行场所的物理隔离和访问控制水平,及时更新防火墙、防病毒等安全软硬件,加强僵尸网络监测和网络攻击溯源,加大数据泄露监测力度,定期开展数据泄漏检测,及时堵住各类数据泄露点。完善网络舆情监测预警机制,加强对涉档舆情的动态监测和应急处置,强化内部人员安全管理,加强保密宣传教育,定期开展保密专项培训,牢固树立“保密意识人人有,保密责任个个担”的思想。完善人员保密承诺、上岗资格审查等管理制度,强化内部人员行为监督管控。
深化数据分析,提升档案数据价值
大数据时代,数据应用是档案事业发展的生命线,要积极应用大数据分析技术,着眼经济社会发展和民生保障的迫切需求,加强档案数据的深度挖掘和价值转化,促进档案大数据创新应用。加强档案大数据人才队伍建设,大力引进和培养复合型人才,打造一支懂档案、善技术、会管理的高素质档案数据分析团队,通过内部培养与社会化引进相结合,重点加强档案数据治理、数据分析、数据安全等方面的人才培养。依托高等院校、科研院所等力量,建设档案大数据联合实验室,搭建产学研用协同创新平台。通过体制机制创新,集聚跨界人才团队,开展档案大数据前沿技术和应用模式研究。创新档案数据分析应用,综合运用关联分析、聚类分析、演化分析等数据挖掘技术,深入挖掘档案大数据的关联性、周期性和趋势性特征,为政府决策、企业管理、社会治理提供参考。在应急管理、信用体系、廉政警示教育等领域,创新开展档案大数据专题分析和可视化呈现,探索建立新型档案大数据服务模式。积极对接党政机关、企事业单位需求,建立需求导向的大数据服务机制。在财政、审计、统计等部门建立数据分析服务站,为社会治理、民生服务等提供精准服务。
大数据时代,信息资源已成为推动经济社会发展的战略资源,档案工作要主动顺应时代变革,树立大数据理念,创新工作思路,加快推进档案管理向数据化转型升级,为党和国家事业发展提供优质高效的档案数据服务。推动档案数据化管理,需要系统谋划、深入实践,久久为功,要着眼长远,加强顶层设计。以健全的数据治理体系为支撑,以严格的标准规范为抓手,分步实施、持续推进。要问需于民、问计于企,加强与各行业各领域的合作,主动融入经济社会发展,创新开发更多“接地气”、有温度的档案数据服务产品。要坚持安全与开放并重,在保障数据安全的同时,有序推进数据共享开放,让档案大数据在阳光下流动,在开放中增值。站在新的历史起点,面对大数据浪潮的汹涌来袭,档案部门唯有勇于变革、主动求新、接续奋斗,在数据化管理的道路上久久为功、善作善成,才能不断开创档案事业发展新局面,为服务党和国家工作大局、促进国家治理体系和治理能力现代化作出新的贡献。
(作者单位:广州历康信息科技股份有限公司)