龚世军
随着互联网的发展,我国档案管理方式和技术正不断发生变化。数字化档案管理模式广泛使用,在电子商务、资源管理、土地管理和财政管理等方面发挥出越来越重要的作用,强化管理的质量和效率。档案管理信息化高度结合互联网技术,顺应了时代发展的趋势,有效提升工作人员的工作效率。档案管理作为档案事业的主体,始终使政府部门和相关部门管理的工作重点,如何利用大数据前沿基础促进档案管理工作质量和水平,成为档案管理工作开展的重要问题。
一、档案管理的大数据关键技术
1、大数据云计算技术
大数据云计算主义以MapReduce技术为机制,通过网络将抽象、伸缩和便于管理的数据进行加工,以数据服务和存储的形式传递给数据用户,主要包含服务、平台服务和原件服务等内容。云计算技术以MapReduce数据处理技术为基础,在对数据进行挖掘和分析以后,对数据进行分类存储,使数据更加平稳和准确地传递给终端用户,解决数据分布不一的问题,使数据统一筛选和调用。
2、可视化技术与虚拟现实化技术
可视化技术是解决大数据管理问题的有效手段。对数据分析结果的象化处理和现实,能够对概念事物、虚拟事物、实体事物进行统筹管理,将数据转化为能够被人所理解的图形或图像,并进行交换处理,使虚拟事物与现实事物有效结合,更容易被用户所理解和接受。
二、大数据技术在档案管理建设中的应用
1、虚拟现实技术的档案数据备份
实体档案由于存储不便、查找耗力、规格特殊、形态各异等特点,使档案工作开展困难。通过虚拟现实基础的使用,减少对档案的调用,记录档案存储位置,形成独立的虚拟存储空间,并于现实档案管理工作结合,能够有效提升档案管理工作的规范性,解决实物档案备份问题、保存问题和损耗问题。
数字资源主要分为在线数据、近线数据和离线数据。大数据技术具有实时性和动态性特征,因此,数字资源的三种形式都是采集对象,为使数据具有代表性,需要对数据收集方式进行调整。虚拟现实技术能够将档案数据化,便于工作者查找相关的档案数据,使数据查找的结果更加值观,数据查找过程更加便利。
2、Hadoop档案数据管理基础
云计算和云存储技术的使用,让档案完全虚拟化成为可能。不同于单机服务器和局域网档案存储方式,云存储技术通过搭建Hadoop平台,能够有效进行大数据的只能分析,实现档案虚拟存储和调用,提升档案管理和数据的安全性。Hadoop档案管理技术能够以云数据库为基础,降低使用者的数据管理难度,节约档案管理的空间。同时以Spark内存计算技术、HBase数据库技术进行数据处理,实现数据智能分类、查找和分析,支持关键词查找和搜索,使档案管理形式更加便利,提升档案管理的效率。
3、语义本体和静态离线排序方式
经过长时间的档案管理工作,我国档案管理的内容较多、分类较广,数据种类和结构多样,是阻碍档案管理工作进行的主要因素。于一本体的档案数据结构转换,能够将半结构化和非结构化的数据进行整理,实现误导词消除、歧义消除和词义判断的扩展查询,采用词义相关性的方式,对主题进行筛选,有效保持检索的有效性。静态离线排列,将优先提取在线数据、近期数据,解决语义检索的精度低、个性化程度不高、检索召回率低等问题,提升排列的合理化,实现档案职能排列。
4、档案管理三维可视化模式的探索
“三维数字档案馆”是指在互联网平台下,以现实档案管理工作场所为基础,建立与实体数据库1:1配置的网络数据库,实现实物档案数字化、可视化。运用“数字档案馆”实现实物档案管理的可视化主要以物联网为基础,通过物品信息的交换和通信,职能对档案进行识别、定位、追踪、监控和管理,实现档案的系统化和精细化管理。在档案管理中,凭借电子标签、阅读器、服务器等基础,实现档案管理环境建设,再以自动感知、智能调节、档案追踪等功能,实现实物档案管理监控,从而提升管理效率,降低管理成本。
大数据时代下,档案管理建设需要不断加强创新力度,围绕核心业务和核心价值,建立数字档案管理模式,挖掘数据价值,建立档案管理数据共享制度,推动云计算基础实施。建立数字化档案管理基础,重视云计算基础创新,开发语义分析、数据挖掘、虚拟现实等新技术的使用。同时,互联网下的档案管理制度也存在资源浪费和数据保密问题,为解决社会服务问题,档案管理部门要建立完整的数据调用制度,保持档案信息的机密性和开放性。(作者单位:湖北竹溪县融媒体中心)


















