首页 > 区域经济 > 数字档案资源长久保存和备份技术的思考与探索
2024
06-13

数字档案资源长久保存和备份技术的思考与探索

摘 要:随着互联网的不断发展,数字化档案应运而生,与传统纸质档案不同的是,数字档案借助网络方式呈现档案信息,能够为使用者提供便捷的服务。但因为数字档案管理相关的技术更新速度快,具有典型的动态性特征,所以也增加了数字档案资源的保存难度。在分析数字档案资源长久保存和备份现实需要的基础上,从存储介质、容量危机、安全等方面总结了其面临的挑战,并分析具体保存技术,借鉴欧盟PLANETS(数字资源长期保存计划)项目构建“目标树”框架结构,为相关企事业单位开展数字档案资源长久保存和备份提供参考依据。

关键词:数字档案资源;保存和备份;“目标树”

在互联网快速发展的新经济时代下,各企业事业单位的数字档案资源日益丰富,如何对其进行保存和备份,成为影响单位长远发展的重要课题。2022年6月,国务院官网发布《国务院关于加强数字政府建设的指导意见》,提到要“深化电子文件资源开发利用,建设数字档案资源体系,提升电子文件(档案)管理和应用水平”。数字档案资源将数字技术作为基础,借助磁、光等实现资源存储,运用网络通信技术再现档案信息,能够为档案资源使用者提供快速检索、高效传输服务。但由于其对网络设备的依赖较高,因此在保存中也面临很多挑战,包括存储介质挑战、数据容量挑战、安全挑战等,亟须探索更为先进的数字档案资源长久保存和备份技术。

一、数字档案资源长久保存和备份的现实需要

数字档案资源长久保存和备份,是企事业单位在发展运行中不可或缺的一项工作。在数字化经济时代下,各行业的运行都离不开数据信息,需要从海量数据信息中挖掘有用的内容,为企业发展助力。而数字档案资源则是对企业运行过程的全面反映,包含企业各环节的数据信息,是否能够对其进行科学保存和运用,直接影响企业战略规划的制订,进而关系企业竞争力的提升。在过去,很多企业管理者忽视档案资源管理,将主要精力放在业务活动和市场营销等方面,导致档案管理成效不显著,难以从各类档案资源上全面分析企业的运行轨迹,使得战略规划的制订缺乏支撑。新时代下,应通过改革档案资源管理模式,创新档案资源管理过程,提升档案资源管理的成效。尤其是要注重对数字化档案资源的管理和保存,利用一系列先进技术提升数字档案资源的保存成效,实现各类档案资源信息的高效流通和深度运用。

二、数字档案资源长久保存和备份的挑战

(一)存储介质挑战

数字档案资源保存和备份离不开磁带、磁盘、光盘、U盘等存储介质,但这些存储介质很容易受到保存环境、读取技术的影响,一旦出现损坏,就难以对数字档案资源进行科学保存,甚至会导致数字档案资源的丢失。具体而言,在存储介质上数字档案资源保存与备份的挑战主要来自两个方面,分别为人为因素和载体自身因素。在人为因素上,需要做好对存储介质保存环境的管理,不同保存环境会影响存储介质的寿命,进而影响档案读取效果。如在对光盘进行保存的过程中,通常需要对其进行垂直存放或者水平存放,且要将其保存温度设置在4℃~20℃之间,并将保存湿度控制在20%~50%,昼夜温差控制在2℃以内,湿度波动控制在5%以内。而实践中很多人员因为不了解光盘保存环境,所以导致光盘的使用受到了影响,数字档案资源难以被有效运用;从载体自身层面来看,需要考虑介质寿命、读取技术等,光盘的寿命通常在10~20年之间、磁带的寿命通常在30~50年之间,磁盘的寿命相对最短,通常在3~5年之间。实践中一些人员因为未考虑介质使用寿命,没有在存储介质寿命到期前及时对数字档案资源进行备份提取,导致很多信息被丢失。

(二)容量危机挑战

容量危机挑战指的是数字档案资源保存和备份过程中所面临的容量风险。在网络时代下,各类数据信息快速汇聚,发生了爆炸式增长,但存储系统中控制器的处理能力是有限的,面对大容量的数据信息,处理器容易出现瘫痪、失效等问题,从而导致数字档案资源的使用受影响。2003年人们创造了5EB的数据,而在2011年,只用一天多的时间就可以产生5EB的数据,到了2013年,只用不到10分钟的时间便产生了5EB的数据,截至2022年,数据总量已经增长到了61.2ZB。《华为全球产业展望GIV》预测,到2025年全球将产生180ZB数据。随着数据的不断扩容、增长,数字档案资源保存与备份面临的挑战更大,目前,我国各行业被保存的数据不足2%,仍有大量的数据待保存和备份。在这种情况下,如何解决数据容量问题,为数字档案资源长久保存和备份提供有利环境,成为有待思考的问题。

(三)安全挑战

安全挑战也是数字档案资源长久保存和备份所面临的一个重要挑战。当前,受到利益的驱使,一些不法人员利用网络系统漏洞和植入木马病毒的方式盗取企业数字档案资源,导致企业核心机密丢失,日常运行受到影响。例如,在2022年4月份,境外黑客组织和不法人员瞄准西北工业大学,为该校师生发送了一封带有木马病毒的钓鱼邮件,导致该学校内部信息系统失灵,师生数据信息被泄露,威胁到了学校稳定运行。

三、数字档案资源长久保存和备份的技术类型

(一)云备份技术

云备份技术是近年来随着互联网的快速发展而产生的一种数字档案资源保存和备份技术,具有利用率高、容量高、安全性高、成本低等优势,能够自动化管理数字档案资源。同时,在管理过程中还可以进行并行分布加工,将数字档案信息分布于关联网络中相关的备份节点上,并借助远程设备与其他客户端连接,从而实现资源共享和互通,拓展数字档案资源的保存利用空间。目前,很多单位已经引入了云备份技术,但所构建的云平台和保存系统还不是十分完善,相互之间并不统一。

(二)异质备份

异质备份指的是对各种不同载体的档案信息进行备份,这里的“异质”主要指的是不同形态的档案资源,包括磁带、磁盘、光盘等。对数字档案资源进行异质备份,能够实现对各类档案资源的分类保存和处理,促进档案资源形态的多元,便于档案利用。一般状况下,数字档案资源保存中异质备份的方式有两种:一种是将书面资源或者不太清晰的音频资源转化为数字方式进行保存和备份;另一种是实现数字档案资源的数字化异质缩微或者书面备份,例如将图片、影像等数字化档案资源缩微成影像。各企事业单位可根据实际档案资源运用状况选择合适的保存与备份方法。

四、数字档案资源长久保存和备份技术的实践探索

数字档案资源长久保存和备份,是事关企事业单位长远运行的重要工作,要充分运用先进的技术构建数字档案保存和备份系统,并提升系统建设的科学性和规范性,降低安全风险,规避存储介质挑战、容量危机挑战及安全挑战。在实际探索中可参考欧盟PLANETS(数字资源长期保存计划)项目,构建与企业发展相符合的“目标树”数字档案资源长久保存和备份体系。

(一)构建“目标树”框架结构

“目标树”数字档案资源长久保存和备份技术运用树形结构建设档案管理体系,按照层次高低设置可测量的目标,并运用实验的途径对目标和技术方案进行评估,最终依据实验结果分析技术方案,确定是否符合单位发展需要。具体来看,“目标树”数字档案管理系统的创建主要从四个层面着手:

1.创建目标树。结合企业对数字档案资源保存的需要划分档案信息,形成自上而下的档案管理目标,每一层目标包含4个档案特征,分别为文件特征、过程特征、成本问题、记录特征,在这些特征的基础上形成不同的档案管理重点。在划分好层级和目标之后,为每一个目标分配可测量单位,如色彩深度位数、每秒帧数等,并结合这些测量单位,开展档案信息管理活动,将其视为技术方案的评估依据和实验指标。再借助Plato(自动指导操作程序设计逻辑)创建目标树,如果在创建目标树过程中条件不够,那么可以直接从知识库提取目标树片段,或者运用模板进行创建。

2.测试技术方案。在创建好“目标树”之后,需要测试技术方案。该环节是目标树框架下数字档案资源长久保存和备份的一个重要步骤,旨在通过对技术方案的测试,明确系统运行状况,并通过有效途径提升系统的可行性和操作性。在测试过程中依托测试平台Testbed(试验台)进行,测试完成后对比分析实验结果,根据结果确定是否需要开展二次实验。

3.分析与比较技术方案。对技术方案的实验测试结果进行转换,并根据具体目标分配权重系数运用聚合函数Sum of Differences(差额总和)计算保存方案的总效用值和分效用值,最后根据计算结果对各个方案进行排名,形成排名列表。

4.选择保存方案。在上一步的基础上,根据排名列表选择最优秀的保存方案,并根据保存方案制定保存计划,将其存储于知识库中,为数字档案资源长久保存和备份提供有效帮助。

(二)“目标树”经验分析

1.寻找客观依据,提升技术方案的可操作性。由于数字档案资源保存与备份技术的选择是否科学,直接影响数字档案资源的保存效果,影响企事业单位的可持续运转,进而影响行业及国家经济的发展。因此在选择保存方案的过程中要学会寻找客观依据,尽量提升技术方案的可操作性。在上述方案中引入了Testbed(试验台)实验,实验过程其实就是寻找客观依据、分析技术方案的过程。通过检验和分析,可以提升实验过程的科学性,增强实验的可重复性,从而促进实验文档的有效运用。而对实验结果做出排名列表,并展示技术方案与目标匹配度,则是为了提升选择的科学性与合理性,降低风险,提升数字档案的可用性。

2.合理选择测量尺度与标准,实现各核心环节的串联。在设计方案过程中,合理制定测量标准,并选择测量尺度,能够提升方案设计的科学性。从某种程度上来看,创建数字档案资源保存与备份管理的“目标树”,就是为了促进各环节串联,提升档案资源的可用效果和保存效果。而精细化选择测量尺度与标准,则是为了更全面地测量技术方案,提升其可用性,达到良好的保存、管理与和运用效果。

3.内外部评价有机交融,优化选择进程。在创建“目标树”过程中,对技术方案开展内部粗劣评估和外部精准评估,通过“精准比较+模糊匹配”提升创建的有效性,实现各项进程的优化与完善,从而能够为数字档案资源长久保存与备份提供良好的环境。

4.实现全面保护、长期保存。在整个方案设计中,不仅结合数字档案资源特征对技术方案进行选择和优化,而且充分考虑各项影响因素,包括监测规则、成本估算、决策证据等,打破传统的选择范围,促进了选择空间的扩展。并且还从宏观上规划优化空间,形成全面性、系统性保存计划,为数字档案资源长久保存提供了有利条件,避免档案资源受损。此外,“目标树”框架设计科学合理、考量周全,从数字档案资源各环节进行系统设计,对于构建长期保存体系具有现实意义,能够推动档案管理工作的可持续开展。

五、结束语

数字化档案资源保存和备份是新时代下企事业单位内部管理的一项重要工作,通过对数字化档案资源进行保存和备份,能够为单位长远发展带来很多便利。但受到多种因素的影响,目前我国很多企事业单位对数字档案资源保存与管理还不够重视,导致档案信息出现了毁损现象,未来仍需在该项工作上多做努力,进一步提升数字化档案资源保存与备份的成效。
(文 / 韩童童)

(作者简介:韩童童,潍坊职业学院,本科,科员,研究方向:档案管理。)

参考文献

[1]聂曼影,陈吉.面向档案数字资源的电子文件标准化研究[J].信息技术与标准化,2023(06):8-10.

[2]马海杰.数字人文赋能档案资源开发:逻辑联结、价值阐释与策略选择[J].档案天地,2023(06):47-50;31.

[3]焦扬,李林,范海斌.基于数字连续性思想的企业数字档案资源建设探索[J].办公室业务,2023(10):140-142.

[4]胡柳莹.档案数字资源长久保存和备份技术的思考与探索[J].兰台内外,2023(01):16-19.

最后编辑:
作者:《大陆桥视野》
我们依托《大陆桥视野》杂志的优质、独家资源,传递丝绸之路经济带建设的各方信息,展示专家、学者、从业者针对大陆桥和丝路经济带建设的观点和言论,希望能够为推动丝路经济带的建设贡献应有的力量。

留下一个回复

你的email不会被公开。