杨仙瑜 李章华 曹泽
摘要: 随着数字经济下大数据、云平台、互联网、区块链技术的不断完善和发展[1],传统的数据恢复技术已经无法有效地处理海量数据集合中发生的数据灾难。本文探索以人工智能数据技术应用于数据恢复领域,提升传统数据恢复算法的计算能力,对海量数据进行实时、高效、准确地处理,实现数据准确、高效的重构和恢复。
关键词:人工智能; 数据恢复; 海量数据; 重构;
0 引言
大数据时代的到来,标志着数据将成为人类发展的关键。随着大数据、5G技术、互联网技术、人工智能技术、区块链技术的不断完善和发展,对传统的数据恢复技术带来了变革和挑战,传统的数据恢复技术已经无法有效地处理海量数据集合中发生的数据灾难[2]。因此,开发一款集互联网技术、大数据技术的人工智能数据恢复软件成为解决这一问题的关键,人工智能数据恢复软件将人工智能和传统的数据恢复技术相结合,提升传统数据恢复算法的计算能力,对海量数据进行实时、高效、准确地处理,实现数据准确、高效的重构和恢复。
通过人工智能数据恢复软件的研发,可对海量数据进行实时、高效、准确地处理和恢复,满足大数据时代与日剧增的数据恢复需求,通过机器学习,预测分析数据丢失的因素,通过不断地模拟学习,不断调整算法以从各种不同的场景中实现数据的恢复。
1 人工智能数据恢复介绍
数据恢复技术是指通过各种技术手段对丢失和遭到破坏的数据进行恢复和重建,是一种跨硬件平台、软件系统,包容了操作系统、文件格式、数据库结构、数据存储原理、存储硬件设计等多种要素的综合技术数据恢复。传统的数据恢复技术即通过恢复软件、恢复设备对存储介质的数据进行恢复的过程,传统数据恢复软件由于受存储介质的制约,数据恢复针对性强,扩展性差,没有形成规模化的恢复。
人工智能数据恢复技术即将大数据、互联网技术、人工智能等技术和传统的数据恢复技术相结合,对传统数据恢复技术进行变革,提升传统数据恢复算法的计算能力,对海量数据进行实时、高效、准确地处理,实现数据准确、高效的重构和恢复的技术,人工智能数据恢复软件扩展性强,通过预测分析模型,更好地将不同的代码串在一起,以确保它被正确地重构,实现对各种不同的场景中数据的恢复。人工智能数据恢复软件集成多款数据恢复功能,通过预测分析,加入了智能分析的因素,使得系统可以不依靠固定介质,具有系统推广性强、适应范围更广、数据恢复准确率更高以及恢复效率快等特点。
2人工智能数据恢复原理及技术路线
人工智能数据恢复的原理即对丢失和遭到破坏的数据进行重构的过程。存储介质数据丢失后,数据内部结构被打乱成乱码,需要通过算法进行重组和拼合,系统结合大数据获取海量数据恢复案例,通过机器学习对算法进行清洗和提取,对具体的数据恢复案例进行智能分析,根据分析结果选择最佳的算法。同时通过深度学习不断调整算法,对预测分析模型进行训练,将代码进行重构,从而实现数据恢复。
综上,人工智能数据恢复路线如下图:
3 人工智能数据恢复关键技术
人工智能数据恢复系统采用的技术有数据备份技术、碎片重组技术、数据重构技术、数据迁移技术、互联网技术、机器学习技术和深度学习技术等。
数据备份技术:即以只读的方式对故障系统做完整镜像的技术,主要采用逐档及镜像两种手段。
碎片重组技术:即基于信息熵特征提取算法,结合支持向量机作为分类器来分类文件碎片,并使用基于磁盘簇逻辑顺序的重组算法对文件碎片进行重组的技术;
数据重构技术:指根据损坏的NTFS文件系统残留信息对文件进行初拣的技术;
数据迁移技术:对历史数据进行清洗、转换,并转载到新系统的过程;
互联网技术:指互联网的技术、平台、商业模式和应用与移动通信技术结合并实践的技术,用户使用手机、平板电脑等移动终端,通过移动网络获取互联网服务。
机器学习技术:机器学习是人工智能(Artificial Intelligence, AI)的核心,是使計算机具有智能的根本途径,它主要使用归纳、综合而不是演绎。机器学习就是探究和开发一系列算法来如何使计算机不需要通过外部明显的指示,而可以自己通过数据来学习建模,并且利用建好的模型和新的输入来进行预测的学科;
深度学习技术:深度学习是基于机器学习延伸出来的一个新的领域,由以人大脑结构为启发的神经网络算法为起源加之模型结构深度的增加发展,并伴随大数据和计算 能力的提高而产生的一系列新的算法。
4人工智能数据恢复应用研究
将人工智能技术应用于数据恢复领域,需要解决的问题包括:
1)基于信息熵特征提取算法,结合支持向量机作为分类器来分类文件碎片,使用重组算法对文件碎片进行重组;
2)通过机器学习对算法进行清洗和提取,对具体的数据恢复案例进行智能分析,根据不同的场景选择不同的算法;
3)结合人工智能和数据共享模式,建立云南省数据恢复共享服务平台。
4 结语
目前,我国信息化建设高歌猛进,人工智能与数据恢复技术的结合是时代发展的需求[3],如何处理海量数据,如何保障数据安全已成为数据恢复领域研究的热点,本文从人工智能数据恢复原理、涉及关键技术以及应用需要解决的问题进行探讨,为人工智能数据恢复软件的开发提供支撑,为进一步提供数据安全性提供前期研究。
参考文献
崔校郡.新时期大数据分析与应用关键技术研究[J].信息技术与信息化,2020:204-206.
田兵,严文涛,李明,殷齐林,郭爽爽.海量结构化数据实时恢复技术研究[J].自动化与仪器仪表,2019:133-135+139.
董磊,崔永波.新时期数据恢复技术应用与研究[J].电子世界,2019:132-132.
作者简介:
杨仙瑜(1990-),女,云南,工程师,2014年毕业于云南大学,主要从事软件系统研发相关的工作。