王鹏涛
摘 要:随着国民经济的不断增长,科学技术的不断创新,我国电子商务行业发展得到了质的飞跃。海量数据安全存储作为现代电子商务建设运营管理过程的重中之重,是一项必不可缺的关键内容,直接关系到电子商务系统运行的稳定性,能否保障每个用户切身利益。因此现代电子商务企业必须高度重视数据安全存储工作,面对持续增长的电子商务数据要科学采用分布式存储系统,优化改善不同类型数据存储组织方式,全面提高电子商务数据安全储存质量。该文将进一步对电子商务数据存储展开分析与探讨。
关键词:电子商务 数据 存储
中图分类号:TP333 文献标识码:A 文章编号:1672-3791(2020)01(b)-0020-02
当前是一个互联网时代,电子商务发展极大地方便了人们的日常生活,同时也给商家带来了更多创造利益的机会。数据储存作为电子商务运营管理工作的重要内容,受到了社会各界人士的高度关注,能否将处理好的各项数据安全储存在系统数据库中,会直接影响到系统日常运行的稳定性,并为用市场用户提供更加良好的UE体验服务。为了保障我国电子商务和谐健康的持续发展,就必须加强对电子商务数据信息的安全存储保护工作,全面提高电子商务网络数据安全储存管理水平。
1 数据存储概述
数据存储实质是指数据流在加工处理过程中产生的临时文件或者加工处理过程中需要检索获取的相关信息。数据存储方式与数据文件组织存在着密不可分的联系,其核心在于建立记录的逻辑与物理顺序间对应的关系,明确数据存储地位,以此来充分提升数据存储效率。在当前计算机市场上常见的数据存储方式主要包括了3种,它们分别是DAS、NAS以及SAN,数据存储应用最为显著的特征就是不存在统一标准的体系结构[1],这3种数据存储方式是相辅相成、相互共存的,能够最大程度地满足市场企业信息化的应用发展,现代电子商务企业在优化设计数据库时,要结合自身系统应用环境特点,合理构建出最佳的数据库运行管理模式,同时科学完善系统数据库,确保其能够符合海量数据的安全储存和高效检索需求。
2 电子商务环境数据存储分析
在现代电子商务行业中阿里巴巴作为龙头企业,其底下的淘宝网每天都会产生海量的信息数据,这些数据除了包括各种线上产品交易数据信息、用户信息、门户网站等,还涉及到淘江湖、社区等信息交流内容,需要为个性化用户提供其他数据功能作用。而在这些海量数据当中,绝大多数都是以图片和文字描述的小文件为主,大文件的视频数据、索引较少。因此,当淘宝网在构建电子商务海量数据存储模型时,相关技术人员要充分考虑到解决不同大小文件的高效存储问题,并且还需解决对大量小文件的读取问题[2],确保整个电子商务系统能够稳定持续的运行。伴随着时间的不断推移,电子商务用户的不断增加,电子商务企业将会面临着更多数据的储存管理问题,企业需要根据实际情况合理采取数据存储方式,打造出科学完善的系统数据储存库。
3 电子商务数据存储模型设计
3.1 Hadoop存储系统
在我国电子商务数据储存管理工作中,Hadoop分布式系统是一种常用的从数据储存系统,像电商市场上的淘宝网、京东以及百度等都在用这种储存系统。虽然说Hadoop存储系统最早是为了搜索引擎中的大文件开发的,更加针对于大文件的处理和储存,不适宜用在大量小文件的处理存储工作中,但是只要通过对其进行一定的优化设计,就可以最大程度地发挥出该种数据存储系统的价值作用,促使其能够为各种大小海量数据提供安全可靠的存储服务知识。Hadoop存储系统设计主要包括了两个部分,它们分别是HDFS(Hadoop分布式文件系统)、Hbase(Hadoop分布式数据库)。
3.2 海量数据存储模型设计
海量数据存储模型的设计主要包括了3个部分内容,分别是主服务器、次服务器以及客户端。如海量数据存储模型中主服务器的构成有两个部分:一部分是主服务器部分,另一部分是查询主服务器,在优化设计数据存储模型主服务器时,技术人员要确保主服务器能够通过主动发送修改信息与查询主服务器保持一致性[3],这样能够保障系统内数据被修改后,查询主服务器能够有效获取到对应的映射数据修改信息;次服务器是由众多独立服务器基于网络连接构成的,其能够帮助电子商务企业实现对海量数据存储功能,任何一个次服务器都是由系统主服务器分配决定客户提交的数据表和文件存储,当客户从主服务器上获取到数据位置信息后,就能够有效从对应次服务器上获取到信息数据;客户端作为海量数据存储系统中的各种命令发起端,它的主要功能作用是读取、更新以及创建数据等。客户端会自动按照用户的不同命令将其科学有效地分配到对应的服务器当中,倘若是读取命令就会自动分配到查询主服务器,倘若是其他逻辑命令就会自动分配到主服务器端。现代电子商务企业要想实现对海量数据的快速检索读取,除了要安排专业技术人员设置专门数据查询部门外,还必须在存储模型当中优化设计一个全局的两层次分布式缓存系统,该分布式缓存系统设计可以采用市场上应用较为广泛的开源Memcached系统来完成。电子商务系统内的主服务器之间、次服务器之间的通信协议都是基于TCP/IP协议的。相关工作人员可以在Hadoop存储系统中合理设计RPC以此实现两个协议。
3.3 電子商务数据组织方式
基于现代电子商务发展环境下,海量数据有着多种形式,比如结构化数据与非结构化数据、超媒体数据等。其中结构化数据主要指的是文本数据、非结构化数据指的是图片视频、超媒体数据指的是文本信息和多媒体信息的结合产物。在Hbase分布式数据库搭建过程中,所有存储数据都会被默认成字符串类型,针对于此,工作人员在处理结构化文本数据时需要采用Hbase分布式数据库科学存储对应的字符串[4];对于非结构化数据图片和视频数据时,工作人员需要将其以文件形式高效存储在对应的HDFS中,同时还需在Hbase有效设置对应的描述和地址信息表;而对于以HTML表示的超媒体数据,工作人员需要将HTML数据有效转换成相对应的XML数据,这样就能够将其有效存储在Hbase分布式数据库中,转换后的XML数据更加有助于描述信息内容的方便检索查询。电子商务企业在数据存储管理工作中,还可以根据不同类型数据信息,采取不同次服务器存储的方式。比如,工作人员通过建立专门的文本次服务器、图片视频次服务器等。
4 结语
综上所述,现代电子商务企业要高度重视海量数据安全高效存储管理工作,通过优化设计海量数据存储模型,有效实现对海量电子商务数据的处理。基于电子商务发展环境下,企业可以通过设计应用Hadoop系统的存储架构Hbase和HDFS,同时还需注重解决存储系统中的小文件处理问题,合理增加基于Memcached的分布式缓存系统,根据不同类型数据合理采取对应的存储组织方式。
参考文献
[1] 李克然,刘东苏,邓媛.电子商务环境下海量数据存储模型[J].情报杂志,2016(2):54-57.
[2] 袁建军.电子商务海量数据的获取、存储及检索[J].计算机研究,2017(1):142-143.
[3] 徐国华.数据管理:电子商务数据的存储问题[J].金融信息化论坛,2018(11):35-37.
[4] 章丽芳.云计算环境下的电子商务数据管理模式研究[J].电脑知识与技术,2017(3):81-83.