戴尔流动数据架构重要一环:D2D磁盘备份
DR4000除了以最简单的方式使用——作为一个中间的D2D短期备份区域,从DR4000的名称上,实际上我们还能看出“DR”两字所代表的是Data Replication或是Disaster Recovery,据马轶霏表示,戴尔确实对DR4000有两方面的考虑:一是Data Replication,DR4000有足够的性能——在某些应用环境下——可能做数据复制甚至是当作二级存储使用;二是灾难恢复Disaster Recovery,这一功能与数据复制都是对现有戴尔流动数据解决方案的有益补充,让其拥有了远程数据复制和灾难恢复的能力——企业不可能租用昂贵的光纤链路,DR4000基于IP技术通过以太网实现了更低成本的远程灾备。
而无论是否局限在备份存储系统上,文件级重复数据删除技术都是非常成熟的,但是块级重复数据删除,尤其是在线快存储系统的重复数据删除,其实还走在起步阶段。而戴尔一直宣称将会在在线主存储系统上使用重复数据删除系统。
DR4000管理界面
对于戴尔来说,在整个流动数据解决方案架构中,实现统一化的块重复数据删除是困难的。
不同的戴尔存储平台上的数据模块的大小是不同的。在EqualLogic系统中,一个数据块的大小是15MB,而在Compellent系统中,数据模块的大小是不确定的。64位StorageCenter O/S将在模块水平上跟踪数据。一个数据块并非一个完整的文件,存储操作系统从原则上可以查出哪些文件是由哪些块组成的。将文件分割存储在磁盘中会增加数据的碎片程度。主存储器的块级重复数据删除功能必须能够解决这个问题。当然,块越大,在其中发现重复数据的概率越高。
正如我们所知,你会从页面上读取数据,对数据进行重复数据删除处理,然后将数据作为一个连续的数据流重新写回磁盘,而一旦新的重复数据删除检测算法和空间恢复算法被开发出来,戴尔就可以将它整合到EqualLogic 和Compellent的操作系统之中。这样一来,戴尔不仅在全系列存储系统上实现了重复数据删除,在某种意义上,当数据进入类似DR4000这样的D2D磁盘备份系统之后,戴尔也统一了其多个主存储系统后端备份恢复数据的结构。
这对于戴尔来说——如果以上想法得到实现——将会是显著受益的:戴尔现在拥有复杂且全面的产品线,而戴尔存储的核心价值观就是“流动数据”——数据只有被更格式化的、标准化的存储起来,才有可能顺畅的流动起来,而DR4000及其后续产品则完成了这一工作:让数据统一化、格式化和标准化,增强了戴尔流动数据架构的价值。
而据戴尔的工程师介绍,在2011年发布的戴尔流动数据规划中,实际上已经包含了重复数据删除技术和戴尔可扩展文件系统,并且会考虑应用在各个环节上,以及不同的设备上,也就是说,戴尔不仅会扩大统一存储和文件存储的产品线,同样会将重复数据删除加入到主存储等其他区域,更重要的是重复数据删除对数据的“格式化”作用将在戴尔得到体现——无论是私有云、公有云还是传统的数据中心,重复数据删除之后的数据,未来甚至有可能在不同的存储系统之间彼此互相传输。
马轶霏表示,戴尔已经看到,具有重复数据删除技术的D2D磁盘备份系统,能够提供更好可访问性和可靠性以及“规范化的格式”,更理想的是对数据增长有带来的成本增长所控制。因此,戴尔会在流动数据一环中逐步加强这一部分的实力:“现在DR4000的发布只是这个产品系列的第一个产品,也是一个重复数据删除市场的入门级产品,但是使用的技术和算法是先进的,和未来我们将要推出的更高端产品一样的。这样的技术我们要逐步加载到整个系统的各个环节,我们的愿景是客户今后能够以重复数据删除之后的文件格式通过文件存储系统接口直接传送到云端。”