您的位置: DOIT首页 » 资讯中心 » 正文

DR4000的灵魂:Ocarina重复数据删除

 12年02月10日 00:02【原创】作者:DOIT原创 崔昊  责任编辑:崔昊

导读:戴尔宣称,DELL DR4000为“客户提供了一个带有重复数据删除和压缩功能的D2D备份解决方案,”且重复数据删除比率多达15倍。

关键词: Ocarina 重复数据删除 戴尔 DR4000

DR4000的灵魂:Ocarina重复数据删除

重复数据删除技术是D2D磁盘备份系统的灵魂所在,这一技术刚刚推出的时候,被认为主流是后处理技术——限于当时的处理器性能——这也无可非议,而在线处理(inline)被认为只属于大中型企业或是具有一定规模和高性能的系统的用户,但随着多核处理器性能的不断攀升,无论是DataDomain还是昆腾都开始涉足中小企业及远程办公室的D2D重复数据删除磁盘备份系统。

这一技术的实现原理无需多言——对于大多数企业来说重删原理并不是那么重要——但DR4000在线处理(inline)的方式很显然更适合中小型企业:后处理方式仍然需要至少等同于多次全备份的存储容量,而在线处理却可以有更小的基础容量可以选择。而对于在线处理可能造成的网络负载压力瞬时过大的问题,对于DR4000所覆盖的用户群体来说或许并不存在,毕竟其面对的用户的数据量不大,以太网的网络速度也能够达到10Gb,同时,磁盘备份系统多核处理器的在线处理性能也能够达到很高的水平。

对于戴尔的DR4000来说,在重复数据删除技术领域最大的用户疑问或许是这样的:戴尔的重删技术和DataDomain、昆腾有什么不同(在线处理技术上DataDomain和昆腾采用的技术是相同)?戴尔又能够在看起来业已成熟的重复数据删除技术上有什么新的花样?

回答这个问题,核心就在于Ocarina,它是戴尔DR4000的重复数据删除技术的灵魂,也是DR4000的灵魂,未来或许也会成为戴尔存储的灵魂。

Ocarina成立于2007年,戴尔于2010年7月将其收归旗下,在收购时,Ocarina公司CEO Murli Thirumale表示:“Ocarina是不同的,是远远领先于其他供应商的。”林佑声表示,Ocarina最大的特点,是“其对非结构化数据的处理能力。”

“我们非常希望从非结构化数据方面,能够提供给用户更优秀的产品,比如说我们基于EqualLogic的FS7500和PowerVault NX3500,Ocarina也是如此,都是面向非结构化数据的横向扩展架构的产品。”林佑声表示,Ocarina最大的特点,是对非结构化数据——不仅仅是文档和邮件——而是对于视频、图像和WEB上的非结构化文档,“都会提供不同处理方式下的压缩以及重复数据删除的能力”,因此可以帮助用户达到更好的非结构化数据的数据保护需求。

Ocarina的重点在于对非结构化数据,尤其是视频和图像的处理能力,这对于戴尔正在将结构化数据和非结构化数据,块存储和文件存储系统整合形成流动数据解决方案,在流动数据、大数据、互联网市场上获得优势至关重要——总的来说,重复数据删除在绝大多数情况下,都是面向块数据——结构化数据的,非结构化数据则主要是文件级的重复数据删除,而Ocarina正在突破这一界限。

虽然有关Ocarina技术的相关资料较少,但从公开获得的资料来看,Ocarina技术具有内容识别(content-aware)功能,因此它在处理JPEG文件方面特别有效,除此以外,Ocarina主要面向3个类型的数据:

•Microsoft Office files (Powerpoint, Word, Excel)

•Images and Video (JPEG, MPEG, tiff, GIF, PNG,)

•Compound Documents (email, html, web pages, PDF, ZIP, RAR, TAR)

据Ocarina一位工程师向DOSTOR介绍,Ocarina能够“对给出的文件以结构化的理解并使用100种不同算法来去处理”,而如果这一文件类型对于Ocarina是全新的,Ocarina会去推断信息的结构和内容性质,选择最有效的数据压缩或是重删算法。

而在被收购以前,Ocarina的数据精简技术被称为“Ocarina ECOsystem数据处理系统”,核心的组成部分不仅包括内容感知的数据压缩与重复数据删除算法,还包括为需要压缩和重删的数据制定最优运行时间效率的神经网络模型。据上述工程师表示,Ocarina的设计初衷是“将数据作为一产品来消费,重复数据删除的磁盘备份系统是有关数据的消费方式,而不是存储方式。”即,DR4000的重点在于对数据的处理,而不是保存。也就是说,戴尔肯定为DR4000选择了一个合理重删比,而非过度重删和压缩——虽然所需要的磁盘容量大幅减少——但重删数据在需要恢复时容易因此而出现的重建数据时间过长的问题。

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册

Copyright © 2003-2012 DOIT.com.cn, All Rights Reserved

DOIT传媒 版权所有京公网安备: 110105001105
京ICP证030972号电信业务审批 [2009]字第572号
link