Oracle大数据产品的领先技术
Oracle NoSQL数据库:为了快速、实时地捕获所有大数据,企业需要处理大数据量、低密度的信息,需要频繁更改应用程序,而且还必须横向扩展以满足急剧扩张的部署计划。作为一款分布式、高度可扩展并能够提供关键价值的数据库,Oracle NoSQL数据库专门为管理海量数据而设计,可以帮助企业存取非结构化数据,并可横向扩展至数百个高可用性节点。同时,该产品能够提供可预测的吞吐量和延迟时间,而且更加容易安装、配置和管理,支持广泛的工作负载。
分析沙盒:目前,企业所面临的挑战包括拥有现有Oracle数据仓库、对大数据进行分析、不允许对数据仓库SLA产生负面影响等。通过分析沙盒,企 业可获得分析工作区,控制对资源和数据的访问,而且完全不影响生产系统。它还可以将沙盒功能与安全、可伸缩、易于安装的Oracle企业管理器进行集成, 从而帮助企业高效利用服务器、通过付费方式进行自我管理。
针对Hadoop 架构的系统:大数据组织和提取面临的挑战还包括将大数据转换为易于分析的内容、避免编写大量 Hadoop代码以及数据快速载入 Oracle 数据仓库等,Oracle大数据机中的开源Apache Hadoop、Oracle数据集成Hadoop应用适配器、Oracle Hadoop装载器、Oracle Direct Connector,可以帮助企业充分应对这些挑战。
Oracle数据集成Hadoop应用适配器通过Oracle数据集成器易于使用的界面,自动生成Hadoop MapReduce代码,简化了Hadoop应用与Oracle数据库的数据集成。Oracle Hadoop装载器使客户能够利用Hadoop MapReduce处理功能建立优化的数据集,从而在Oracle数据库11g中进行高效率加载和分析。Oracle Direct Connector可通过SQL语言从Oracle数据库直接访问Hadoop分布式文件系统上的数据。
R语言:在分析大数据时,企业需要访问所有数据,使用R语言进行统计分析,但通过便携机进行分析速度较慢且不安全。甲骨文提供的Oracle R Enterprise实现了R开源统计环境与Oracle数据库11g的集成,分析师和统计人员可以运行现有的R应用,并利用R客户端直接处理存储在 Oracle数据库11g中的数据,从而极大地提高可扩展性、性能和安全性。Oracle数据库11g与R开源统计环境的整合为进行更进一步的数据分析提 供了一个企业就绪的、深度集成的环境。