使用 Hadoop 分析数据的三种最常用方式

lizhikelizhike 2013-12-27

使用 Hadoop 分析数据的三种最常用方式

Hadoop 使用的一般模式

Hadoop 最初的构想是为像 Yahoo、Google、Facebook 等这样的公司以非常低的成本来解决大量数据的存储问题。现在,它正被越来 越多地引入企业环境中处理新不同数据类型。机器生成的数据、传感器数据、社交数据、网络日志等数据类型呈指数级增长,而且这些数据也常常(但不总是)是非 结构化。正是由于这种类型的数据将人机对话从“数据分析”带到“大数据分析”:因为挖掘这些数据可以得到商业优势。

分析应用程序以各种形式流行起来,最重要的是可以定向解决一个垂直行业的需要。乍一看,他们彼此似乎在行业和垂直上没有关系,但是实际上,当在基础设施层面观察时,会出现一些非常清晰的模式,也就是以下3种模式:

 

Pattern 1:数据精炼厂
Pattern 2: 用 Apache Hadoop来探索数据
Pattern 3: 挖掘应用程序

 

Global site tag (gtag.js) - Google Analytics