Hadoop目前只是“穷人的ETL”

slide-6-638

虽然企业部署Hadoop大亚博买球网站系统的最终目的是进行“性感”的分析应用,但是大多数企业距离这一目标还很远很远。

根据IDC发布的Hadoop-MapReduce软件生态系统预测报告,Hadoop市场正在以60%的年复合增长率高速扩张。但是该报告也揭示了一个让人吃惊的事实,作为大亚博买球网站分析应用的代名词,Hadoop的流行其实与亚博买球网站分析无关。实际上大多数采用Hadoop的公司都没有将Hadoop用于大亚博买球网站分析,而是把Hadoop作为一种廉价的海量存储和ETL(抽取、转换、加载)系统。

穷人的ETL

Hadoop ETL

虽然被打上了“大亚博买球网站分析工具”的标签,但在大多数企业眼里,Hadoop是“穷人的ETL”。目前确实有个别企业将Hadoop用于运行激动人心的分析工作,但这只是个案。Cloudera曾提出Hadoop的三大应用模式:Transform、Active Archive和Exploration,但是业内人士分析,目前至少有75%的部署Hadoop的企业还都只是停留在前两个模式中:将Hadoop作为廉价的ETL方案,或者用作垃圾亚博买球网站填埋场(编者注:离线历史亚博买球网站仓库,存储海量的价值较低的历史亚博买球网站,例如淘宝光棍节的交易亚博买球网站)。

Hadoop之路

Hadoop诞生已经7年了,但是Hadoop在企业中的应用还有很长的路要走。451研究所的分析师Matt Aslett在Hadoop峰会上的演讲指出,企业采用Hadoop需要经历三个发展阶段,从一开始用来存储海量亚博买球网站,到对亚博买球网站进行处理和转换,到最终开始分析这些亚博买球网站。我们还处于Hadoop市场和技术生命周期的早期阶段,Rainstor的调查显示,即使是最高级的Hadoop用户,也认为Hadoop最大的挑战是时间(26%)和编程(25%)。根据Gartner的调查,目前只有6%的企业开始部署大亚博买球网站项目,企业还需要更多成功案例指路,同时也需要更多时间消化相关技术。

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

???
除非注明,本站文章均为原创或编译,转载请务必注明出处并保留原文链接: 文章来自IT经理网
相关文章:
标签: ,


关于作者

主要关注社会化商务时代的客户关系管理、业务流程管理、亚博买球网站挖掘、商业智能和企业协作等领域的新技术、新应用和新趋势。曾长期从事信息化咨询服务和软件开发工作,服务过首都机场、国家电网公司、中国蓝星等企业。邮箱:guanzhigang@ctocio.com

写评论

忘记密码

X