下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

云计算的潮流中,Hadoop的归属在那里?

作者:课课家教育     来源: http://www.kokojia.com点击数:626发布时间: 2017-05-04 16:00:23

标签: 云计算公有云虚拟化

  云计算[1](cloudcomputing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。因此,云计算甚至可以让你体验每秒10万亿次的运算能力,拥有这么强大的计算能力可以模拟核爆炸、预测气候变化和市场发展趋势。用户通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。

云计算的潮流中,Hadoop的归属在那里?_云计算_公有云_虚拟化_课课家教育

  对云计算的定义有多种说法。对于到底什么是云计算,至少可以找到100种解释。[3]现阶段广为接受的是美国国家标准与技术研究院(NIST)定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。[4]

  Hadoop是目前大数据分析领域中应用最广泛的一种分布式架构,而经过相当长时间的发展,Hadoop在功能上也越来越成熟。尤其在过去三年里,它得到前所未有的发展,并被很多公司大规模采用。然而时代在变化,Hadoop在多云的未来该何去何从?

  Hadoop

  根据市场调研公司Forrester估计,2017年用户将在Hadoop软件和相关服务上花费8亿美元。这并不奇怪,因为在过去这段时间里,Hadoop供应商们充分利用Cloudera、Hortonworks、和MapR等产品使Hadoop家喻户晓。但是,时代在变化,Hadoop与其它技术一样也受到云计算的影响。

  用户们希望借助公有云来处理更多的大数据,所以尽管Hadoop不是专为云而生,Hadoop供应商们还是在努力将Hadoop与云联系起来。就像一位Hadoop供应商的内部人士所言:“如果我们真正理解云,就不会用原来的方式去设计Hadoop。“事实上,所有Hadoop供应商都在通过自家策略使Hadoop与云相结合,尤其是在对象存储和调度策略上。

  但是,云供应商似乎并未向Hadoop供应商们敞开怀抱。云供应商正在通过自己的数据解决方案代替Hadoop,这为Hadoop在多云的未来发展蒙上了阴影。

用户们希望借助公有云来处理更多的大数据,所以尽管Hadoop不是专为云而生,Hadoop供应商们还是在努力将Hadoop与云联系起来。就像一位Hadoop供应商的内部人士所言:“如果我们真正理解云,就不会用原来的方式去设计Hadoop。“事实上,所有Hadoop供应商都在通过自家策略使Hadoop与云相结合,尤其是在对象存储和调度策略上。    但是,云供应商似乎并未向Hadoop供应商们敞开怀抱。云供应商正在通过自己的数据解决方案代替Hadoop,这为Hadoop在多云的未来发展蒙上了阴影。

  在大数据相关业务上,云供应商们采用了隐藏或替换Hadoop的方式满足用户需求。比如AWS的Athena,你可以对大数据执行SQL查询,但不用关心底层的服务器。这使“无服务器”产品成为趋势,比如Google云端功能就是一个例子;DataBricks则直接针对S3(亚马逊云服务)使用Spark。看到这个模式了吗?

  随着越来越多的公司厌倦了Hadoop的内部复杂性,这些公司正寻求把Hadoop堆栈转移到公有云,这意味着Hadoop供应商的市场和营收将被云厂商蚕食。

  公有云中的Serverless架构(无服务架构),以及其它能够替代Hadoop的解决方案,都将削弱Hadoop收入;所以除非Hadoop社区能够给行业一个令人信服的理由,才能说服用户继续使用Hadoop,从而保住Hadoop的市场。

  就Hadoop目前的生态而言,各供应商之间系出同源但又各自为战。大数据组件、安全性、元数据及管理等产品及服务都能单独作为不同供应商之间的独特竞争力,这让Hadoop的服务无法形成闭环。而服务闭环却是用户选择将Hadoop作为他们的大数据战略核心最关键的因素。因此,在面对亚马逊、谷歌、IBM和其他公司提供了Hadoop替代方案的多云未来,Hadoop供应商们无法团结起来一起保护Hadoop的地位。

  所以我们有理由相信,在未来两三年内,Hadoop将只会提供一个品牌而非一条产业链或具体的产品。可以看到的是,当下的Hortonworks、Cloudera、MapR和Pivotal都纷纷脱离了Hadoop供应商标签,他们也正是看到了这种趋势。

  如果再考虑到深度学习和人工智能对Hadoop的影响,那就更加混乱了。就像Hadoop不是为云而生一样,它同样不是为深层学习所需的矩阵数学而设计的。云团队正在忙于创建合适人工智能发展的友好环境,这意味着Hadoop供应商要做更多努力以保持他们软件的兼容性。未来Hadoop供应商们会让Hadoop成为AI的平台吗?大概不会。

  云计算(cloudcomputing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。

  美国国家标准与技术研究院(NIST)定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。XenSystem,以及在国外已经非常成熟的Intel和IBM,各种“云计算”的应用服务范围正日渐扩大,影响力也无可估量。

  由于云计算应用的不断深入,以及对大数据处理需求的不断扩大,用户对性能强大、可用性高的4路、8路服务器需求出现明显提速,这一细分产品同比增速超过200%。

  IBM在这一领域占有相当的优势,更值得关注的是,浪潮仅以天梭TS850一款产品在2011实现了超过15%的市场占有率,以不到1%的差距排名IBM,HP之后,成为中国高端服务器三强。

由于云计算应用的不断深入,以及对大数据处理需求的不断扩大,用户对性能强大、可用性高的4路、8路服务器需求出现明显提速,这一细分产品同比增速超过200%。    IBM在这一领域占有相当的优势,更值得关注的是,浪潮仅以天梭TS850一款产品在2011实现了超过15%的市场占有率,以不到1%的差距排名IBM,HP之后,成为中国高端服务器三强。

  2012年浪潮斥资近十亿元研发的32路高端容错服务器天梭K1系统尚未面世,其巨大的市场潜力有待挖掘。

  云计算常与网格计算、效用计算、自主计算相混淆。

  网格计算:分布式计算的一种,由一群松散耦合的计算机组成的一个超级虚拟计算机,常用来执行一些大型任务;

  效用计算:IT资源的一种打包和计费方式,比如按照计算、存储分别计量费用,像传统的电力等公共设施一样;

  自主计算:具有自我管理功能的计算机系统。

  事实上,许多云计算部署依赖于计算机集群(但与网格的组成、体系结构、目的、工作方式大相径庭),也吸收了自主计算和效用计算的特点。

  所以Hadoop在未来还会保持两到三年的强劲增长,但最终它可能只会留在数据库与大型机身边。数字时代的变化速度太快,没有任何一种技术可以长盛不衰!

  更多详细内容,仅在课课家教育,我们期待您的咨询!

赞(0)
踩(0)
分享到:
华为认证网络工程师 HCIE直播课视频教程