下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

IT企业利用云计算平台Hadoop的10种方式及介绍

作者:课课家     来源: www.kokojia.com点击数:464发布时间: 2015-10-30 17:34:45

标签: 大数据视频教程大数据应用云平台

在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!!

如果你是世界上广大Hadoop用户的一员,你肯定知道Google曾经靠着分布式计算技术(Hadoop),在搜索引擎和广告方面取得了举世瞩目的成就。现在的Hadoop不仅是当年的老二Yahoo的专用产品了,从Hadoop长长的用户名单中,可以看到Facebook, 可以看到Linkedin,可以看到Amazon,可以看到EMC, eBay,Tweeter,IBM, Microsoft, Apple, HP…。国内的公司有淘宝、百度等等。而今天我们要探讨的是,Hadoop 作为基础云计算平台,除了广告,IT公司还用哪些方式在利用Hadoop。Oracle培训

1. 在线旅游
云计算供应商Cloudera COO Kirk Dunn 表示,目前上80%的世界在线旅游使用了Cloudera 的Hadoop服务。他没有透露具体的名单,但著名的Orbitz Worldwide是我知道的客户之一。
2. 移动数据
目前Cloudera为美国70%的智能手机提供Hadoop支持,我们可以确定Dunn讲的是无限供应商支持的移动数据储存和处理。
3. 电子商务
Dunn 表示Cloudia为美国超过1000万在线商家提供Hadoop服务,eBay是他们的一个大客户, 因为其要管理一个庞大的个人卖家市场,卖家数量达到1000万以上。而Ebay在用Hadoop服务90天后,纯利润增加了3%。
4. 能源发现
雪佛龙代表解释了他们公司利用Hadoop的实例:通过分类和处理海洋地震数据可以预测石油储备状况。oracle视频教程
5. 节能
雪佛龙代表同时还表示Hadoop还用在节能上,雪佛龙利用Hadoop来支持其节能系统,顾客们按照系统提示节能的同时也节省了不少钱。而相关人士甚至表示这个理念可以用到精确和长期的基金预测上。
oracle教程
6. 基础架构管理
越来越多的IT公司在收集和分析他们的服务器数据,在Cloudera讨论会上, NetApp代表表示他们公司利用Hadoop技术从全部的安装点上收集设备logs(超过千万亿的logs数量)。
7. 图片处理
创业公司“Skybox图片”正是利用Hadoop来储存和处理图片的,这些图片是卫星根据地理变化的模式有规律地抓取的高清图片。Skybox最近获得了7000万美元的融资。

趋势一:数据的资源化
何为资源化,是指大数据成为企业和社会关注的重要战略资源,并已成为大家争相抢夺的新焦点。因而,企业必须要提前制定大数据营销战略计划,抢占市场先机。
趋势二:与云计算的深度结合
大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一。自2013年开始,大数据技术已开始和云计算技术紧密结合,预计未来两者关系将更为密切。除此之外,物联网、移动互联网等新兴计算形态,也将一齐助力大数据革命,让大数据营销发挥出更大的影响力。
趋势三:科学理论的突破
随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。随之兴起的数据挖掘、机器学习和人工智能等相关技术,可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。
趋势四:数据科学和数据联盟的成立
未来,数据科学将成为一门专门的学科,被越来越多的人所认知。各大高校将设立专门的数据科学类专业,也会催生一批与之相关的新的就业岗位。与此同时,基于数据这个基础平台,也将建立起跨领域的数据共享平台,之后,数据共享将扩展到企业层面,并且成为未来产业的核心一环。
趋势五:数据泄露泛滥
未来几年数据泄露事件的增长率也许会达到100%,除非数据在其源头就能够得到安全保障。可以说,在未来,每个财富500强企业都会面临数据攻击,无论他们是否已经做好安全防范。而所有企业,无论规模大小,都需要重新审视今天的安全定义。在财富500强企业中,超过50%将会设置首席信息安全官这一职位。企业需要从新的角度来确保自身以及客户数据,所有数据在创建之初便需要获得安全保障,而并非在数据保存的最后一个环节,仅仅加强后者的安全措施已被证明于事无补。


8. 欺诈识别
这是个经典实用的话题,这在财政机构和情报机构非常有市场。Cloudera客户之一Zions Bancorporation表示他们利用Hadoop储存一切可能预示欺骗性的用户交易和异常情况数据。
9. IT安全
除了基础架构管理,IT公司们也开始用Hadoop来处理恶意软件和网络攻击数据。去年Trust
就用hadoop为各种IP评定分数,然后各大公司就可以决定是否接受那些恶意IP的来访。
10. 医疗健康
目前Apixio正使用Hadoop来帮助他们对病人的回答做语义分析,从而帮助医生,**更好的掌控病情。

Hadoop定义:
1. 一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。oracle数据库教程
2. Hadoop是一套开源的、基础是Java的、目前能够让数千台普通、廉价的服务器组成一个稳定的、强大的集群,使其能够对pb级别的大数据进行存储、计 算。已经具有了强大稳定的生态系统,也具有很多使用的延伸产品。比如做查询的Pig, 做分布式命名服务的ZooKeeper, 做数据库的Hive等等。
更多视频课程文章的课程,可到课课家官网查看。我在等你哟!!!

赞(106)
踩(3)
分享到:
华为认证网络工程师 HCIE直播课视频教程