下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

Apache的六大正在兴起的大数据项目

作者:课课家教育     来源: http://www.kokojia.com点击数:1106发布时间: 2016-06-29 08:16:35

标签: Apache大数据云服务

  Apache是世界使用排名第一的Web服务器软件。它可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件之一。随着科技的发展,人们使用的数据日益庞大而复杂,传统的数据处理程序根本无法优化分析及获得洞察。而这正是新一代的大数据应用程序要解决的问题。近期Apache软件基金会(ASF)又将一批有趣的开源大数据项目毕业为的Apache顶级项目。这意味着,这些项目将能够得到积极的发展和社区的大力支持。

Apache的六大正在兴起的大数据项目_大数据_云服务_课课家

  很多人都听过Apache Spark——一个针对Streaming SQL 机器学习和图形处理的内置模块的大数据处理架构。IBM和其他公司正在投入数十亿美金开发资金到Spark项目,NASA和SETI Institute正在利用Spark的机器学习能力,合作分析TB数量级的外太空无线信号数据,寻找外星智能生命存在的形式。

  然而,其他几个最近被Apache擢升为顶级的大数据项目也受到了额外关注。事实上,这些大数据项目中的一些所构建和发展的生态系统,很可能会对Spark发起挑战。本文将结合“Apache Con北美峰会”(Apache Con North America conference)和“Apache大数据峰会”(Apache:Big Data events)归纳一下Apache的大数据项目。

  以下是六个正在兴起的项目:

  1.Kylin

  Apache宣布,Kylin项目——一个始于eBay的开源大数据项目,在eBay已经擢升为顶级项目。Kylin是一个开源的分布式分析引擎,旨在提供在Apache Hadoop之上SQL接口的多维分析引擎(OLAP),可支持超大数据集。它已广泛在eBay和其他一些组织中被采用。

  “Apache Kylin的孵化之旅已经证明Apache软件基金会(ASF)开源治理的价值,以及围绕项目建设开源社区和生态系统的强大力量。”Apache Kylin副总裁Luke Han(韩卿)说:“我们的开源社区是世界上最大的本土开发者参与的社区,完全依照The Apache Way的社区运作方式。”

  作为一个基于Hadoop的领先的OLAP解决方案,Apache Kylin填补了大数据与人的使用之间的空白。他补充说道:“使分析人员、最终用户、开发者和数据爱好者能够在大规模数据集上进行亚秒级延迟的交互式分析。基于这些能力,Apache Kylin将商业智能(BI)带回Apache Hadoop以释放出大数据的价值。”

  2.Lens

  Apache近日宣布,Apache Lens作为一个开源的大数据和分析工具,也已经从Apache孵化器毕业成为一个顶级项目(TLP)。根据公告:“Apache Lens是一个统一的分析平台,以统一视图形式为分析查询提供了优化的执行环境。Apache Lens旨在通过提供一个跨多个数据存储的单一视图来横向打通数据分析中遇到的异构单元。”

  “通过在数据之上提供一个在线的分析处理(OLAP)模型,Lens无缝地集成Hadoop和传统数据仓库,提供统一的外部接口。它同时提供系统中查询历史、统计和查询的生命周期管理。”

  “在ASF中孵化Apache Lens是一段神奇的经历。”Apache Lens的副总裁Amareshwari Sriramadasu说,“Apache Lens从最终用户角度出发,为大数据分析解决了一个难题,它使得业务用户、分析师、开发者和其他用户,可以轻松的进行复杂的数据分析,而不需要了解底层的数据架构。”

  3.Ignite

  ASF还宣布Apache Ingite成为了一个顶级项目,一个通过开源方式建立的内存数据网络。Apache Ignite是一个高性能的、整合的、分布式的内存数据网络,实现了在大规模数组上进行实时的计算和交互。Apache社区成员认为“可能比传统的硬盘或闪存技术要快几个数量级。它的设计使现有的以及各种新的应用可以轻松的部署在一个价格适宜的行业标准的大规模并行架构的硬件上。”

  4.Brooklyn

  ASF宣布Apache Brooklyn已成为一个TLP(顶级项目):“这标志着该项目的社区和产品在ASF优异的流程和原则下治理有方。”Brooklyn是用于整合跨多个数据中心的应用程序的蓝图和管理平台,并适用于各种云端软件。

  “随着现代应用程序正在由更多个部件组成,微服务架构又逐渐兴起,部署以及已部署应用的演化越来越成为一个难题。Apache Brooklyn的蓝图提供了一个清晰简洁的方式,在部署到公共云或私有基础设施之前,来规范应用,及它的组件、配置和组件之间的关联性。这种建立在自主计算理论的基础上的策略管理,会不断地评估运行应用程序,修改以保持它的运行健康和指标优化,例如成本和响应能力。”Brooklyn宣称。

  在一些知名企业中,Brooklyn已得以应用。云服务商Canopy和Virtu stream已在Brooklyn上提供产品。IBM也已经大规模的使用Brooklyn,以将大量工作从AWS迁移到IBM Soft layer之上。

  5.Apex

  今年4月,Apache软件基金会将Apex项目提升至顶级项目。它被称为“应用在Apache Hadoop生态系统的大规模、高吞吐量、低延时、能容错的、统一的大数据流和批量处理平台。”Apex与Apache Hadoop资源管理平台YARN,一起作用于Hadoop工作集群。

  6.Tajo

  Apache Tajo,一个领先于Apache Hadoop之上的开源数据仓库系统,也成为了你需要了解的一个大数据项目。Apache宣称Tajo提供了针对Hadoop、第三方数据库以及商用BI工具的快速抓取能力。

  Apache Spark虽然吸引了人们的眼球,但它不是唯一需要你关注的来自Apache的大数据工具。接下来,Apache会将更多引人注目的大数据项目升级为顶级项目,这些项目必将由此获得更好的开发资源和更多的受益。

   到目前为止,Apache仍然是世界上用的最多的Web服务器,市场占有率达60%左右。随着信息时代的不断发展,Apache将不断改进和升级,为人们提供更多的方便。

赞(25)
踩(2)
分享到:
华为认证网络工程师 HCIE直播课视频教程