下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

公司如组建数据部门,三种数据部门架构优与劣

作者:课课家     来源: www.kokojia.com点击数:4782发布时间: 2015-10-30 09:50:53

标签: 大数据视频教程大数据教程数据

在众多学习中,文章也许不起眼,但是重要的下面我们就来讲解一下!!


问题:为什么传统的没有达到今天互联网数据应用的高度呢?
在之前的传统BI可能因为这些因素,所以没有达到今天的数据在高度,可能是互联网本身发展的因素,数据对于互联网企业价值。但其中有一个很大的因素,可能是传统的BI,更多是偏重数据仓库的架构,根据需求来帮报表。在数据部门没有一批主动去思考业务,思考业务与数据关系的人。这种人很可能都是在业务方,他们更多把业务问题转为要看的报表,然后与数据部门沟通报表开发,数据部门收集需求沟通后,进行排期,进入比较慢长的等待期。oracle数据库教程

在一个企业中,可能数据部门在一个公司中组织架构中的位置,决定了部门的定位和一些做的事情,所以个人认为数据部门所处的组织架构对数据价值实现是一个很重要因素。这也是今天我也来谈一谈的主题。
我先把数据部门分成二个部门:一个我们就叫前端,例如:数据分析,数据挖掘,数据产品等;一个我们叫后端:数据仓库,大数据平台等;
oracle视频教程
第一种形式,分散式

经李克强总理签批,2015年9月,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。

 

《纲要》明确,推动大数据发展和应用,在未来5至10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。

 

《纲要》部署三方面主要任务。一要加快政府数据开放共享,推动资源整合,提升治理能力。大力推动政府部门数据共享,稳步推动公共数据资源开放,统筹规划大数据基础设施建设,支持宏观调控科学化,推动政府治理精准化,推进商事服务便捷化,促进安全保障高效化,加快民生服务普惠化。二要推动产业创新发展,培育新兴业态,助力经济转型。发展大数据在工业、新兴产业、农业农村等行业领域应用,推动大数据发展与科研创新有机结合,推进基础研究和核心技术攻关,形成大数据产品体系,完善大数据产业链。三要强化安全保障,提高管理水平,促进健康发展。健全大数据安全保障体系,强化安全支撑。[8] 

 oracle视频

2015年9月18日贵州省启动我国首个大数据综合试验区的建设工作,力争通过3至5年的努力,将贵州大数据综合试验区建设成为全国数据汇聚应用新高地、综合治理示范区、产业发展聚集区、创业创新首选地、政策创新先行区。

 

围绕这一目标,贵州省将重点构建“三大体系”,重点打造“七大平台”,实施“十大工程”。

 

“三大体系”是指构建先行先试的政策法规体系、跨界融合的产业生态体系、防控一体的安全保障体系;“七大平台”则是指打造大数据示范平台、大数据集聚平台、大数据应用平台、大数据交易平台、大数据金融服务平台、大数据交流合作平台和大数据创业创新平台;“十大工程”即实施数据资源汇聚工程、政府数据共享开放工程、综合治理示范提升工程、大数据便民惠民工程、大数据三大业态培育工程、传统产业改造升级工程、信息基础设施提升工程、人才培养引进工程、大数据安全保障工程和大数据区域试点统筹发展工程。


数据平台由技术部建设,技术没有数据分析/业务分析人员;这部分人员都分到各个业务块中。
技术部负责搭建大数据平台(在传统主要叫数据仓库)
目前大数据平台,如果比较大型的公司基本上会包括几块内容:
1、分布式:Hadop平台;
2、实时计算: Storm平台
3、内存计算:Spark平台
4、传统关系数据库
业务分析人员怎么得到数据:
方式一:向数据平台接口人提需求,在传统的BI部门中一定会有一种叫:需求分析/数据PD这种角度;这种角度就是把业务方的进行转化,转为PRD文档,让ETL开发工程师,报表开发工程师实现 。【业务人员是没有访问数据仓库的权限的】
方式二:当一些业务方比较强势,或者对响应速度比较有意见的时候,可能会开放所有或者部分给业务人员进行去访问,业务可以自己去写SQL去取数据。
这种在一些业务变化不快,或者业务相对不那么复杂的公司可能比较好。但是如果是一些业务复杂,业务变化非常快的可能就不适合。为什么?
1、数据平台/仓库建议跟不上业务变化。造成数据仓库效率低,数据口径混乱。因为数据仓库架构离业务比较远,对业务理解不深。
2、业务数据分析师很多人的知识不能很有效沉淀下来。
这会导致业务要求为各个业务建议自己 “数据集市”,当这种数据集市我的时候,又会造成数据仓库负担中,各个业务方的数据“各大自为政”。
最终公司数据混乱,后面大家对数据都摇头。
Oracle培训
第二种形式,集权式
就是公司所有的数据相关都归到一个部门中。业务方任何有需要都会向数据部门提出,数据部门会在内部对这些需求和报表进行沟通,避免重复开发,也便于对需求进行总结。
这种架构的好处是,所有的数据都是一个部门出,相对来说数据的口径会比较统一;
这个架构的坏处,如果部门组织的不好。会造成数据部门离业务比较远 ;有时候对于数据的思考不够深入,造成与业务部门的沟通成本上升。
同时会存在技术部的对于数据最底层平台建设的分工,造成与技术部存在一定沟通成本。

第三种:混合式
大数据平台建设由技术负责,他们核心是把数据平台建设的足够强大。
有一个比较大的数据部门,负责数据分析,挖掘,数据统一工作。一般来说这个部门会直接像管理层汇报,主要服务公司管理层;同时也会和业务方的数据分析师合作一起解决某个具体问题。
在业务方也会有自己的小数据分析团队。这个数据团队主要服务由自己这个业务团队,同时也会和公司的数据部门有沟通和合作。【有的公司会向业务团队开放数据访问权限,有的可能还是需要他们通过前端的报表获取数据】
在这种情况下,可能存在主要问题是会”抢”活干。
每个方式都有各自的优点与缺点,没有对与错之分;还是要结合公司具体的业务情况,公司规模等来决定,如果一个公司的数据部门从小公司发展到大公司过程中组织架构都没有什么变化,可能这不是一个适合有想法的数据人去的公司。哈哈

我个人观点是:小公司适合分散式;公司发展中间阶段:合适集权式;公司大的时候合适:混合式;
更多视频课程文章的课程,可到课课家官网查看。我在等你哟!!

赞(109)
踩(3)
分享到:
华为认证网络工程师 HCIE直播课视频教程