下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922
  • Pandas 探索性数据分析综合实战

    本文的内容是关于对数据集进行特别分析,并试图找到关于数据的洞察力。我们做了处理缺失值、异常值的工作,并将单变量、双变量和多变量的分析可视化。 ​本文主要分析数据、组织数据、清洗、过滤、排序、聚合、可视化变量之间的关系、分类图和数据的分散性。......

    2022-12-09 21:24:26

    Pandas数据分析

  • 淘系数据模型治理优秀实践

    本次分享题目为淘系数据模型治理,主要介绍过去一年淘系数据治理工作的一些总结。 具体将围绕以下4部分展开 1模型背景&问题 2问题分析 3治理方案 4未来规划 模型背景&问题 1.整体情况 首先介绍一下淘系的整体数据背景。 [/图片] 淘系的......

    2022-12-09 20:50:41

    数据治理

  • 2022年及以后大数据的五个发展趋势

    随着技术的发展,收集的数据量呈指数级增长,而且在短时间内没有放缓的迹象。企业正在致力于利用大数据分析来保持竞争力。以下概述了2022年及以后大数据的5个发展趋势。 大数据的世界正在不断变化和发展。展望2022年,企业在大数据方面应该注意四个......

    2022-12-08 22:19:43

    大数据数据分析

  • Cloudera:巧用数字化转型工具,助力企业降本增效

    Cloudera提供了各种帮助企业加速数据和AI计划的工具。其中就包括通用数据分配(UDD)和应用机器学习原型(AMP)这两个特定领域。 伴随着数字化浪潮,企业正不断受到来自多方面的重大挑战。许多传统型服务和交付方式在被数字化创新型参与者重......

    2022-12-08 22:16:36

    Cloudera

  • 当我们说大数据Hadoop,究竟在说什么?

    本文讲解了大数据开发中最流行的软件Hadoop, 它主要分为3部分,管理文件存储的hdfs, 统一管理资源和任务的调度平台Yarn,以及提供了一种计算引擎MapReduce, 基于这三个"磐石",可以构建出整个大数据生态。 ​前言 提到大数......

    2022-12-08 22:13:13

    大数据Hadoop存储

  • 大数据分析对医疗保健的影响

    随着人口的增长,普通人的寿命也在增加。这凸显了医疗保健专业人员需要快速应对影响患者健康的挑战。医疗保健分析能够最大限度地降低治疗和可预防疾病的成本,并提高整体生活质量。通过使用大数据,医疗从业人员能够收集大量数据,并从得出的见解中得出最佳策......

    2022-12-08 22:04:32

    大数据医疗保健

  • 谈谈如何构建优化的流数据架构

    流处理最初是一种“特定群体”技术。但随着 SaaS、物联网和机器学习的快速发展,各行各业的组织现在都在试行或全面实施流分析。很难找到一家没有应用程序、在线广告、电子商务网站或物联网产品的现代公司。这些数字资产中的每一......

    2022-12-08 22:01:29

    数据架构工具

  • ClickHouse在自助行为分析场景的实践应用

    在巨大的数据量面前,想追求极致的性能及全部场景适应性,必须在某些技术方案上进行取舍。ClickHouse从底层列式存储到上层向量化并行计算,都没有考虑存算分离、弹性扩展的技术方案,甚至于横向扩容数据需要手动re-balance。因此,如果要......

    2022-12-07 14:28:07

    ClickHouse并行计算数据

  • 2023年数据治理趋势

    尽管整个组织的数字孪生还没有普及到整个数据领域,但是数据治理的许多基本方面——当通过实时访问控制和情景适应性的镜头应用时——可以模拟它们详细描述当前发生的事情的能力。 数据治理的价值对企业和整......

    2022-12-06 23:17:44

    数据治理趋势

  • 网易严选离线数仓治理实践

    前面关于各个治理项目都有提到需要推送待办任务给数据开发处理,所以我们需要一个通用的消息通知机制。再结合到我们大多数巡检场景都可以基于元数据+SQL的形式识别,于是我们采用UDF的方法,对接消息中心的接口,实现了消息通知的SQL化。 1、背景......

    2022-12-06 23:14:15

    离线数仓治理

  • 测试一下,读懂数据的能力,你有吗?

    因为这就是孤零零一个数字,啥含义都没有。想读懂数据,至少它得是一个明确的数据指标。包含了指标名称,使用场景,计算口径。同样是180,我们换成:成年女性,身高180cm。是不是一下清晰很多了。 ​很多新人读不懂数据含义。对着报表,只会和复读机......

    2022-12-05 23:23:00

    数据能力场景

  • 漫谈对大数据的思考

    “大数据”已跃升为我们行业中最受炒作的术语之一,但炒作不应使人们忽视这样一个事实,即这是数据在世界上的作用真正重要的转变。 “大数据”已跃升为我们行业中最受炒作的术语之一,但炒作不应使人们忽视......

    2022-12-05 23:18:28

    大数据数据管理

  • 一份“靠谱”的年度经营计划,你学会了吗?

    做经营分析的同学们则被夹在中间,一边被要求“科学合理地进行测算”,另一边又得对领导们拍脑袋/扯皮出的结论“给予合理解释,科学地分配到每个月”,那是要多郁闷,有多郁闷。到底合理的年度经营计划该咋......

    2022-12-05 22:47:29

    分析师数据作用

  • 供应链技术如何解决供应链中断和员工倦怠问题

    美国劳动力的持续短缺正在影响各行业组织,供应链是受冲击最严重的行业之一。不断变化的消费者行为使得新职位的空缺激增,以满足企业需求。然而,尽管从港口、仓库到船运公司和物流部门,供应链的各个层面都做出了最大努力,但短缺问题依然存在。在此期间,技......

    2022-12-03 20:24:25

    供应链技术

  • 数据科学与数据分析

    数据科学是一个令人兴奋的领域,因为它的本质是收集、存储和处理大量信息,可以产生在任何其他学科都不可能达到的知识水平。 这篇博文将讨论分析与数据科学的相似点、不同点以及优缺点。 数据科学和数据分析是最伟大的科学学科之一,每个人都可以从学习中受......

    2022-12-03 20:19:49

    数据科学数据分析

  • 这才是真正的数据分析项目,而不是爬表

    作为数据部门的领导,可能最想承接的就是计划类工作,虽然技术含量低,但这是一个直接服务大老板的机会。能多在大老板面前露脸,本身就是一个绝好的立功机会。 经常有同学抱怨:每天忙于取数,不知道有啥数据分析项目可以做。今天系统性介绍一下五大类数据分......

    2022-12-03 20:05:45

    数据分析项目

  • 数据分析能力分级模型,你在哪一级?

    很多做数据的新人都有这个困惑,今天陈老师给大家解这个局。这里问题的核心在于:如果不能按自己的建议做项目,是不是就不能提升数据分析能力了?回答当然是:否!数据分析的能力晋级分为四个层级,所谓“按我的意见做”根本就不在这......

    2022-12-03 18:20:46

    数据分析能力分级模型

  • 谈谈如何跨越数据架构的漩涡

    创建数据湖和数据集市是为了满足当时数据工程领域的实际需求。即使在今天,数据仓库仍然无法支持企业的所有不同应用。即使对于较新的云数据仓库也是如此。 如果让当前数据工程领域的人绘制一个“现代”数据架构,几乎肯定会得到如下......

    2022-12-03 18:14:33

    数据湖数据仓库数据架构

  • 互联网都在说降本增效,小红书技术团队是怎么做的?

    目前,这一平台已覆盖小红书搜索、推荐、广告的 S0 服务,运行两个多月以来,辅助业务团队存量优化超1万 CPU 核;发现性能退化超1万 CPU 核并跟进优化。 随着小红书业务的快速发展,资源消耗和成本压力显著增加。在降本增效的大背景下,我们......

    2022-12-03 17:52:32

    大数据

  • 数据中心芯片市场风起云涌

    数据中心正在加速朝着绿色低碳方向转型升级。 近来,英特尔和谷歌云联手推出了“Mount Evans”芯片以提高​​数据中心​​​性能;Arm为​​云计算​​和数据中心推出新一代芯片技术“Neoverse ......

    2022-12-03 17:14:39

    数据中心低碳