下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

浅谈知识图谱的构建与大数据

作者:课课家教育     来源: http://www.kokojia.com点击数:3267发布时间: 2017-10-30 16:00:11

标签: 大数据整体构建知识图谱

  欢迎各位阅读本篇文章,本篇文章讲述了教大家如何在Google中计划任务,课课家教育平台提醒各位:本篇文章纯干货~因此大家一定要认真阅读本篇文章哦

  自从2012年Google推出自己第一版知识图谱以来,各大互联网企业也纷纷推出了自己的知识图谱产品。知识图谱是把所有不同种类的信息连接在一起而得到的一个关系网络,它提供了从“关系”的角度去分析问题的能力,是关系最有效的表达方式,目前在营销、交通、风控场景,知识图谱均有应用。今天,我们从反欺诈的角度浅谈知识图谱的构建与应用。在互联网金融行业,不少的欺诈案件会涉及到复杂的关系网络,而知识图谱可以帮助我们更有效的分析复杂关系中存在的特定的潜在风险,可以提高贷前信审和贷后监控的效率,对于金融风险的控制也有着极大的裨益。

  知识图谱的整体构建

浅谈知识图谱的构建与大数据_大数据_整体构建_知识图谱_课课家

  我们通过将借款人的关键信息数据整合到知识图谱中,逐步挖掘与这些信息有关联的其他个人,形成关系网络,从而进行分析和诊断。知识图谱作为一种基于图的数据结构,它由节点(实体)和边(关系)组成,每个节点代表一个个体,每条边为个体与个体之间的关系,把与借款人有关的所有数据都打通,构建包含多数据源的知识图谱。在构建过程,我们需要通过节点定义,边关系处理以及规则集搭建来实现图谱的展示。

  第一,定义业务节点。节点即为实体数据,如客户的ID,身份证,手机号,设备,微信,微博,邮箱,QQ等等,一般用户ID我们认为是业务的核心顶点。可以利用任意节点拓展用户所有信息。同时可以建立双节点关联,实现节点之间的关系查询。

  二,边关系的处理。边关系是用来描述两节点间边的属性内容。例如在使用设备信息时,用户可能有登录、注册、转账等不同的行为属性,手机也有呼入呼出等不同的行为属性,在处理边关系时,我们加入属性描述和构建能更加有效的识别用户的行为轨迹和关联关系。

  第三,规则集搭建。有了节点和关系,我们已经构建了基础的关系网络,但这样的网络并不能直接将反欺诈所需要的核心业务信息展示使用,这时规则集的搭建就显的格外重要。例如我们使用手机号聚集关联,IP聚集关联,公司聚集关联,设备聚集关联,通讯录重合度聚集关联等等,将节点与节点之间的关联关系聚集,形成聚集关联,直接用于查询,快速定位案件性质。

  完成如上数据整理工作后,结合neo4j的图形数据库,我们来看看最终的图展示效果:

  我们发现该A客户手机通讯录中将好几个手机号备注为XX客户,而XX客户同样为申贷用户且存在共性问题(如申贷时间差不多,使用设备重合,逾期…),且他们的通讯录中将该A客户备注为贷款中介,由此可定位A客户很可能是中介,再结合其他可疑点定性中介欺诈,进而挖掘团伙。

  我们利用图谱的数据结构,构建反欺诈知识图谱有效抵御个人信息造假,组团欺诈的风险。当然知识图谱不仅在反欺诈调研中能帮助更好更快速的案件定性,在逾期催收中也起着重要的作用,比如很多逾期客户失联,通过知识图谱的关联可以帮助我们挖掘出更多潜在的新的联系人,从而提高催收成功率。篇幅原因,文中的一些技术细节不做更多讨论。

  知识图谱的广泛应用

  毫无疑问,知识图谱的图展示应用能非常有效快速定位用户的关联关系和识别团伙案件,除了基础应用之外,我们可以继续加入模糊匹配和消除歧义等技术应用来进一步完善图谱的应用。同时基于图算法我们还能进一步挖掘其中价值,例如通过不同人之间的紧密程度计算来分析用户的风险等级并融入模型应用。同样

  步骤一,明确用户角色。如果是一个内容类产品,有内容生产者和内容消费者,他们在产品中定位是什么?如果是一个教育类产品,有老师和学生,那么,激励的手段方法和措施是不一样的。

  步骤二、激励的行为有哪些?用户在产品中的行为,有一些是有价值的,比如,对于电商平台来说,购买商品是有价值的;还有一些行为可能是有害的,比如,在社交产品中发表负面言论,这些言论可能导致产品被封。

  步骤三、如何激励?满足人性的一个弱点,即可。

  比如:

比如:

  弱点一,精神层面的满足,比如,淘宝买家的等级;

  弱点二,物质层面的满足,比如,饿了么积分商城;

  弱点三,产品功能层面的区分于他人(与众不同),比如,百度贴吧中,部分贴别只允许4级以上用户发言,就会让用户产生一种虚荣感和优越感。

  步骤四,选择一种合适的方式。

  首先,明确用户想要的,同时结合产品想要的,即,找到产品需求和用户需求的平衡点,评估产品所需要的用户行为。

  其次,利用从众心理,让用户感受到很多人都在使用,刺激用户。比如,薄荷app中“成功故事”板块,通过减肥成功的故事刺激用户加入进来。

  增加可使用的场景

  前年,滴滴打车改名叫滴滴出行了,名字并不是随便改的。滴滴刚起步,叫滴滴打车,因为这个名字更能加深印象。之前,用户仅在打车时想到滴滴,而再后来滴滴的知名度提高了,改名叫滴滴出行,此时,用户只要出行就想到滴滴,与之前相比扩大了用户的使用场景。

  同样的例子,比如,王老吉,之前叫治上火,喝王老吉,后来改名叫怕上火,喝王老吉。如果是上火的时候,就是我已经上火了才能喝王老吉,但是改名叫怕上火喝王老吉,这个时候,只要用户打算预防上火,都会去选择王老吉。

  用户流失后的召回

  如果之前的手段都已经做了,但用户还是流失了,这个时候就需要进行用户召回,但用户召回是有成本的,不可能所有用户都召回,因为用户中有刷量的用户,有垃圾用户,这些用户就应该放弃,而优先召回曾经的真实用户。

如果之前的手段都已经做了,但用户还是流失了,这个时候就需要进行用户召回,但用户召回是有成本的,不可能所有用户都召回,因为用户中有刷量的用户,有垃圾用户,这些用户就应该放弃,而优先召回曾经的真实用户。

  初期的产品没有达到用户预期很可能就流失掉了,流失后就需要想办法把这一部分用户召回来。

  同样,使用诸葛io用户分群功能,选择一个筛选条件:在最近30天内没有登录,即定义为流失用户,而把最近30天,有且有过3次付款行为的实名用户,定义为高质量用户,给这个用户群命名为,高价值流失用户,现在需要进行这一部分用户群的召回。

  也正是基于图计算的逻辑能完成用户关系、偏好、行为轨迹等一系列的识别,在大数据时代,在合理采取用户数据的前提下,相信图谱会更加多的运用在医疗、保险、营销等方方面面。

  相信最后大家阅读完毕本篇文章,肯定学到了不少知识吧?其实大家私下还得多多自学,当然如果大家还想了解更多方面的详细内容的话呢,不妨关注课课家教育平台,在这个学习知识的天堂中,您肯定会有意想不到的收获的!

赞(10)
踩(0)
分享到:
华为认证网络工程师 HCIE直播课视频教程