Deprecated: Creation of dynamic property db::$querynum is deprecated in /www/wwwroot/kyk8.com/inc/func.php on line 1413

Deprecated: Creation of dynamic property db::$database is deprecated in /www/wwwroot/kyk8.com/inc/func.php on line 1414

Deprecated: Creation of dynamic property db::$Stmt is deprecated in /www/wwwroot/kyk8.com/inc/func.php on line 1453

Deprecated: Creation of dynamic property db::$Sql is deprecated in /www/wwwroot/kyk8.com/inc/func.php on line 1454
 数据驱动经验分享:从方法到实践_乐鱼体育在线直播|乐鱼体育直播下载
  •  网站地图 |
  •  加入收藏 |
  •  乐鱼体育直播下载 |
条码与RFID解决方案专家!
集条码打印、扫描、采集于一体化解决方案的高新技术企业
全国咨询热线

029-89353355

乐鱼体育直播下载 contact us

手机:18991830957
座机:029-89353355
Q Q:359316042
邮箱:xr@x-barcode.com
地址:西安市雁塔区雁塔西路158号双鱼大厦A座13层

企业公众号

产品推荐 Related

查看更多>>

当前位置 > 首页 > 产品中心 > 数据采集器

产品名称:
数据驱动经验分享:从方法到实践

发布时间:2022-07-01 21:51:30 来源:乐鱼体育直播 作者:乐鱼体育直播下载

产品简介:
  本文根据神策数据联合创始人& CTO 曹犟在神策 2018 数据驱动大会现场,发表题为《数据驱动从方法到实践》演讲整理所得,enjoy~  驱动产品智能,现在基本上已成为所有的电商类、资讯类产品的标配,如“产品推荐”、“猜你喜欢”等。企

分享到:
订购热线:18991830957 

咨询/订购

产品介绍

  本文根据神策数据联合创始人& CTO 曹犟在神策 2018 数据驱动大会现场,发表题为《数据驱动从方法到实践》演讲整理所得,enjoy~

  驱动产品智能,现在基本上已成为所有的电商类、资讯类产品的标配,如“产品推荐”、“猜你喜欢”等。企业要么组建团队实现智能化的应用场景,要么应用外部工具来解决问题,因为在流量红利逐渐消失的今天,千篇一律的内容会让你的“留存”数字非常难看。

  我们曾为某一家很知名资讯类企业做 Feed 流的改版,神策来提供具体的推荐策略。通常,个性化推荐的评价指标是 CTR——展现了一千种内容,有多少人点击?

  在 2018 年,我们认为再评价一个算法的好坏,用 CTR 非常不合适。神策从关注指标 CTR 转为衡量“命中了策略的人”跟“命中热门随机内容”的两大用户群体,观察他们在平均访问深度、7 日留存、停留时长等更深层指标上的差异。

  数据采集——数据建模——数据分析——数据反馈,这是一个完整的数据驱动闭环。我们在很多场合提到此,这里不再赘述。

  有很多企业来找我做关于数据采集方面的分享,我用这张图描述了典型的数据分析平台,一个为数据驱动而构建的数据分析平台,各位可以参考。

  数据采集是一切应用的根基,“大、全、细、时”由桑文锋提出(详情可戳此查看桑文锋谈大数据分析的四个重要环节),是神策一贯坚持数据采集理念,具体到采集内容上,包括数据类型、数据所有者、数据来源。

  从数据所有者上来讲,我们采集第一方数据——也就是“我们自己的产品,我们自己的用户,自己用户在自己产品上发生了什么。”这是第一方数据。

  目前我们采集第一方数据为主;而第三方数据,市面上一些免费的 SaaS 工具可以做采集和统计,并做一些处理、脱敏;用这些数据作为第三方数据,提供给客户。这是有悖我们价值观的,我们绝不涉及。

  从数据来源上来讲:新零售的火热,线下数据采集还是非常火的,不管是摄像头、蓝牙探针等,是线下场景很好的补充。

  对这一部分,我们保持持续关注,一些客户会将通过二维码、店员主动拿 Pad 做展现等方式,将用户从线下行为引到线上,从而保证用户数据的可采集、可衡量。

  我们一贯的观点,是数据采集没有万能灵药,要根据需求选择合适的采集方案,这一点我在不同场合讲很多次,这里不再展开。

  这是一种典型的用户行为采集方案。客户端采集轻交互的内容;服务器日志采集 Nginx、UI、Server 浏览、检索、理财产品等内容。

  而对于一些业务操作,例如客户跟客服之间的交互,或者内部的客户运营,主要是在业务采集上搞定的。

  我来介绍下目前被提及最多的客户端采集。客户端是直接跟用户发生交互关系的一端,可以是 APP、小程序、网页、H5、公众号等,客户端采集数据操作,包括点击按钮、浏览页面、下拉框选择、提交表单、上传照片、切换导航条等。

  抛开埋点方式,完成这样的事情,很多容易被忽视的,基础属性要覆盖我们能想到的所有内容,包括简单的用户行为相关、操作系统版本、物理分辨率等,还有很多客户通过 SDK 提供部分风控数据的采集。

  比如说 iphone 手机有没有越狱,浏览的时候是横屏还是竖屏,以及电量等等。(之所以要用 SDK 采集当前的电量,是因为如果用户用模拟器访问,那么它的电量变化跟真正的手机有非常大的不同。)

  第二:SDK 完成匿名 ID 生成、基础属性采集、数据打包压缩加密、本地缓存、网络传输等工作

  数据打包和加密,不仅可以在本地打包,还可以在必要的时候删掉,神策现在服务很多银行证券客户,对加密要求的非常高,比如给某一个字段要用什么加密等,这些都是 SDK 要完成的。

  本地缓存在 IOS 与安卓中特别重要,因为为避免影响用户体验,当发生一次点击,对应的数据不会立刻传到后端,所以都是缓存到本地等待最佳网络时机。本地缓存、网络缓存这些都是SDK 来做的。

  有人问,所谓的代码埋点、全埋点、可视化埋点有什么不一样?我们可以这样理解:SDK 完成基础数据的采集、数据储存打包、传输等,同时向上埋点应用层提供 API,所谓的代码埋点就是直接利用 API,告诉采集了什么数据。

  全埋点则是在用户完成某个操作的时候,自动的调用 SDK。所以说 SDK 完成一些基础工作,代码埋点开发者直接调用 API;而全埋点开发者不用直接调用,可以比较自动的完成。

  说到这里会打一个广告,我们会马上出版一本书,专门讲安卓 8 种全埋点,到时候有兴趣的话可以看看。(白皮书 《Android 全埋点技术白皮书》重磅推出!开源所有项目源码!)

  大家可以看下如图的例子。我们做了一些工作,后台架构有很大改进,可以实现将第二个设备,跟同一个用户绑定,只要用户登录,神策就可以把不同情况下登录的数据完全打通,这是非常典型的 ID-Mapping 的场景。

  用户产品本身可以多端使用,可以在网页上使用,例如说发了营销 H5,用户在微信内置浏览器 H5 完成注册,跳到 Appstore 完成激活。如果不能将营销 H5 的用户行为,与登录激活之前的行为贯通,那么也没有办法详细分析 H5 的营销效果。

  再如,小程序突然火起来了,客户有需求,为此我们专门做了小程序采集,包括预置采集的事件,以及小程序相关的属性,同时一样带动了代码与自动化采集两种方式,小程序可以充分得到微信里面的社交信息,对小程序分享传播的属性采集是非常重要的。

  一个人在设备上,又使用小程序,又使用一个 APP,又换了一个小程序,但是两个小程序之间登录帐号打通,最终我们实现可以把两个 LoginID 与 OpenID 设备贯通起来。

  从实际经验上来说:想高质量搭建日志采集非常难,设置日志用哪些内容,一次性工作很难。更难的还体现在产品迭代上,比如产品两周发一个版本,程序员会说产品功能都测不完,没法搞日志。

  要搭建一个高质量的日志采集,要贯穿在整个开发流程,从最早期一直到运维上线,到复盘整个迭代项的时候,每一步都要有意识。这也是为什么很多SaaS 产品都没有采集日志的能力。

  这是我们在中国银联典型的案例,包括设备指纹采集、加密传输等,当然这个图画出来体现对用户行为数据不同的应用,除了做日常行为之外,还有一些其他的应用。最后是业务数据的采集,包括 CRM 系统等。

  数据建模最重要的是数据模型的选择,以及对应的储存。数据模型选择为什么重要?因为数据模型抽象好了,后面的分析模型可以做的更好。如果数据模型抽象的太复杂,整体过程非常复杂。

  我们现在的数据模型是 Item 实体、Event 事件、User 用户,我们不会把模型搞得太复杂,现在模型下面,数据采集到建模所要做的工作是比较少的,基本可以通用化、产品化。

  我们已经有了标准的数据模型,同时通过不同的采集方案采到了很多数据,所要做的工作主要是把采集到的数据映射,这里面非常多的工作不再具体展开。

  不同的数据模型选不同的储存方案,储存方案的选择主要根据数据本身的特点,例如是否可追加、可修改、访问是以什么样的访问为主,是否会需要删除等。

  数据统计与分析有两种方法论,通常情况下是图片左边方法论,PM 给 RD 提,老板要看这些报表,给 RD 提要求,RD 写一些东西并发邮件出来,改程序后又有新的需求。

  你可能要把整个计算过程完整讲一遍……在这种情况下,RD为了不想太频繁操作和改变,总是会给 PM 设置各种限制。

  右边的方法论,抽象的模型覆盖指标体系以及大部分分析需求,通过友好的交互让需要数据的人自主获取数据。这种方法论是神策产品提供的,我们不需要问你看什么指标,因为你看的指标可能在整个行业都有通用性,我们会把需求抽象下来,接下来就是模型抽象。

  这两种方法论区别是,是否让需要数据的人直接使用数据,造成的工作效率相差非常大,这就是为什么现在神策产品能够卖出去,并不是我们造了一个这样的需求,而是真正有这样的需求。

  先绘制用户旅程:用户首先要访问网站,之后要注册账号,实现首购之后会重复性购买,只有这样的用户旅程最终会带来总销售额的增长。接下来就要根据用户旅程来组建增长模型。

  像电视广告、楼宇广告,一定程度上是不可追踪的,但是像抖音、头条都是可以追踪。同一个用户在媒体上点广告,跟进入到产品之后,只要把这个行为打通起来,整个投放效果就是可追踪的。现在我们可支持二三十种大大小小的渠道。

  我们把用户在点击广告前后的行为串通起来,剩下的工作就是分析,比如我们在头条花了10000 块钱买了 1000 个点击,其中 50 个用户使用产品,我们可以设置从哪些角度来衡量这些人的效果,来衡量用户的转化率、留存、复购等。

  也可以对比不同的渠道,对比不同渠道下不同的投放关键词带来效果等,来对比与衡量用户真正的价值。

  这个是很典型的数据驱动市场营销的例子,某家理财产品投放广告,刚开始假设关注 P2P 理财产品都是资质相对较好的白领,因此在核心商圈的写字楼电梯间投放广告。

  但是经过转化分析后,发现进件转化率很低,因此对借款人画像分析,确定目标人群特征:24-30 岁,工作时间短,收入一般,身处非核心高档区域。得到这种结论后,将投放渠道放到了抖音和快手这类短视频平台,转化率得到明显提升。

  因为我是工程师出身,我根本不懂这些东西,但是我知道怎么改进产品:我们把这些指标全部算出来,进行监控,一旦发现某一个指标异常,立刻分析原因,并解决这些原因。

  如果指标没有异常,可以和别人家进行对比,你的转化率是多少,我的转化率是多少,看我们有多少提升空间,来提升指标。

  所以,整个逻辑很简单,先设置关心的问题,实际算出来,并关注是否异常,找到异常原因,分析解决异常,看数据有没有真正得到上升。

  通过用户行为将用户群体划分成四类:路人、打酱油、参与(点赞、转发)、深度参与,如何提升这四类人的用户留存?

  扩大“参与行为”使用者面积,门槛太高,落地性较差;扩大“围观行为”使用者面积?这个方法更可行,在产品信息流页露出“热评”,可以提升留存,来验证新增“热评”之后效果如何。

  某电商的首页存在两个“收藏”,一开始设置有点问题,一个点击率极高,一个点击率极低。显而易见,浪费了非常重要的位置。后来将点击率低的收藏按钮位置换成了“服务”的按钮,经过验证,点击进入量没有明显下降,同时“服务”点击量提升。

  经过 SA 中的数据对比发现,BEST 分类的点击流量并没有预想中高,甚至跟 MEN 分类的访问量差不多。猜想可能用户不习惯往左滑动页面,习惯往右滑动界面。

  同时,该电商还进行了首页 BEST 分类按钮位置调整,将 BEST 类目放到 FUN 类目右边。效果:经过调整后,50% 以上的首页用户会进入 BEST 类目,比原来调整之前相对提高了 78% 。

  这是一个纯女性短视频社区案例,他们一直致力将数据分析融入到运营乃至产品迭代的最细节处。这是他们的工作方式。

  该企业的小程序更新发版很快。用户分享之后裂变,有一个完整的看板让大家来评估的自己的影响。日裂变作为关键指标,某版本上线后发现裂变指数(uv 数 x 内部调整因子)迅速下跌。

  通过回溯过去 7 日的分析看到:“分享”按钮的点击数据出现连续下滑,“下载”按钮的数据在出现大幅度提升。

  通过用户实际回访,确认“保存按钮”其实弱化了“分享意愿”,造成分享减少。次日晨完成新版本上线后,指标变得正常。

  除了数据驱动产品迭代,下一个案例是用数据驱动运营,数据驱动运营同样是发现问题,分析原因,来验证效果。

  神策自动化运营是基于分群标签的全流程运营闭环分析系统,通过用户精准分群、灵活创建并管理营销活动计划,比如知道用户数据、业务数据,最终精准的刻画了用户画像。基于用户画像采用不同的触达方式,比如优惠券等。

  做完之后,我可以分析衡量触达效果怎么样,从而评价营销效果。有了第一次营销效果之后,可以针对性的改进,做第二次营销效果。真正形成自动化、精细化的运营闭环。

  这是个性化推荐的全流程,包括采集各种不同的数据,构建相应的兴趣模型,特定的场景推荐下做推荐,不同纬度、不同指标做测量。

  东方明珠是神策数据的客户(东方明珠:融媒时代的大数据转型之路打造),以百视通 IPTV 某驻地为例,日活数百万用户通过 IPTV 机顶盒付费观看授权内容,部分精品内容需额外充值观看;在接入神策推荐之前,主要依赖人工推荐,以热门、付费和内容相关性为主要推荐参考。

  为提升用户的观影体验、提高用户留存以及充值付费营收,东方明珠利用神策推荐解决方案,完成采集点击日志、展示日志、播放日志等所需用户行为数据,基于行为数据构建深度学习召回算法策略,采用 GBDT+LR 排序模型训练数据。

  推荐算法上线两周后,神策推荐的效果,对比人工推荐,仅 CTR 一个指标即提升了 6 倍,对推荐内容的人均浏览次数提升了 1.9 倍。

  为了帮助在运营进阶路上,执着前进的伙伴们能够更快速的提升,我们联合了腾讯、百度等拥有10年以上经验沉淀的实战派导师,推出了【运营总监修炼之道】,至今已帮助5000多名运营管理者和进阶者,掌握了更加系统全面的运营专业知识和管理思路,在处理类似运营战略规划、不同渠道运营策略和流量变现、品牌营销玩法、数据分析等实际问题时有更清晰的解决方向!

  在【运营总监修炼之道】,四位来自腾讯、百度等拥有10年以上经验沉淀的实战派导师,将和你面对面分享高阶运营的系统知识,帮你掌握更加系统全面的运营专业体系和高效管理思路…….

  人人都是产品经理(是以产品经理、运营为核心的学习、交流、分享平台,集媒体、培训、社群为一体,全方位服务产品人和运营人,成立11年举办在线+期,线+场,产品经理大会、运营大会50+场,覆盖北上广深杭成都等20个城市,在行业有较高的影响力和知名度。平台聚集了众多BAT美团京东滴滴360小米网易等知名互联网公司产品总监和运营总监,他们在这里与你一起成长。

上一篇:Flink SQL篇SQL实操、 下一篇:自动售卖机提升效率

在线留言Online message

联系方式address

公司:乐鱼体育在线直播|乐鱼体育直播下载
电话:029-89353355
手机:18991830957
地址:西安市雁塔区雁塔西路158
           号双鱼大厦A座13层
陕ICP备16017194号  
陕公安网备 61011302000213号

扫码开启行业服务新标准

姓名:
电话:
邮箱: