今日头条是否存在收集用户数据的行为?

我发现每次我说过什么事情后,第二天今日头条就会出现相关内容。打个比方,我聊天中说过买电饭煲,第二天就会出现电饭煲的信息。我说今天怎么一直打嗝,就出现怎…
关注者
1,046
被浏览
374,316

103 个回答

两年前加入诸葛,当时对数据对用户画像还没有特别敏感和清晰的认知,直到看到:

图片来自诸葛io官网的demo数据

是的,当时我有点惊,可能外行的人看到也会比较惊讶,跟两年前的我一样,稍微解释一下,这是一个单个用户画像模块儿,左边是一个人的基本信息,我们定义为属性信息,右侧是他的行为信息,可以理解为几点几分做什么事,点了什么,看了什么;每一次打开和退出应用会记为一次会话(session),在每个会话中会包含用户这次使用时的环境信息,比如通过ip解析出来的国家身份城市,以及硬件设备,网络环境等等。

以上其实可以说是数据的采集环节,他会包含追踪用户的行为并基于时间序列记录,以及用户识别两大技术,在行为追踪细说的话有现在的多种采集方式,大概有有埋埋点、全埋点、可视化埋点、服务端采集四种方式吧(关于这四种埋点方式的说明、优劣势以及怎么埋这篇文章比较详尽 详解埋点 )。有了这些数据,相当于是构建了单体画像模型,也就是来访的每个用户都有这么一张图:

用户列表

说完用户画像构建,接下来就是怎么分析了,我不可能一个个点的看对吧,这就是分析模型的事情了,常用的分析模型有漏斗、留存,展现形式有表格、柱形图、折线图、热图各种样子吧,这些其实相对好理解,当然,为什么在有了百度、友盟这样的工具以后,还会有基于用户行为数据这样的统计分析平台,虽然都是针对互联网产品做些计数和指标计算,背后的根本是,前者真的是只是统计,算数,告诉你所有人都在看的新增、活跃、留存、停留时长这些指标,你没法看到数据背后的人,没法针对运营,以及这些指标根本不能满足当前互联网环境下的产品运营渠道的指导工作,所以有了诸葛这样的行为数据分析平台,除了给你那些常看的数据指标,也会从业务价值层面提炼一些分析模型。基本的比如自定义留存:

自定义留存

留存的意思是,来过还来的人有多少,算出百分比,来的定义就是只要是打开就行,但现在不一样了,不同的平台对来的定义不一样了,阅读产品会认为用户来了看了一篇文章才算今天一个留存,电商产品会认为用户看了一个商品才算今天一个留存。比如上图,我不管你的初始是什么,只要回来的时候是冲着看一次理财产品,那我才认为你是一个有效留存。

当然,除了对原有模型的升级,我们也抽象出了其他的“模型”,比如你在用户分群的时候,在选择“查看过商品详情”的用户的时候,会发现有个维度是“新增于”,也就是用户触发看商品详情这件事是发生在新增后的1天,2天还是1个月内的,同理,用户在你的金融产品上完成支付是在新增当天还是新增30天后,不同的时间范围内筛出来的用户价值是不一样的:

好吧,关系分析其实很还有很多,比如当有了产品的很多数据,产品改版评估这些事情可不可以直接自动化,因为版本号,用户使用情况都有记录,完全可以自动化实现,比如渠道分析,用户来源、用户转化都标记了,能不能有一个功能模块儿进去就是各种渠道对比,其实这些在诸葛已经都实现了,当然,做的再炫,他也只是分析层面的事情。

采集、分析已经把诸葛2年做的事情说完了,接下来可能就更有意思了,能看到、能分析衡量出来还不够,客户要能有所行动,数据低了那该怎么办?其实就到了今年我们的重磅级产品,智能触达,这样也就实现了诸葛短期内的产品矩阵,实现了用户行为数据从采集、分析到应用的产品生态。用老板 @孔淼 常说的三个高大上的词儿是Data-Insight-Action。

简单说说Action。其实题主提到一个场景,当我干嘛的时候就正好收到相关的产品购买啦这样的推送。这其实就是行为数据的应用了。简单理解这个模型就是:在什么时机、给什么样的人、以什么样的方式、推送什么样的东西,当然,还有一个很重要的点就是效果怎么样。这样就从策略到执行到衡量迭代形成了闭环。仔细想想,其实这样的策略可以有上百种,并且完全自动化实现,截个图,别怕:

解释一下:所有人,只要满足了其中的某一个条件,就会收到某一个定制的推送,具体是短信、push还是邮件有执行方基于场景自动设置,比如流失召回类的,可能用户已经卸载了,那发短信比较合适。

好了,其实在采集、分析、应用三个大环节都串了一个遍,也算是目前行业内做的比较完整。回到题主的问题,两个关键词“窃取”“隐私”。“窃取”其实答案中有人定义的已经很好的,其实谈不上,如果算作隐私,这些数据确实是用户的隐私。比如用户属性层面的东西,你是谁,手机号、真实姓名、身份证号,以及你看了什么,买了什么都是用户的隐私。好在大概今年上半年,国家出了规定, 很多产品加入了隐私协议,明确告诉用户你们会记录什么,以及用来做什么,用户可以选择授权也可以不授权,当然,有人或有平台只是知道了存储了我的信息只要你不利用也算是隐私得到了保护,如果你利用这个东西为我提供你产品范围内合理有效的服务也是好的,怕就怕你拿到我的数据做些别的生意。

最后还得澄清一下,我们虽然是第三方数据服务公司,但我们提供的是技术解决方案,企业花钱购买的是我们的平台、我们的数据驱动顾问的分析咨询服务,企业有哪些数据,用户授权你采集哪些数据,在你的账号下在诸葛的平台看到的就是哪些数据,举个简单的例子,有个金融客户问,你们有用户的旅游、电商这类数据吗?对不起,我们是没有的,你有什么,传到后台什么,在后台就能看到什么,利用诸葛的分析模型就能展示什么。

好吧,打住了,这个东西其实很敏感的,多说无益,最后,希望这些内容让大家对行为数据这块儿的东西有所认知,当然,其实背后还有很多话题,比如风控、 人工智能等等,以上只是当前技术应用环境下我个人所看到的,以及工作中接触的一些东西,难免会有狭隘,见谅。

以上~


关于我们:

诸葛io定位于为企业提供基于用户行为数据的采集、分析和营销的整体解决方案。是国内领先的数据智能服务商 www.zhugeio.com

目前我们正在为互金/教育/新零售/保险/汽车等行业提供大数据整体解决方案并提供咨询服务。服务客户有:光明随心订、食行生鲜;人人贷、阳光保险、众安保险、平安;宝马、奥迪、大众、NEVS;饿了么;东易日盛等

关联阅读:

客户: 东易日盛 | 向上金服 | 光明随心订 | TutorABC | 麦子学院

指标: 病毒传播系数 | 复购率 | 粘性 | 漏斗 | 太阳图 | KPI

行业: 新零售 | 在线教育 | 科技金融 | 共享单车 | 装修 | 内容社区

产品: 改版评估 | 埋点需求文档 |

运营: 用户运营 | 跨应用市场追踪 | 推送策略 | 运营阶段

市场: 推广三要素 | 智能触达 | 精准推送

其他: 行为数据基础篇 | 客户成功 | 采集模型 | 广告监测

“为什么我最近聊天时提到了某个东西,然后就被app推送了它的广告呢?

——我肯定是被app监听了!”


App静默监听用户的谣言,早就已经被辟谣。但是这个问题下,很多答主也言之凿凿,认为自己确实被监听了。


这到底是为什么呢?


因为你的这个感受,是真实的。但是推出的结论,是错误的。这不过是一种心理学范畴的一种现象,叫做「视网膜效应」。


如果你/你老婆怀孕了,那么这段时间,你会突然发现,怎么街上到处都是孕妇。逛一会街就能遇到七八个。


“当我们自己拥有一件东西或一项特征时,我们就会比平常人更加注意,别人是否跟我们一样具备这种特征。”



每天都会有无数的信息,超我们扑面而来。但是并不是每一个细节,都会真正被我们的注意力所吸纳。比如你今天逛街见到50个人。那么这些人身上都有各种各样的特征:长相、发型、眉形、睫毛、美瞳、眼影、粉底、腮红、口红、耳环、上衣、包包、项链、戒指、手表、裤子、裙子、鞋子、纹身等等等等,你不可能把这么多人的这么多信息,全部都接受到。


可是如果你今天第一次买了昂贵的普拉达包包,那么你今天就会额外把注意力,放在你今天遇到的姑娘们都背着什么包包上了,可能会额外注意,他们是否也背着普拉达的包包,是否跟你同款。


因为注意力的集中,可能你以前都没有发现,原来街上有这么多姑娘都买了普拉达的包包。


你在乎什么,就会额外注意什么,就会发现这些东西出现的频率突然提高。


这就是视网膜效应了。


继续说回,为什么你会觉得app在监听我们,用来做广告推送。


其实你每天看app的时候,推送到你面前的广告有几十、几百次。可是绝大部分时候,你并没有真正留意这些广告,到底是些什么广告。


可是,当你昨天和闺蜜见面时,被安利了普拉达包包,然后动了心思也想买一个的时候,那么今天推送到你面前的上百个广告中,如果有普拉达的广告,就会额外的吸引了你的注意力。

当你没有脱发困扰的时候,其实也有很多次脱发广告推送到了你的面前。但是你从来没有注意过它。直到有一天,你或者你在意的人也开始脱发的时候,你突然发现:怎么满世界都是植发广告?


这就是视网膜效应。


我们大脑的思考,其实分为两个部分,一部分是下面图片中的骑手,代表理性思考。另一部分是图中的大象,代表着偏见,预设立场。

很多人都会认为自己很理性,是自己作为一个骑手来引领方向,而不是被大象带着走。我们每个人脑子里面都会有一个过滤器,留下我们认为正确的,剩下的通通扔进垃圾桶。


这个过滤器,让我们很多时候关注的不是事情的对与错,而是寻找认同感。电视上的养生砖家叫兽们夸夸其谈,长辈们听了,认同了他们,就觉得他们说得什么都是对的,就愿意出钱高价买那些保健品。


这也是朋友圈谣言能广泛传播的原因,预设立场是无商不奸。


近日,微信平台上流传着一段两分钟的视频。视频中,一男子不断将一个个塑料袋放入一台机器,经过熔解、拉丝、切割等工序,最终生产出一粒粒状似米粒的白色固体。视频配有文字称,这就是假大米的制作过程。而实际上,这就是回收废旧塑料的过程,怎么可能制作假大米?但是人们预设的立场,会让很多人一看就会不假思索的认为:这是在制作假大米。


而正常科普文章,无论写得多好,多有道理,只要这个与他们的预设立场不一样,那么这个就是狗屁不通。


回到互联网公司监听用户聊天上,仔细思考一下,你就知道有多荒缪了。


正常人一天大概会说7000个词,这些APP到底该监听哪一个才能给你推送广告?这些关键词的实际价值又有多少?难不成你说的每个词,都是你想买的东西?


很多时候,我们都是把手机放在口袋里面,语音识别什么时候能到这么牛逼,能清晰识别出你说的话。不相信的话,可以试试看把手机放在口袋里,试试看讯飞语音输入的准确度怎么样。


如果用方言聊天,他们是怎么监听的?难不成专门找人人工翻译?


而且真的实现24小时不停实时监听,这些APP的服务器真的能抗得动吗?你的手机电量能抗多长时间?


正常的推荐广告很简单,他们完全可以利用用户注册时候的性别,年龄,地域,以及在网站内的购买、收藏、搜索历史等等,来作为推荐依据。大公司还会通过交换数据、购买数据的方式,对用户进行精准画像,来推送广告。这么做靠谱多了,为何还有费这么大力气去监听用户,到时候拿来一大堆垃圾数据,浪费广告位置?


当然不管怎么说,谣言还是会有人相信,偏见永远都在。