今日头条大数据杀熟(今日头条客户端)

个人学习 18 0

今日头条大数据杀熟

所以对上最近的“杀熟”事件,除了对某程等 OTA 的机票杀熟潜规则事件(不知情的可自行百度)之外,业界鲜有明目张胆光天化日和众所周知的杀熟算法。之所以加了这么多的定语,一是为了保护我的脸不要立马被打,二是确实一般情况下不太敢真的来做杀熟这件事。

这里想理清两个概念,“新人专享”和“杀熟”其实不是一件事儿。

在很多领域,新用户专享的优惠和价格其实是作为拉新的成本之一,用一次超低门槛来换取新用户的一次临幸,哪怕再也没有下一次,好歹在财报和 BP 中算是一个增长的百分点。因此很多产品会把新人的第一次价格拉的特别低。而当用户二次回购回访的时候会发现入坑已悔,破口大骂说这是价格歧视。对啊,用低于成本价的门槛让你享受了服务,后续的羊毛不再薅回来,不“歧视”你“歧视”谁呢。

今日头条大数据杀熟

这种备案,更像是一种信息公开,以保证算法必要的透明性。

工信部信息通信经济专家委员会委员、中南财经政法大学数字经济研究院执行院长盘和林告诉记者,像今日头条这类的算法是需要去备案,并且,算法大幅度的调整亦需要去补充备案。备案是将一些算法推荐的细节公开,以便于监管层来评估这些算法的潜在风险,备案不同于审核,不会对互联网企业造成太大的麻烦,是为了方便监管层管理和掌握这些算法的基本规则。

今日头条大数据杀熟

事实上,推荐算法并不神秘或者说很容易被人理解,无非就是建立人和物之间的关系。甚至我认为,它应该是我们的“常识”。想想我们日常生活中的一些推荐场景。

比如,最近我想买部手机,不知道买哪一款,你可能会:

结合自身对产品要求:

从上面我们可知,这里要搞懂推荐就必须搞定人-人,人-物,物-物之间的关系。为什么这么说?

_人-人_

我知道你周边的人喜欢什么,可以给你推荐你周边人的偏好。有这么个段子(具体记不清了)“前两天去朋友家里看到某个电器,然后回家后发现淘宝给我推了同款”,大概率就是这么个逻辑。

和你一样,20出头,白领阶层的女孩子都喜欢这款项链,你也可以考虑一下(虽然我本人很抵触这种推荐方式,怕被撞衫,但是,从推荐的效果上可以看出真的很有用)。

[ 相关方法:基于社交关系推荐,基于用户协同算法]

_人-物_

知道你过去喜欢什么物品,给你推荐和你过去偏好类似的物品,这种方式经常被用在内容类的APP中。比如,我知道你喜欢娱乐、明星,那么,推荐的内容就趋向于娱乐、明星。这种算法的难度在于人行为的表征和物品的表征上。如何刻画物品(item profile),你是怎么知道用户是看中了物品的哪些特征从而选择了该物品,是看中了物品的价格实惠?颜色迥异?还是尺寸刚好合适他们的房屋布局。

建立物品画像,进一步根据用户对物品产生的行为,也可以对用户偏好进一步刻画(user profile). 用户画像特征也可以通过用户行为传到给物品,假设你的物品很难被刻画,那么可以借助用户画像去刻画物品{ A物品:年轻女孩子喜欢,访问次数上千次的商品,文艺青年,职场},这类的表征可以赋予对应的权重。

通过建立用户画像和物品画像,就可以做推荐了。用户A偏好 { 旅游:,科技:,文化:,爱情:},用户B{ 旅游:,科技:,文化:,爱情:}. 当有一部电影特征时{旅游:,科技:,文化:,爱情:} 时,你会更推荐谁看这部电影呢?

[ 相关方法:基于内容推荐,基于用户内容相似度协同推荐]

_物-物_

如果知道某个用户喜欢A物品,又知道和A物品相似的物品有B,C,D。那么,给这个用户推荐B,C,D 的话,这个用户大概率会喜欢。物品和物品的相似度可以用物品间的相似距离得到,也可以通过规则计算(买了A物品的用户,大多都会买B)。物品和物品之间的关系还可以通过地理位置(地理上的距离)等信息联系起来。

[ 相关方法:基于物品协同算法,基于关联规则计算]

五、实际上可能更复杂一些

我们从上述的描述可以看到推荐算法在理解上并没有那么复杂。但实际做法中我们会稍微复杂一些。一般工业界将推荐系统分为两大块内容,召回和排序层。

召回层(上述说到的各种方式都可以作为召回层)可以采用上面提到的多种方式召回,这个阶段主要是快速定位用户可能喜欢的物品,将计算量级骤减下来。

排序层(LR、FM、FFM、 FNN、NFM、AFM、Wide & Deep、DeepFM)

通过两类画像和最终目标, 即用户画像和物品画像和设定的目标,采用分类学习算法对用户偏好的物品进行精排序,此过程在算力不足的情况下一般建立在召回层之上,具有很强的目标(CTR/CVR/留存...)导向。

无论是基于用户协同,基于物品协同还是基于排序算法推荐,都离不开用户画像和物品画像。历史的偏好对现在有影响,周围的人对你也有影响(这类似于通过和信用度好的人交友来提高自己的信用评级类似)。

由上面简单的介绍,你应该就能明白推荐系统的操作原理了。现在你来告诉我为什么空白女侠会被推荐坑吗?怎么避免呢?

总结推荐技术是智能,但它首先是_人工_的_智能_,依托于人,承载着人类赋予它的“使命”,_价值_。

END

更多职场/数据资讯关注公众号:POINT小数点数据

今日头条大数据杀熟

根据《规定》,算法推荐服务是指利用生成合成类、个性化推送类、排序精选类、检索过滤类、调度决策类等算法技术向用户提供信息。

从交通出行、网购订餐、旅行住宿到网络新闻,算法给消费者提供更精准的产品或讯息,提升选择效率。与此同时,算法滥用也导致了一些不良行为。比如:大数据杀熟、诱导沉迷、影响网络舆论等。

根据北京消费者协会1日发布的互联网消费大数据“杀熟”问题调查结果,有八成多()受访者有过被大数据“杀熟”的经历,网络购物中的大数据“杀熟”问题最多。八成多受访者认为大数据“杀熟”体现为同一时间不同用户购买相同商品或服务的价格不同。

记者查阅黑猫平台,关于“大数据杀熟”的投诉多达2246条,从滴滴平台,同时同地打同类型车到同一目的地但价格不一;到饿了么平台,同一商家不同会员无门槛红包金额不同等,价格歧视现象不一而足。

今日头条大数据杀熟

在大数据里,算法的概念一直是逃不掉的。算法好不好,往往意味着很多人都能对网易云音乐的歌单推荐和今日头条的猜你喜欢评论上一两嘴。但是能被用户感知到的算法,其实已经算是比较接地气的算法了吧,且不说一些金融业的风控算法(虽然很多也很傻哔)高深到常人无法想象,但其实很多日常应用场景下的算法,普通用户是几乎无感知的。

我们评价一个产品的“推荐力”的好坏,会用算法来说事儿,觉得推荐“对味儿”了就是好的算法,可人的喜好又不是一成不变的,就算是一个活生生的人对你的喜好做了解也要相处上一阵子,那靠冰冷的机器来“猜”你喜欢,岂不是难上加难,「不准」则该是常态了?

我倒是觉得算法好不好,不一定看码算法的人的能力屌不屌,而是背后的运算力和产品的设计力。运算力意味着有多少样本值得去学习,有多少脏数据可以刨开减少误导,有多少机器可以做到实时性高性能的给出即时结果。而产品力,则意味着一个(群)产品经理的“良心”和“智商”,这里打引号是为了不得罪这个群体。

抱歉,评论功能暂时关闭!