今日头条技术架构分析
产品类型上,善用自己的优势,上述中也能看见,各种类型,不同定位的产品,都会有自己的受众群体。虽然老牌门户网站转型的占多数,但是也有很多新型的产品例如,“趣头条”、“今日头条”、“懂车帝”等,善用自己的优势,打造出不错的产品。
内容监管上,开发商需时刻关注着国家政策,严格遵守,加强内容审查的力度,严把内容大关。
腾讯云今日头条
- 自动选择候选文章
- 根据用户站内外动作
头条的频道,在技术侧划分的包括分类频道、兴趣标签频道、关键词频道、文本分析等,这些都分成相对独立的开发团队。目前已经有300+个分类器,仍在不断增加新的用户模型,原来的用户模型不用撤消,仍然发挥作用。
在还没有推出头条号时,内容主要是抓取其它平台的文章,然后去重,一年几百万级,并不太大。主要是用户动作日志收集,兴趣收集,用户模型收集。
资讯App的技术指标,比如屏幕滑动,用户是不是对一篇都看完,停留时间等都需要我们特别关注
腾讯云今日头条
在这些 App 中,最早于 2009 年上线的有 4 款,其中以“新浪新闻”为代表。随后 7 年内,数量都有缓慢上升,到了 2016 年,新闻资讯 App 数量激增,共有 69 款,涨幅超 2 倍。
根据以往数据表现,App Store 里上线的产品数量在 2016 年都会有一个较大的增长现象,是开发商们的黄金时期。
(大多数产品 icon 都是以红色、橙色醒目颜色为主)
成立于 1998 年的新浪网,算是最早那波的门户网站了。与移动端接轨的话,新浪网比同时期的腾讯、搜狐还要快上一步。
“新浪新闻”借助于老牌综合性门户网站整个产品矩阵的优势,将手机新浪网、新浪微博等产品打通,实现平台内容共享及个性化推荐,精选全网精彩内容。
腾讯云今日头条
当用户开始使用今日头条后,对用户动作的日志进行实时分析。使用的工具如下:
- Scribe
- Flume
- Kafka
我们对用户的兴趣进行挖掘,会对用户的每个动作进行学习。主要使用:
- Hadoop
- Storm
产生的用户模型数据和大部分架构一样,保存在MySQL/MongoDB(读写分离)以及Memcache/Redis中。
随着用户量的不断扩展大,用户模型处理的机器集群数量较大。2015年前为7000台左右。其中,用户推荐模型包括以下维度:
1 用户订阅
2 标签
3 部分文章打散推送
此时,需要每时每刻做推荐。
腾讯云今日头条
在这 300 款产品里,共有 58 款产品好评率 100% ,好评在 90%~100% 的产品 139 款,占比 51%。查看相关好评率较低的产品,发现用户吐槽主要围绕广告多、内容涉黄、排版有问题、字体不能调整等方面。
希望相关开发商能够以优化产品功能为首要目标,其次在不影响用户体验的情况下,适当获取收益。