第168章 横跨20年的技术交接 美娱:从创立油管到文娱教父
第168章 横跨20年的技术交接
他举了一个经典的例子:“比如,一个通常在美国加州登录的帐户,突然在5分钟內於东欧某地登录,並试图向一个没有任何交易歷史的新帐户发起一笔高额转帐”—一这本身就构成了一个高风险的行为模式。这套系统的核心能力,就是从巨大的噪声中,精准地提取出有价值的信號。”
“我把这种从paypal带来的、从行为数据中挖掘模式的思路,迁移到了youtube。
贾韦德的声音带著一丝自豪:“其他的视频网站,用户找到內容主要靠搜索框和人工编辑的分类目录。而youtube的思路是:我们需要一个系统,能自动地、
智能地识別出用户群体自发形成的兴趣模式”,並据此进行推荐和gg匹配。”
他具体阐述了两种核心模式:“模式一:协同兴趣。
这是最基础也最强大的模式。如果用户a和用户b都观看了视频x和视频y,並且表现出相似的观看完成度、点讚等行为,那么当用户a隨后观看了视频z並表现出浓厚兴趣时,系统就可以非常有信心地推断,用户b也有很高的概率对z感兴趣。
这本质上与paypal识別具有相似交易行为的帐户群组以发现欺诈团伙”的思路一脉相承,只是目的从识別风险变成了发现兴趣。”
“模式二:內容关联链。
通过分析数以亿计的用户观看行为序列,系统可以发现:看完视频a(比如《狐狸叫》)的人,有显著比例会接著观看视频b(比如另一个动物搞笑视频)。
基於海量数据,系统可以自动构建一个巨大的、动態更新的內容关联网络,o
这比单纯依赖上传者打上的关键词標籤更智能、更精准,因为它基於最真实、最直接的人类行为数据,反映了內容之间某种內在的、或许创作者自己都未曾察觉的联繫。”
贾韦德的阐述深入浅出,逻辑清晰,將复杂的算法思想用易於理解的例子表达出来。
他並没有提及西蒙最初对“用户行为数据”价值的极致敏感和战略级重视(这其实是youtube最核心的竞爭优势之一),但科林·黄作为谷歌的顶尖工程师,立刻展现出了他深厚的专业功底和举一反三的敏锐洞察力。
科林不仅完全听懂了,他的眼睛瞬间亮了起来,几乎是立刻从谷歌adsense的角度,提出了几个一针见血、极具建设性的优化建议:“太精彩了,贾韦德!这种基於协同行为和序列模式的挖掘,確实比单纯的关键词匹配更底层、更强大!”
他语速加快,显得非常兴奋:“如果从这个角度看,youtube的gg系统其实还有巨大的优化空间!比如,是否可以引入更细粒度的兴趣衰减因子”?
一个用户三个月前对吉他教程”的兴趣,和昨天刚搜索了吉他教程”的兴趣,权重应该完全不同。”
“另外,是否可以考虑跨模式关联”?比如,一个用户频繁观看高端数码產品评测”视频,但他可能从未给这些视频打过標籤。然而,他同时又是极限运动”视频的忠实观眾。
系统能否自动识別出这种隱藏的关联,並向这位用户推送搭载顶级防抖相机、適合极限运动场景拍摄的数码產品gg?这远比推送普通的数码產品gg更精准!”
本章未完,点击下一页继续阅读。(1 / 2)