技术解读Twitter新秩序:时间线的秘密
更多深度文章,请关注云计算频道:https://yq.aliyun.com/cloud
作者介绍:WILL OREMUS,Will Oremus是Slate的资深技术作家
作者邮箱:[email protected]
作者博客:http://www.slate.com/authors.will_oremus.html
作者twitter:[https://twitter.com/WillOremus](https://twitter.com/WillOremus
推特的新秩序:时间线的秘密
变革中拯救危机—重塑民间话语
当你打开推特时你能看见什么?直到一年前,答案都是简单明了的。多数情况下,你会看见你关注的每一个人的微博。这些微博用时间顺序排序,最新发布的微博在最顶端。
2016年2月,BuzzFeed 泄露了一条消息:推特要做出一个改变世界的举动。业内人士称公司正在引进“算法时间线”。它意味着推特中传统的时间先后发布顺序将不复存在,取而代之的是采用一个决定你打开应用程序时看到哪些微博的复杂的、不透明的软件程序。
这听起来是不很道德的,更糟糕的是,它就像上推特的那些酷小孩们刻意避开的又老又主流社交网络Facebook。这些做法令老用户感到十分反感,他们将愤慨用“撕裂推特”这个激进的标签传达出来。然而于此同时,少数技术人员、投资者、逆向投资者专家用正面的预测进行辩护。他们认为这种新的“算法”正在改变推特的命运并使其加入社交媒体巨头之列的必需品。
然而有趣的是:当推特宣布这个新的举动之后什么都没有发生。如此看来,对于普通的用户,这个算法目前为止的影响小到不值得一提。人们愤怒过后,也仅仅只有不到2%的用户选择退出算法的时间表。
然而,推特内部结构发生变化的深度远超过外人的想象,在对于公司和国家发展十分关键的时刻,这个算法正在悄然重塑着推特企业本身和用户的经历体验。包括拥有两千五百万(推特)粉丝的美国总统在内,媒体必须搞清楚有一些社会活动家是站在他的对立面上的。
在文本中,推特在推出新算法一年以来首次提供了算法的运作方式。我们可以很直观地看出,新的时间线确实使软件提供的服务更加人性化,它会使你看到更多来自经常联系的人和更加受欢迎的推送,确保那些受欢迎的微博更加广泛地被看见,使他们像病毒传播一样大规模、大范围地传播开来。
(推特)公司表明,为了吸引新用户并维系老用户,在推特商业的危机时刻,这种“算法时间线”极度增加了每月活跃用户、印象数、花费的(推特上)阅览时间等关键指标。这些成果虽尚未扭转公司的整体低迷状况,但是也在黑暗之中提供了一丝希望,尤其因为推特开始挖掘了算法的潜能。
然而你看到的微博数量还是平衡且绝对的,隐藏在背后的(算法)计算结果会影响到我们。随着推特上的社会结构逐渐紧缩。这种算法确实存在着绝缘站在对立面上的人的观点和想法的风险,而这种现象在Facebook上已经出现,直接造成美国选民的两极分化和社会媒体日趋巴尔干化的严重后果。
Facebook已经成为2016年美国总统大选制造虚假煽动性消息和污染政治新闻的众失之的,原因是它不但受众面更广泛,而且采用的算法也把它推进了这个陷阱之中。然而今天,推特也扮演着和Facebook当年一样的角色,况且,伴随着世界上最强大的人物每天通过微博制定国家政策,推特的影响力与日俱增。
现在推特面临的一个问题是:服务器是否能够兼顾全球新闻播报和轶事杂谈以恢复企业的根基?而我们作为旁观者,需要提出一个不同的问题:我们真的希望推特成功吗?
尽管“算法时间线”依然在运作,推特拒绝和我们分享这种算法对关键指标带来影响的重要信息。这种沉默表明尽管有一定的积极效果,但是还不足以留住那些不够坚定的投资者。截至2016年第四季度的最新盈利报告显示,积极用户和参与度呈现平稳增长。首席执行官杰克·多尔西(Jack Dorsey)认为归功于“算法时间线”,然而公司的收入平平,股价下跌。
推特的工程师不断探索这种服务如何吸引用户,通过软件测试对Twitter帐户进行微调,然后研究其对行为的影响。产品经理Deepak Rao说:“我们正在做的一切,就是在监督它是否工作。 “我们每个月都会进行数十次实验。”
我向Rao深入地了解了整个测验的过程Twitter算法背后的精髓。在我们的谈话中,Rao介绍了一个尚处于初级阶段的系统,这个系统已经比大多数用户意识到的要复杂得多。它设计得是如此的个性化以至于没有两个用户会以相同的方式体验它,但工程师仍然十分努力做到确保每次打开应用程序时都不会显示相同的人的微博。
该公司告诉我,数据显示,该算法已经提升了用户所关注的每个主要尺度的参与度。人们不仅花费更多的时间阅读,收藏和转发,也会更多的去主动发微博。这是一个让推特·自己的产品经理都感到惊讶的结果。Rao告诉我,“算法在去年生效之后,”每一个可能的参与和关注度都会上升“。尽管发言人称之为“我们最有影响力的产品发布之一”,但是究竟上升了多少,公司拒绝透露。
通过该算法实现的实验的结果使得推特比以前更熟悉其用户,例如最近评估指标整合数目是多少,或者面对同一个人发的连续多个微博做何反应。该公司已经尝试了新功能,可以根据您的口味对特定主题或主题标签进行推送。如果推特的排名系统显示您有可能想要看到一个不经常关注的人的微博,它甚至会尝试向您展示。 推特现在可以通过用户的行为表现和与体验与不同的时间顺序排列的影响进行比较。饶说 :“我们的算法几乎每周甚至每日都在变化。”
从投资者的角度来看这些做法还没有大的改观。公司的好消息是,如果管理得当,机器学习算法可以随着时间的推移而大大改善。同样,用户参与的上涨也有一种增长势头,因为参与会引发更广泛的参与。尽管算法带来的影响公司没有大张旗鼓的宣扬,但是一定会吸引并维系很多新的客户。最终,我们相信推特的前景会更加光明。
推特有时被保守的人指责太过于激进轻率。事实上,公司对核心产品的处理已经非常谨慎了。前任首席执行官迪克·科斯多洛(Dick Costolo)在2015年推出的产品并不是像许多人担心的那样失败了,而是人们太过于杞人忧天。业务演变虽然瞬息万变,但用户的体验参与仍停滞不前。他离开的时候“时间线”和功能与发展与2010年Costolo上任的时候几乎没有任何突破。
他的继任者多西在2015年正式批准运行时间轴算法,算法的成功或失败责任都由他承担。但是,在公司内部开发和倡导这一想法的人员包括前CTO Adam Messinger,前工程负责人Alex Roetter,以及前任产品总监Kevin Weil。
为了理解为什么大家将算法看成对Twitter的未来至关重要,它有助于回顾一下它之前的内容。反向时间序列的想法来源于网站的起源,即通过短信向朋友和熟人发布简短的实时“状态更新”的方式。但是,多年来,Twitter变得更像一个汇集新闻、观点和笑话公共平台的。随着用户及关注的好友数量的增长,按时间先后排序的限制变得明显。你登录后会发现很多东西与自己无关,而你真正关注的东西却需要繁琐的滚动来发掘。对于普通互联网用户来说,这是麻烦且不值得的。
这引发了关于推特最具有持续讨论意义的问题:它无法维持大部分新用户注册。 2012年12月,推特宣布每月活跃用户达到2亿。 首席执行官Costolo预测Twitter将在一年内达到4亿。相反,该公司于2013年年底提交上市,每月只有2.18亿活跃用户。三年多以后,这个活跃用户数仍然只有3.19亿,增幅已经放缓了。虽然这个对比并不完美,但该公司大在Facebook起步的阶段就高歌猛进。两个服务器之间的关键区别在于:Facebook的新闻靠算法,该公司早期实施并且一直在大力改进。而现在,T推特的算法只会影响到你打开微博的最顶端的置顶消息,Facebook会根据每个用户的习惯,品味和关系进行个性化设置,用高度复杂的公式自动排序每个帖子。
推特的一部分问题在于它一直在努力界定“时间线”的精确目的。Rao先生告诉我,自从新的算法启动以来,这一点已经变得更加清晰了,公司现在将“时间线”的功能看作“帮助用户随时了解世界各地的情况”。换句话说,Twitter不再是一个社交网络,而是一个实时的、个性化的新闻服务平台。由于没有人类编辑,推特的算法就决定了每次打开它的时候会看见哪些微博推送。
在推特现在正努力解决的所有遗留问题当中 ,“算法”是最引人注目的。但是什么是推特算法,它是如何工作的?简单的说,它是一个根据各种标准队微博进行分类的软件程序,然后在用户打开APP时“算法”挑选出少数微博显示在每个用户时间线的顶部。时间线的其余部分仍然是逆时间顺序的,至少现在是这样。对于好奇和困惑的你们,这里有篇“长篇大论 ”- 算法工作方式公开初探。
一旦你打开推特,它很快收集和评估每个你所关注的人最新的微博,并快速计算出每个人的相关得分。这个分数是基于非常广泛的因素,具体到你点赞和转发的数量和你最近发微博的人的联系频度。
同时,该算法也可以评估各种其他变量,包括你离开网站多久,关注了多少人以及个人发微博习惯,以确定这些分数将如何影响你所看到的内容(所有这些都发生在后台。)
这个算法的输出会以不同的形式展示在你的信息源中,而“排序时间线”和“万一你错过了”是最值得注意的功能点。正如我们知道的那样,“排序的时间线”应该预示着Twitter的结束。无论是Twitter的网站还是app,只要你打开了一段时间,你的信息源的顶部看起来和一年前的一样,推文以逆时间顺序的形式展现出来。但是当你仔细检查这些推文的时间戳之后,你会发现,它们都并不是你想像的那些最近的消息。最顶部的推文可能是10-15分钟前的,而向下滚动一些推文之后,你可能看到一些一个小时以前的推文。这些都是twitter的算法选出的先展示的信息。
一位发言人告诉我说推特虽然不会透露排名中涉及到的所有因素但确实指出了其中的一些。他们包括:
* 一条微博的整体参与度,包括转发,点击次数,收藏以及阅读时间
相同微博作者发表的其他微博的参与度状况
最近发布的微博
你和微博的作者互动的频率
你花了多少时间阅读作者的微博,即使你不参与互动。
微博包含什么样的附件(例如链接,图像,视频,无)以及你倾向于使用什么样的附件。
时间线排名部分中出现的微博由你上次在Twitter上活动以来错过的微博的一小部分组成。所以,如果你继续滚动屏幕,很快就会发现一个发布比之前屏幕顶端还接近于此时此刻的微博出现。从那时起,你的推特恢复正常,会显示出按照时间顺序排列的人的每一个推文。当你刷新你的时间轴时,排名的微博将无法观看。
在Twitter力挽狂澜的同时,它已经推出了多种现场直播的产品。为了推动其用户不断增长,对其骚扰政策进行了彻底改革。并清理其公共空间中更为有害和滥用的话语 - 赋予算法更多的控用户制信息源功能将是一个很合逻辑的下一步。这是有风险的。但是对于Twitter来说,在这个时刻,不作为的风险可能会更大。
个性化是解决twitter业务困境的方案,而这一方案却不能解决媒体生态系统的困境,因为在一些人看来,一些媒体已经失去了信任,它的全部信息都已经被看作“假消息”。而持有相反观点的人认为用户的参与并不是解决问题的关键,原因可能是因为人性变迁太快。
另一方面, 福克斯新闻作为推特新闻来源的主要替代品 (包括CNN,Facebook等在内)都有自己的信誉危机,部分原因是各自业务和受众模式的不正当。如果Twitter是正当的,它的用户至少在他们的信息源中至少看到一些观点的多样性,而且如果认真将推特看成一个获取信息的平台,而不是仅仅为了娱乐的话。那么我们会很明智地得到一个更自动化的Twitter,否则我们会永远失去它。
以上为译文
本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。
文章原标题《Twitter’s New Order》,作者:Will Oremus,译者:爱小乖,审校:6816816151。
文章为简译,更为详细的内容,请查看原文