腾讯内容平台系统的架构实践

andonliu

2018-10-06

腾讯内容平台系统的架构实践

作者 | 孙子荀（授权）

编辑 | 小智

随着云结合微服务架构切实的提高了生产效率；深度学习不断深入内容处理的各个领域促进生产力的发展。在消息系统，数据仓库，计算框架，存储系统等基础架构层建设逐步提升的基础上，大型互联网公司进一步提出了业务基础设施的需求。在基础架构和上层业务之间急需一个中台系统来承载。中台系统把业务层同性的算法能力，服务能力，业务能力高度集成，有效组织，动态规划。更好的帮助上层业务。

工程篇

前身

在 15 年的时候，内容平台（承载腾讯包括手 Q 等内容业务等的内容中台）最初来源于 QQ 公众号系统（公众号系统承载了包括 QQ 服务号，订阅号的关注关系，红包等大型活动的推送，订阅号消息下发，素材内容管理等）。当时公众号系统有几个子系统：资料子系统，消息子系统，关系链子系统和素材子系统。一个号主如果需要把自己的内容给粉丝，需要经过这 4 个子系统。

腾讯内容平台系统的架构实践

（蓝色部分）

（子系统就是有独立的存储逻辑数据流接口体系。概念来自 Systems Analysis & Design 的 DFD sub-system）

在最简单的粉丝发送的场景，首先使用素材系统管理群发任务的内容，然后用关系链子系统拉取粉丝数据，通过消息子系统创建群发任务进行消息发送，过程中需要和资料子系统交互获得各自参数。

在 15 年下半年，内容战略升级，除了来自平台的号主发送内容，我们还有大量来自其他外部合作平台。他们通过公司其他平台对接进来，当时我们复用这套基于消息发送的场景，让对方创建群发任务，内容进入素材库进行处理，然后就可以触达粉丝了。

但是后来整个业务形态从订阅变成了 Feeds 流，原来的粉丝关系变成了推荐，随着内容处理服务的越来越多，内容量的不断增加，老的这套系统就无法承载了。于是我们需要改造老的系统。

我们希望是有一套统一的多源内容库，在良好的扩展性框架下，各类型服务通过实现预定义接口，完成对内容的加工处理，人机结合，输出给订阅方。

内容的处理服务包括了内容安全质量（质量评价，暴力色情，低俗，标题党，错别字等），内容建模特征（分类，主题，标签等），内容理解生成（封面图，摘要，结构化，剪辑等）。

腾讯内容平台系统的架构实践

（内容平台顶层图）

文本介绍一下其中主要的架构部分工作。

存储

物理存储

原来存号主发送内容的素材系统就变成了内容平台的最早雏形，素材还是通过 MySql 来存储用户发送的内容，所有的文本和 html 生成的页面样式也存储在一张表中，单表不堪重负，进行了 partition Sql 执行优化等工作，但是无济于事。在进入内容时代我们需要有一个性能更高的存储系统来支持。当时的技术选项的考虑基于过去素材系统的痛点和未来需要支持的规模。

我们需要我们的存储系统能支持任意的字段扩展，Schema Free。便于扩展根据列的定位效率需要在 O(1)
存储系统一定要支持永久存储，同时能满足基础的并发读，虽然不要求像 Redis 一样上万 /s ，至少也要是千级别。
需要支持多机水平扩展。
公司有团队成熟运维。

当时考虑过 Mongodb 和 Hbase ，Cassandra 以及其他 KV 存储。

Mongodb 的好处很多。但是他的高效率访问带来的是内存资源的极大开销。冷热不均的分配，不可控的并发写入和副本存储都使得他无法承载未来几年更大的发展。

其他的就是 Hbase ，当初能预料到的是如果我们需要把 Hbase 当作 KV 对在线服务，是无法承受的，但是我们可以在其之上增加一个 KV 的 cache 解决这个问题，剩下的事情就是我们去打造一个中间层支持 Hbase 和内存 KV 的数据同步。

Hbase 的 row key + column family + column qualifier + timestamp + value 是 HFile 中数据排列依据。HFile 据此，对数据的索引到 data block 级别，而不是行级别。

另外当初还考虑过一个方案就是基于 LevelDB 的全新内容中间件方案，这样能做到内存 KV 和永久存储合二为一，可是在那个时候的环境下，我们就算之前做过初级版本，也无法快速开发来，但是 Hbase 的好处是他可以支撑一段时间的 KV 访问，未来扛不住再优化上增加 Cache，事实上后来我们也是这样走的。

关于存储这里的工作我们后面还会提到，我们怎么进化到存储中间件 RCS。存储有了接下来就是如何设计存储层的数据模型。

数据建模

在设计存储模型的时候，在 16 年的时候，确认的事情有几个：

内容处理的肯定会有大量的模块并行的需要对内容进行处理加工；
这些模块有共性的属性获取，也有特化的属性获取需求。
模块自身彼此会产生输出给其他模块用。

我们的目标：

在架构上，打造统一存储来托管所有模块需要读写存储的场景，这样每个模块的同学统一存储。无论是业务同学的业务逻辑字段。还是算法同学的模型业务输出 or 模型特征输出。开发人员需要更加关注于策略本身，存储上的事情统一收拢提供 API 就行。

在表结构上：

如果第 1 点做到了，那么我们未来可以基于这个宽表进行天然的单表检索，单表基础内容特征挖掘。甚至是算法实验字段都可以统一在一张宽表里。

于是我们做了几个重要的设计：

1、推广新的唯一 ID 体系，废除公众号的自增 articleID，ID 能支持以下特征：

ID 体系 = 预留字段 + 时间 + 自增 ID + 内容类型 + 业务来源

于是有了 rowkey，拿到任意一个 rowkey 我们至少能第一眼知道来源大概的时间和类型，便于路由。

2、规范列名，所有列名分为【状态类】和【内容特征类】，前者用于标记状态，处理情况。后者用于保存内容的基础元信息，模块处理过程中产生的结果信息，中间信息。当时列的结构约定的格式是：

列名 = 列属性（状态类 or 业务类 or 模型类） + 字段属主 + 字段描述

腾讯内容平台系统的架构实践

状态类

腾讯内容平台系统的架构实践

模型类

当时所不能预估的事情，现在思考有几点：

业务字段可能会根据不同的业务场景产生「多态」，这个在语言中很好解决的问题，落到存储层会有不少问题。业务场景之间，多个业务之间对同一个内容的标题和封面图都可能有自己的子类，需要增加场景概念。
当初假设的是执行是树或者图这样的深度遍历 DAG，不会产生回路重遍历，事实上居然真的出现了这种场景。
随着字段的成倍扩张字段，列名一直没有很好的规划收拢分配，造成开发人员组织架构复杂之后不可控，需要有个合理的收拢分配方式。

我们在这里的数据模型使用了宽表格式，相比复杂的 EVA 存储，我们觉得宽表更加利于数据汇总统计。后续 RCS 部分会再次介绍。

宽表事务性更好。HBase 对一行的写入（Put）是有事务原子性的，一行的所有列要么全部写入成功，要么全部没有写入。但是多行的更新之间没有事务性保证。

线上当前真实的情况是，单文章表已经有超过 500 多稀疏 column ，并且随和业务场景增加不断增加。测试数据验证并不会随着 column 增加而影响查找开销。

写在最后

感谢过去曾为这套系统付出的工程开发同学 alexcxu carrickliu ericxjiang guangyupeng jianxunzou jamescxchen mamoyang maplechang marcopeng taoyang tedqian xiaoccwang yuliangshen 以及能力模型同学 chenchwang lshzhang haodeye leafxin louislwang loopingwang jordanyu tiantianfan yaoyaoyu yurunshen vincentqliu 还有 AI 特征工程师 dongdong 和勇哥。

作者介绍

孙子荀，（腾讯/SNG内容平台部/平台产品中心/算法平台和后台一组组长），11 年在百度从事高性能算法方面的工作。12 年加入腾讯，15 年开始负责QQ 公众号平台和内容中心后台，并和团队从无到有一起搭建了QQ的内容平台。16 年开始从事内容处理能力的算法研究和落地工作。

架构素材

安科网

腾讯内容平台系统的架构实践

andonliu

工程篇

写在最后

andonliu

相关推荐

去一家小公司从0到1搭建后端架构，做个总结！

软件架构设计分层模型和构图思考

细数软件架构中的解耦

高可用架构怎么选？常见多活建设这么一对比就懂了

服务网格如何实现微服务网络

如何用图形分析来可视化微服务架构

程序员也需了解的主流云计算网络架构

13张图彻底搞懂分布式系统服务注册与发现原理

打工人，支撑亿级高并发的系统长啥样?

13张IT架构图！从数字化转型，到数据架构

TCP接入层的负载均衡、高可用、扩展性架构

亚马逊：我们提取了BERT的一个最优子架构，CPU速度升7倍

APICloud多端架构与开发实践干货分享

系统从初期到支撑亿级流量，都经历了哪些架构上的演变？

程序员必知的几种软件架构模式

科技趋势年末盘点：德勤2020技术趋势报告解读

提效降本，您不可不知道的云架构秘诀

Menger:大规模分布式强化学习架构

服务网格和API网关在微服务架构中的作用

这批安卓应用或在2022年停止工作

andonliu