腾讯犀牛鸟精英人才培养计划课题介绍四—数据挖掘&数据库存储

腾讯犀牛鸟精英人才培养计划课题介绍四—数据挖掘&数据库存储

腾讯犀牛鸟精英人才培养计划是一项面向学生的校企联合培养方案,项目覆盖机器学习、量子计算、计算机视觉、语音技术、自然语言处理等产学研热点方向,入选学生将到腾讯开展科研访问,基于真实产业问题,借助腾讯海量数据、专家指导等资源,验证学术理论,加速成果应用转化,全面提升自身科研能力和综合素质。

2018年度申请时间已经过半,小伙伴们要抓紧哦~

今年共有8个课题方向,54个子课题供大家选择,总有一款适合你!

快来看看最后三个课题方向吧

数据挖掘及相关应用研究

6.1

强化学习技术在广告推荐系统

中的应用

研究如何将强化学习技术应用到广告推荐系统中,设计强化学习算法,探索并挖掘用户的潜在兴趣,结合点击率预估,学习最优的在线推荐策略,最大化推荐平台收益。

导师简介

腾讯高级研究员。香港科技大学计算机科学与工程系博士,主要研究方向为迁移学习、推荐系统、机器学习等。博士期间多次在KDD、AAAI 等会议和期刊上发表论文,多次担任IJCAI、WWW、TKDE 等国际会议和期刊的审稿人。

6.2

社交网络结构挖掘

研究微信社交网络的结构与属性特征,包括用户在社交网络中的特征、用户之间的相似性以及用户影响力等方面。技术领域涉及机器学习、复杂网络、网络表达学习(network representation learning)、用户影响力建模、影响力最大化(influence maximization)等。

导师简介

腾讯专家级研究员,华南理工大学数学系硕士。毕业后入职腾讯,一直从事数据挖掘相关工作。目前主要负责微信社交数据挖掘相关工作、微信社交Lookalike、微信社会传播的分析建模等工作,曾主导APP 社交推荐、好友用户圈子挖掘画像建设等项目。曾获邀在InfoQ 等行业会议做主题报告。

6.3

海量用户婚恋育儿状态预测研究

基于海量数据的用户婚恋状态挖掘,属于典型的用户数据建模任务。任务涉及训练样本筛选、特征工程及模型优化等典型机器学习任务。如何利用腾讯系海量用户行为数据,挖掘适用于婚恋状态分类的特征组合及其表示,选择能高效处理百万级维度特征的模型算法,是本课题的主要挑战。

导师简介

新加坡国立大学机器学习方向博士。曾在美国杜克大学从事博士后研究,通用公司研究员。现为腾讯高级研究员。发表过30+篇国际会议与期刊论文。主要研究兴趣为机器学习、贝叶斯统计模型、压缩感知。

6.4

游戏视频内容的摘要生成

个性化内容推荐是现在互联网领域的热门应用,其中,视频类资讯内容非常受关注,对视频类资讯进行信息抽取和加工也一直是模式识别、人工智能的重要研究方向。在游戏视频领域,针对每天生成的海量不同类型的游戏视频,如何快速的抽取有价值信息,进行视频的标题、摘要生成、关键内容捕捉等应用,进而在进行个性化内容推荐时提高用户对视频类内容的点击意愿和粘性,是本课题主要关注的问题。

导师简介

博士毕业于中国科学技术大学基础数学专业。曾在华为技术有限公司负责数据挖掘技术在电信领域的应用研究,包括CRM、个性化推荐、文本挖掘等领域。目前研究游戏领域的数据挖掘技术与应用,通过用户画像分析、个性化服务等为用户提供更好的服务体验,为业务提供更有价值的运营支撑。

6.5

基于社交数据的页面质量分析

基于微信的社交传播数据构建新的PeopleRank、TrustRank 等模型来对页面质量分析,进而改善搜索效果。

导师简介

中国科学院计算技术研究所毕业,当前负责微信搜索和推荐的技术研发和产品应用,在ACL、AAAI 等顶会上发表过多篇文章。

6.6

新闻热点挖掘和热度预测

新闻热点发现和热点追踪是推荐系统中的重要组成部分,我们需要在实时新闻数据中挖掘热点话题、突发事件,并希望在热点并未完全爆发时及时发现潜在的热点新闻,结合微信的社交传播数据,在事件的发展过程中及时追踪事件的最新进展,最终形成事件发展的关键时间序列。

导师简介

美国史蒂文斯理工学院博士。当前负责微信“看一看”基础数据的建设,包括优质文章、低质文章、新闻热点挖掘等方向。

6.7

公众号权威度研究

该课题将围绕两方面展开,一方面基于微信的社交数据和用户行为数据,挖掘出各领域精英人群,以精英人群的阅读行为来判定公众号的权威度(包括内容深度等方面);另一方面,通过NLP 技术从文本方面判定文章的权威度。将高权威度内容推荐给精英人群阅读,提升“看一看”在精英人群中的口碑,引导公众号生态创作更多优质内容。

6.8

小程序用户体验研究

随着小程序生态的日渐繁荣,大量的小程序开发者涌入,但是开发出来的小程序质量良莠不齐。本课题将从小程序的代码和用户使用行为两方面入手,建立模型判定小程序的质量。具体而言,可基于行为序列建模判定用户使用流畅度、是否存在欺诈、是否为恶意蹭流量等;综合序列模型和NLP 技术,判定小程序内容和标题是否相符。

6.7~6.8 导师简介

北京邮电大学硕士。当前负责微信“搜一搜”各垂直搜索的技术,包括搜索排序、搜索满意度、意图识别、公众号画像、小程序画像、搜索growth 等方向。同时参与微信“看一看”基础数据的建设,包括优质文章、低质文章、新闻热点挖掘等方向。

6.9

游戏垂直领域大规模知识图谱

的构建

抽取大规模,高质量的结构化数据一直以来是构建知识谱图的难点之一。传统的文本信息抽取技术(Text Information Extraction)能够帮助我们依照知识图谱框架(Schema)从大规模非结构化文本中抽取结构化信息。然而,这种方法限制了实体(Entity)、关系(Relation)等的覆盖率。基于以上原因,开放式信息抽取技术(Open Information Extraction)逐渐成为研究重点,目标是从海量、冗余、异构、不规范、含有大量噪声的大规模的文本中抽取开放类别的实体、关系、事件等多层次语义单元信息。我们的研究重点主要是利用开放式信息抽取技术,从大规模的非结构化数据中抽取高质量的、规范的、与游戏相关的三元组, 从而构建游戏垂直领域的大规模知识图谱。

导师简介

本科毕业于吉林大学,硕士、博士就读于意大利特兰托大学。博士期间的主要研究课题和方向为通过游戏化(Gamification, Game with a purpose)的方法校验大规模知识图谱,以及大规模知识图谱及语言库(Linguistic resource,Ontology)的构建。目前的工作方向是构建游戏垂直领域的知识图谱,并尝试寻找更多的落地应用。

数据库存储技术研究

7.1

历史数据库的存储优化

历史数据是当前数据库的过往轨迹。高效追溯数据的变迁、查询历史值等,尤其在金融行业具有很大意义,如监管部门要求提供某个账号过去五年的账户金额变化情况,这就需要快速地追溯历史数据。历史数据库、时态数据库将在大数据的背景下更好实现数据的价值。因此对历史数据库、时态数据库形成的巨量数据的存储与管理展开研究很有前景和意义。

导师简介

中国科学技术大学软件工程硕士,中国人民大学信息学院特聘工程硕士企业导师,国家级高级工程师,中国数据库技术大会专家顾问团成员。从事数据库引擎研发、数据库架构设计、数据库技术管理等工作20 年。先后在北京大金仓、Oracle 公司、华胜天成等公司任职,现任腾讯专家工程师,从事分布式数据库TDSQL 的研发工作,曾获公司技术突破银奖。出版数据库相关著述两部。申请专利十余项。获北京市科技进步一等奖。

网络研究

8.1

可扩展和高可靠的RDMA 网络研究

高性能计算、分布式应用和云存储等业务的兴起,给云网络提出了更高带宽和更低延时的需求。基于以太网的RDMA(RoCEv2)协议可以很好的满足这些需求。然而,RDMA 在超大规模的以太网环境下部署还存在诸多问题。本课题将基于腾讯RDMA 网络环境,研究并优化RDMA 流量控制、拥塞控制和QoS 等机制,为构建可扩展和高可靠的RDMA 网络打下坚实基础。

导师简介

中科院计算所博士,主要研究方向为数据中心网络和可重构计算。曾就职于微软亚洲研究院,从事DCN、NFV、RDMA 和SmartNIC 等领域的研究和研发工作。曾在微软美国总部工作,基于SmartNIC 从事微软云网络加速系统设计。目前在腾讯负责智能网卡研发、云网络系统规划和网络研究等工作。博士和工作期间,在网络领域顶级国际会议(SIGCOMM、CoNEXT、INFOCOM、ATC 和ToN 等)上发表多篇论文。

8.2

大规模社交网络上的分布式算法

腾讯微信和QQ 的活跃用户数已分别达到十亿和八亿多,用户的链接状况、交流信息更加丰富多样。传统的在如此超大的图上常常无法支持有效的数据处理。在本课题中,我们将探讨对超大图上的分布式算法和流算法的设计问题,并有机会对成功的算法在实际数据中进行测试及运行。

导师简介

腾讯杰出科学家,曾就读及工作于复旦大学(本科),清华大学(硕士),普林斯顿大学计算机系(博士),加州理工大学(博士后),香港中文大学(助理教授,副教授)。现担任Theoretical Computer Science 及International Journal of Quantum Information 杂志编委。主要研究方向为量子和经典的随机算法,复杂性分析,分布式协议设计,以及上述理论在大规模数据处理,机器学习和人工智能基础研究中的应用。

腾讯犀牛鸟精英人才培养计划课题介绍四—数据挖掘&数据库存储

具体了解了八个方向,你的心中是不是已经有了选择呢?

快抓紧时间申请吧!

相关推荐