如何成为数据科学家?数据科学业界大牛们倾囊相授
在大家的眼中,科学家的形象可能是一位表情严肃、着装单一、不修边幅、戴着一副厚重眼镜且天庭饱满,发际线无限上移的中老年理共男。但实际上,他们正式体面,幽默无比,可谓是集涵养和趣味于一身的真正撩妹达人!
那么现实中,你是否有见过真正的数据科学家呢?
数据科学家,一个大数据时代的新兴称号,被《哈佛商业评论》中被誉为“21世纪最性感的职业”,2015年,美国白宫首次设立数据科学家的岗位。
他们可能不发表学术论文,没有科研项目,也没有得过学术大奖,但在商业帝国里扮演着至关重要的角色。他们是技术驱动,没日没夜与数据打交道的匠人;他们是创意源泉,为业务出谋划策的参谋者;他们是幕后之王,未雨绸缪粮草先行。
在国内,CDA以寻找数据科学家活动,汇聚了一批真正称得上大佬的实战派先锋,无论是在商业领域摸爬滚打,还是在学术界科研探索,都硕果累累,名副其实。所谓前人栽树后人乘凉,他们为数据科学做出了模范般的躬先表率。CDA也授予其“荣誉数据科学家”称号。
荣誉数据科学家
九屠
曾就职于阿里巴巴·饿了么,集团首席数据架构师、P10科学家。负责饿了么、百度外卖的大数据技术统筹。
2014年加入百度,先后带团队建设为百度地图6大Place场景做数据分析,后专注于百度外卖大数据生态从0开始孵化并最终完善。自主研发涉及到数据采集3大平台、开放式ETL4件套、OLAP分析平台、Adhoc、大数据分布式调度、数据集市、数据仓库等,另外技术驱动数十个辅助业务分析角色的分析挖掘平台。为大数据研发打造离线、实时数据整套解决方案,目前构建并推广AI学习平台系统;在AI和大数据技术创新层面,作为发明型专利第一发明人拥有44项发明。
李御玺
国立台湾大学资讯工程博士,铭传大学资讯工程学系教授,铭传大学大数据研究中心主任,中华数据挖掘协会理事,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问,SAS-Taiwan顾问,CDA命题组负责人。在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。
服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、 第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如国税局等。
赵卫东
东南大学博士,复旦大学博士后,主要负责本科生和各类研究生大数据核心技术和商务数据分析等课程的教学。商务智能被评为上海市精品课程,获得2013年高等教育上海市教学成果奖二等奖。目前主要研究方向包括商务数据分析和大数据分析等。主持2项国家自然科学基金以及上海市浦江人才、企业合作课题等20多项项目。已在Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers等国内外刊物和学术会议发表论文90多篇。
出版著作《智能化的流程管理》、《数据挖掘实用案例分析》以及教材《商务智能(第四版)》、《机器学习》、译作《商务智能 数据分析的管理视角(第四版)》、《人机共生——洞察和规避数据分析中的机遇与误区》等10多部。获得上海市2015年上海市科技进步二等奖。
付波
博士,电子科技大学副教授,2009年获电子科技大学工学博士学位,2007-2008加拿大Univ. of Guelph的ARIS实验室访问学者。
多年从事模式识别、信号处理和机器学习相关工作,曾先后主持/参与国家自然科学基金、国家863及省市各项课题20余项。在包括IEEE Trans. IFS, SPL, Int. Jour. of PR, PRAI等国内外权威期刊、重要国际会议上发表论文30余篇,其中SCI检索20余篇。合作参与编写专著3部。获国家授权发明专利7项,省市科技进步奖2项。曾担任国家自然基金及多个期刊或会议的评审人和特约审稿人。目前,主要关注医疗健康大数据分析和产业化运用,近几年主持或合作医疗及人工智能相关科研项目400余万,并参与创办了2家科技公司。
阎志涛
Talkingdata,研发副总裁,负责企业数据治理,数据平台及客户精准营销等实务。
王学武
首席数据官。毕业于华中科技大学计算机专业。PRINCE2,PMP,CMMI评审员,IBM电子商务架构师,工信部项目管理工程师,工信部软件设计师。
具有12年的项目管理与技术研发经验,曾参与实施某航企多个核心的商业智能、数据仓库项目;曾作为该企业工程过程管理组的Lead,负责推进CMMI L3评审工作。目前专注于大数据、机器学习、自然语言处理、人工智能等创新技术的研究和在行业的应用。
薛松
美国佛罗里达大学管理学与经济学硕士,曾于美国微策略公司等多家企业担任数据科学家,现任某初创公司数据科学总监。
设计并主持多项大数据与人工智能项目,项目内容涵盖多源异构数据自动化采集、社交媒体舆情分析、多语言自然语言处理、图数据库集成与图算法应用等领域。长期为全球500强客户提供数据产品咨询,搭建企业级大数据平台与应用,在安全、交通、金融、媒体等行业的大数据项目管理方面有丰富经验。
教学案例
以上的实战派数据科学大佬们,也正式成为了CDA数据分析研究院荣誉科学家成员,共同参与制定CDA LEVEL 3数据科学家人才标准大纲及数据科学家精英培训,将自身在大数据发展这几年的实战成果,以教学案例的形式倾囊相授。案例包括:
案例一
大数据指标模型治理与实践
案例介绍:
大数据对业务数据ETL处理后,面临在数据仓库层面对业务词库定义、指标建模、元数据统一等问题;后期对外数据通过产品化和AdHoc方式交付数据,存在指标定义相同,但是语义理解存在较大偏差,如何进行指标模型的多口径计算逻辑统一,避免繁琐的人工维护和迭代,是本议题主张的部分;通过一处定义数据指标,多处交付统一的模型抽象、定义、训练和交付整体实践。
技能涉及:
元数据、大数据计算、ETL、数据建模、计算口径、血缘关系、语义理解、统一模型。
案例二:
用户画像在O2O互联网场景的实践
案例介绍:
在外卖的物流场景下的调度是一个时空最优解的模型评估,模型的演进的过程中,都有重要的特征支持着变革,边界非常清晰。模型演进对于画像部分,是开始在配送服务精细化运营的落地步骤;画像是为了满足个体的真实差异而对个性化的支撑方式。分享围绕互联网企业在智能调度系统方向上从的逐步演进,画像贯穿在整个生态当中,在大刀阔斧的业务版本演进同时,能够细致入微的解决落地场景的实践。
技能涉及:
用户画像、特征挖掘、模型评估、个性化推荐、时空最优
案例三
文本挖掘实战
案例介绍:
文本分析(Text analysis)是文本挖掘、信息检索的一个基本问题。它将文本中抽取出的特征词进行量化,进而表示其文本信息。由于文本是由特定的人进行编撰的,文本的语义结构不可避免地会反映人的特定立场、观点、价值和利益。通过大量数据的支撑,并结合文本内容的分析,可以推断出文本编撰者的意图和目的,以进行各种不同场景应用。
技能涉及:
分词、词性标注、命名实体标订、情绪标订、词关联分析、文件分类、文件摘要、文件聚类、文字云
案例四
生鲜智能补货
案例介绍:
生鲜补货在特定行业模式下的特点与面临的问题,商业模式与智能补货相结合中用到的智能算法,相关架构与业务效果,以及在系统的整个构建过程,生鲜智能补货是一个跟、供应链、仓储、物流、人员配送、促销、商品展现、推荐、广告、渠道运营等多系统协同的复杂系统,尤其生鲜类商品,保质期短,口味、消费者人群、地域分布等都与传统电商商品具有很大的差异。目前生鲜电商面临的最大问题就是运营成本难以下降,传统电商运营生鲜面临着保质期太短,对新鲜度的极高要求,冷链问题解,配送耗材损耗居高不下等问题。面对这样的问题,可以从供给侧通过智能补货系统对商品进行预测控制,降低损耗,降低周转期,提高库容利用率。
更多业界成熟案例都会融入到CDA LEVEL 3数据科学家精英培训中!
Lesson周期:
三个月,线上约20课时,线下50+课时(周末面授)
Lesson目标:
将数据分析师、数据工程师打造为数据科学家
2019年2月23日开学,限额30人哟,机不可失——https://www.cda.cn/kecheng/53...