是什么让TA蹲5个小时也要听完？云栖大会数据库专场8大爆点！

zhouqinxiong

2016-04-26

4月21日下午在深圳大中华喜来登召开的云栖大会-Tech Insight-数据库技术专场在开始前半小时，全部位置已坐满以至于在正式开始前就地上坐满了人，过道站满了人，不得不派出安保维持现场秩序。

是什么让技术人员如此热情高涨?没错，就是数据库技术网（干）红（货）见面会。开会前，某技术网红（此处特指褚霸）说要放大招。今天，我可以告诉你，大招是PB级数据存储：PetaData数据库发布、SAP HANA One数据库的合作和云数据库OceanBase发布。当然，还有更大招，将在7月云栖大会北京峰会对外公开,现在就可以期待了。

前方高能大招，各位准备好了吗？请擦亮眼睛观看本场内容的8大观点：

一、褚霸：我们正在见证数据库的变迁

是什么让TA蹲5个小时也要听完？云栖大会数据库专场8大爆点！

数据库从上个世纪70年代开始，经过50年的发展，当前已有300多种数据库系统。

1）数据库焦点在转移：近看这10年的发展，为了更好的支撑互联网应用构建和迭代，架构师们更愿意选择轻量级数据库，特别是MySQL，所以我们看到数据库的焦点正在从商业库向开源数据库倾斜。

2）处理能力在发展：而从技术角度来看，一方面是从单机数据库向分布式快速发展，另一方面数据库正在从单一的事务处理或者计算处理，向混合型处理发展，我们称之为HTAP(Hybrid Transaction/Analytical Processing) 。

3）使用模式在转变：从数据库获得途径来看，正在从传统软件+硬件走向云平台（服务）的新模式。

二、何导：DT时代，“数据”是必须重视的核心资产

企业经营多年，最后积累的永久宝贵资产除了钱就是数据。

根据不完全统计调查显示，当前创业公司中拥有数据库管理员（DBA）的企业小于4%（专业的DBA人才都集中在几个大型企业中），而这4%中还有一半以上是由运维人员兼职的。这在提醒我们：企业的最宝贵资产—“数据”没有人保管！?

ApsaraDB 团队致力于将数据库门槛降到0点，一键为用户创建一套完整而专业的数据库解决方案，包括高可用、高密度监控、备份和恢复、自动优化等。让开发可以轻松、专业的管理数据库。

而面向日夜忙碌的DBA，我们不但可以帮助他们减少60%的日常工作，而且可以让他们以“数据管理员DataA”的视角，以“企业数据”为中心，全方向重新审视安全性、可靠性、可扩展性、远距离容灾等数据盲点，以全新的职能全力协助企业快速发展。

是什么让TA蹲5个小时也要听完？云栖大会数据库专场8大爆点！

三、丁奇：数据库宕了，到底是谁的原因？

数据库宕了大家着急，但很难使上力。于是各种猜测、指责开始蔓延…究其原因就是无法判断问题出在哪里，如何快速恢复。而今天，ApsaraDB 一直致力于建设高可诊断性的数据库。通过全链路监控，能够快速判断链路问题出在哪个节点。

通过保存所有审计日志，在用户事后发现时，授权后能够分析导致所有异常的原因。审计日志中可以保存每个语句的原文、来源ip、端口、微秒级执行时间、微秒级开始时间、扫描行数、返回行数、执行结果等，典型应用场景如:

1）当用户发现数据被删除时，可以查出执行删除语句的所有信息方便定位；

2）当用户出现大量锁等待时，可以分析出问题当时所有线程的事务状态，从中分析锁等待关系链；

3）当用户出现大量读io时，可以分析当时所有语句的扫描行数轻松判断；

从链路、主机、实例级别保存所有信息，使得数据库实例随时处于可诊断状态。

四、丁奇：比社区版本快100倍。真的吗？

ApsaraDB即将上线的GreenPlum服务，要比社区快100倍？

首先解释下这个100倍是指分区表插入速度快100倍。其原理：分区表插入关键是判断一个插入值属于哪个分区。社区版是采用触发器实现：

1）需要调用触发器的逻辑，代码链路很长，导致执行慢。

2）需要使用遍历的方式来判定一个值所属分区，非常低效。在分区较多（比如几百个分区）时，会很慢。分区越多，速度越慢。

而 ApsaraDB for GreenPlum的方法：

1）无需调用复杂的触发器逻辑

2）采用二分法遍历分区的临界值，算法由O(N)降至O(logN)

五、叶翔：传说会丢数据的数据库，为什么会成为新的趋势？

一个丢数据的数据库是不可能如此流行，“传说”更准确的说是“谣言”。

MongoDB是非常灵活和可靠的数据库，用户可以自行配置写入可靠性级别，所以往往是误用了低可靠性参数而造成了一定概率的丢失。MongoDB的文档型数据结构与面向对象编程有天然的兼容性，数据建模非常容易上手。并且其支持高可用的复制集，灵活的分区功能等，这些核心功能促进了MongoDB的崛起。MongoDB在互联网对NoSQL的需求浪潮下，没有不火的道理。

阿里云也是趁胜追击推出了MongoDB云服务。提供了更高的可靠性，背后还具有非常专业的MongoDB源码团队支撑。也欢迎大家前来使用，与阿里云一起享受NoSQL红利。

六、叶翔：NoSQL数据库如何选型？

一般来说，NoSQL数据库选型需要从数据模型和存储特性两方面综合考虑，拿最流行的三个NoSQL数据来举例：

1）数据模型：

文档型：MongoDB
KV型：Memcache
复杂KV型：Redis

2）存储特性上：

持久化需求高数据量大，作为核心数据源，或者有轻度计算需求的：MongoDB
对性能要求极致，不担心数据丢失的选择：Memcache
数据生命周期短，数据量相对小，性能要求高：Redis

七、叶翔：NewSQL又是什么鬼？

简单的来说：SQL+NoSQL＝NewSQL。 NewSQL被定义为下一代数据库的发展方向。甚至在今天的数据库特性上已经可以看到这个趋势：最流行的开源关系型数据库：MySQL ，从5.7版本开始具有JSON，KV解决方案；而最流行的NoSQL数据库：MongoDB，也推出Join解决方案。

SQL与NoSQL的界限逐渐在模糊，甚至传统关系型数据库PostgreSQL可以利用FDW让MongoDB作为其数据源。所以，不论SQL也好，NoSQL也好，都会以NewSQL的形态展现。

八、玄惭：《云数据库十大经典案例》满满全是干货，直接放PPT可以吗？

《云数据库十大经典案例》以MySQL数据库为例，收集整理了自阿里云数据库团队至今，用户在使用RDS过程中最常见的问题。包括：

1）索引

2）sql优化

3）锁

4）延迟

5）参数优化

6）连接数

7）cpu

8）iops

9）磁盘

10）内存

每个案例的背后都是活生生的生产故障，希望通过这些案例的总结还原问题原貌，给出分析问题的思路。也许有一天，当你遇到类似问题的时候能够触类旁通，举一反三，快速解决问题。

最佳实践收集了阿里云多年在数据库上的开发经验和内核团队在MySQL上的优化实践，以及众多专家在处理各类问题后积累下来的最佳实践，希望用户能够在使用云数据库的路上少一些弯路，多一些从容。

是什么让TA蹲5个小时也要听完？云栖大会数据库专场8大爆点！

是的，最后有PDF。不过头条无法放链接。需要观看PDF的同学们请到云栖社区。

无法到现场的同学们也不用遗憾，阿里云数据库团队实时在线培训每月多场（讲师40分钟分享，20分钟答疑，还有互动微信和钉钉组），多关注云栖社区的直播频道即可。

大数据云栖数据库

安科网

是什么让TA蹲5个小时也要听完？云栖大会数据库专场8大爆点！

zhouqinxiong

zhouqinxiong

相关推荐

分布式文档存储数据库之MongoDB备份与恢复的实践详解

分布式文档存储数据库之MongoDB分片集群的问题

Forrester发布全栈公有云开发平台报告，腾讯云再次入选领导者象限

SAP AMDP介绍 - ABAP托管的HANA数据库过程

docker容器与宿主机的数据交互方式总结

详解Vue数据驱动原理

vue+echarts+datav大屏数据展示及实现中国地图省市县下钻功能

THINKPHP5分页数据对象处理过程解析

需要知识的后深度学习时代，如何高效自动构建知识图谱

人工智能技术如何落地交通出行？

将云技术带入数据中心-走向数据驱动型业务的旅程

联想持续发力智能物联，构建新基建时代下的行业新引擎

数据科学面试中应了解的十种机器学习概念

雾计算在物联网中的应用

AI格局正在从“数据”转变为“知识”

数据骗子无处不在，教你拆穿所谓“万金油”

模型数据出现偏差怎么办？一文了解机器学习中的7种数据偏差类型

机器学习中处理缺失值的9种方法

人工智能和机器学习如何从物联网数据中提取关键见解

IT打工人，AI来“抢”你饭碗了！这次从数据中心下手

zhouqinxiong