SQL数据类型详解

一、数据类型简介
  • 数据表由多列字段构成,每一个字段指定了不同的数据类型,指定了数据类型之后,也就决定了向字段插入的数据内容;
  • 不同的数据类型也决定了 MySQL 在存储它们的时候使用的方式,以及在使用它们的时候选择什么运算符号进行运算;
  • 数值数据类型:TINYINT 、SMALINT 、MEDIUMINT 、INT 、BIGINT 、FLOAT 、DOUBLE 、DECIMAL;
  • 日期/时间类型:YEAR 、TIME 、DATE 、DATETIME 、TIMESTAMP;
  • 字符串类型:CHAR 、VARCHAR 、BINARY 、VARBINARY 、BLOB 、TEXT 、ENUM 、SET。

二、数值类型简介

  • 数值类型主要用来存储数字,不同的数值类型提供不同的取值范围,可以存储的值范围越大,所需要的存储空间也越大;
  • 数值类型分为:①整数类型 ②浮点数类型 ③定点数类型。

1、整数类型如下:

SQL数据类型详解

示例:

mysql> create table t1(
    -> m tinyint,
    -> n smallint,
    -> x mediumint,
    -> y int,
    -> z bigint
    -> );

查看表的详细信息如下(在创建表的时候没有指定其长度,但是每一列都有自己默认的长度):

SQL数据类型详解

2、浮点数类型和定点数类型

  • MySQL 中使用浮点数和定点数来表示小数,浮点数有两种类型:单精度浮点数(FLOAT)和双精度浮点数(DOUBLE),定点数只有 DECIMAL;
  • 浮点数和定点数都可以用 (M,N) 来表示,其中 M 是精度,表示总共的位数,N 是标度,表示小数的位数,如:3.145,用M/N来表示就是4,3;
  • DECIMAL 实际是以字符串形式存放的,在对精度要求比较高的时候(如货币、科学数据等)使用 DECIMAL 类型会比较好;
  • 浮点数相对于定点数的优点是在长度一定的情况下,浮点数能够表示更大的数据范围,它的缺点是会引起精度问题。

SQL数据类型详解

优化建议:

  • 建议使用 TINYINT 代替 ENUM、BITENUM、SET;
  • 避免使用整数的显示宽度,也就是说,不要用INT(10)类似的方法指定字段显示宽度,直接用INT;
  • DECIMAL最适合保存准确度要求高,而且用于计算的数据,比如价格。但是在使用DECIMAL类型的时候,注意长度设置;
    ? 建议使用整型来运算和存储实数,方法是,实数乘以相应的倍数后再操作;
    ?
    整数通常是最佳的数据类型,因为它速度快,并且能使用AUTO_INCREMENT。

示例1:

<!--新建一个表,值的长度都为5,小数点后都是两位-->
mysql> create table t2(
    -> x float(5,2),
    -> y double(5,2),
    -> z decimal(5,2)
    -> );
<!--插入正常符合要求的数据,可以正常插入-->
mysql> insert into t2 values(123.45,123.45,123.45);
Query OK, 1 row affected (0.00 sec)
<!--插入一些不符合规定的数据,会返回1个warning信息-->
mysql> insert into t2 values(123.456,123.456,123.456);
Query OK, 1 row affected, 1 warning (0.01 sec)

mysql> show warnings;     <!--查看warning信息,提示z列有截断的数据-->
+-------+------+----------------------------------------+
| Level | Code | Message                                |
+-------+------+----------------------------------------+
| Note  | 1265 | Data truncated for column ‘z‘ at row 1 |
+-------+------+----------------------------------------+
1 row in set (0.00 sec)

上述示例插入的数据,实际显示如下:

SQL数据类型详解

通过实际插入的数据不难发现,如果插入不符合列规定的数据,那么最终会以四舍五入的方法处理。

需要注意的是,在上面的数值类型中,它只允许在小数点后面多一位,而不允许在小数点之前多一位,如插入1234.5或1234.35就会报错。

示例2:

mysql> create table t3(      <!--创建多个列,长度都为10,小数点后面有两位-->
    -> x float(10,2),
    -> y double(10,2),
    -> z decimal(10,2)
    -> );
mysql> insert into t3 values(12345678.123,12345678.123,12345678.123);
Query OK, 1 row affected, 1 warning (0.00 sec)
<!--同样会返回warning信息,提示z列有截断数据,我就不看了-->

最终插入到表中的数据如下:

SQL数据类型详解
在上面的表中,x列为float数值类型,其他两列的数值还是基于四舍五入的方法进行插入的,但是float数值类型的x列,插入的数据和实际输入的数据就有些出入了,并且会随着小数点位数的增加,这个浮动范围会更大。

3、日期和时间类型

表示时间值的日期和时间类型为DATETIME、DATE、TIMESTAMP、TIME和YEAR。

每个时间类型有一个有效值范围和一个"零"值,当指定不合法的MySQL不能表示的值时使用"零"值。

TIMESTAMP类型有专有的自动更新特性。

SQL数据类型详解

优化建议:

  • MySQL能存储的最小时间粒度为秒。
  • 建议用DATE数据类型来保存日期。MySQL中默认的日期格式是yyyy-mm-dd;
  • 用MySQL的内建类型DATE、TIME、DATETIME来存储时间,而不是使用字符串;
  • 当数据格式为TIMESTAMP和DATETIME时,可以用CURRENT_TIMESTAMP作为默认(MySQL5.6以后),?MySQL会自动返回记录插入的确切时间;
  • TIMESTAMP是UTC时间戳,与时区相关;
  • DATETIME的存储格式是一个YYYYMMDD HH:MM:SS的整数,与时区无关;
  • 除非有特殊需求,否则建议使用TIMESTAMP,它比DATETIME更节约空间。

1)YEAR

  • 格式1:以4位字符串格式表示的 YEAR ,范围为 ‘1901‘ ~ ‘2155‘;
  • 格式2:以4位数字格式表示的 YEAR ,范围为 1901 ~ 2155;
  • 格式3:以2位字符串格式表示的 YEAR ,范围为 ‘00‘ ~ ‘99‘ ,其中,‘00‘ ~ ‘69‘ 被转换为 2000 ~ 2069 ,‘70‘ ~ ‘99‘ 被转换为 1970 ~ 1999;
  • 格式4:以2位数字格式表示的 YEAR ,范围为 1 ~ 99 ,其中,1 ~ 69 被转换为 2001 ~ 2069 ,70 ~ 99 被转换为 1970 ~ 1999。

示例:

mysql> create table t4(y year);    <!--新建一个表,只有一列,数值类型为year-->
 <!--依次插入四位的字符、数值;两位的字符、数值-->
mysql> insert into t4 values(‘2000‘),(2000),(‘94‘),(94);

插入的数据如下所示:

SQL数据类型详解

mysql> delete from t4;         <!--删除原有数据-->
mysql> insert into t4 values(‘0‘),(0),(‘00‘),(00);       <!--插入一些不符合列规定的数值-->

新插入的数据如下:

SQL数据类型详解

结论:当插入的年份不合法时,会用0000表示。

2)TIME

  • TIME 类型的格式为 HH:MM:SS ,HH 表示小时,MM 表示分钟,SS 表示秒
  • 格式1:以 ‘HHMMSS‘ 格式表示的 TIME ,例如 ‘101112‘ 被理解为 10:11:12 ,但如果插入不合法的时间,如 ‘109712‘ ,则被存储为 00:00:00
  • 格式2:以 ‘D HH:MM:SS‘ 字符串格式表示的 TIME ,其中 D 表示日,可以取 0 ~ 34 之间的值,在插入数据库的时候 D 会被转换成小时,如 ‘2 10:10‘ 在数据库中表示为 58:10:00 ,即 2x24+10 = 58

示例:

mysql> create table t5(d time);
mysql> insert into t5 values(‘12:12:12‘),(121212),(3),(‘3 10:2‘),(14),(‘08:08‘);

插入的数据如下:

SQL数据类型详解

上述插入的数据,基本可以对应SQL语句来看出来其规律,唯一需要解释的,应该就是“82:02:00”,对应的插入值是“3 10:2”,最中写入表中的时间是3天(3 X 24)+10小时,零2分钟,也就是82个小时零两分钟。

3)DATE

  • DATE 类型的格式为 YYYY-MM-DD ,其中,YYYY 表示年,MM 表示月,DD 表示日;
  • 格式1:‘YYYY-MM-DD‘ 或 ‘YYYYMMDD‘ ,取值范围为 ‘1000-01-01‘ ~ ‘9999-12-3‘;
  • 格式2:‘YY-MM-DD‘ 或 ‘YYMMDD‘ ,这里 YY 表示两位的年值,范围为 ‘00‘ ~ ‘99‘ ,其中,‘00‘ ~ ‘69‘ 被转换为 2000 ~ 2069 ,‘70‘ ~ ‘99‘ 被转换为 1970 ~ 1999;
  • 格式3:YY-MM-DD 或 YYMMDD ,数字格式表示的日期,其中 YY 范围为 00 ~ 99 ,其中,00 ~ 69 被转换为 2000 ~ 2069 ,70 ~ 99 被转换为 1970 ~ 1999。

示例:

mysql> create table t6(d date);     <!--创建一个表,列的数据类型为date-->
mysql> insert into t6 values(‘1999-09-09‘),(990906),(19990909);
<!--插入不同格式的日期-->

查看插入的结果如下:
SQL数据类型详解

其实,对于date这一种数值类型,对于其格式并没有严格的要求,如2019-12-12这样的数值可以插入成功,2000!10:10这样的数值同样可以插入成功,如下:

SQL数据类型详解

4)DATETIME

  • DATETIME 类型的格式为 YYYY-MM-DD HH:MM:SS ,其中,YYYY 表示年,MM 表示月,DD 表示日,HH 表示小时,MM 表示分钟,SS 表示秒;
  • 格式1:‘YYYY-MM-DD HH:MM:SS‘ 或 ‘YYYYMMDDHHMMSS‘ ,字符串格式,取值范围为 ‘1000-01-01 00:00:00‘ ~ ‘9999-12-31 23:59:59‘;
  • 格式2:‘YY-MM-DD HH:MM:SS‘ 或 ‘YYMMDDHHMMSS‘ ,字符串格式,其中 YY 范围为 ‘00‘ ~ ‘99‘ ,其中,‘00‘ ~ ‘69‘ 被转换为 2000 ~ 2069 ,‘70‘ ~ ‘99‘ 被转换为 1970 ~ 1999;
  • 格式3:YYYYMMDDHHMMSS 或 YYMMDDHHMMSS ,数字格式,取值范围同上。

示例:

mysql> insert into t7 values(‘1996-09-19 12:24:56‘);

插入到表中的数据如下:
SQL数据类型详解

5)TIMESTAMP

  • TIMESTAMP 类型的格式为 YYYY-MM-DD HH:MM:SS,显示宽度固定在19个字符;
  • TIMESTAMP 与 DATETIME 的区别在于,TIMESTAMP 的取值范围小于 DATETIME 的取值范围;
  • TIMESTAMP 的取值范围为 1970-01-01 00:00:01 UTC ~ 2038-01-19 03:14:07 UTC ,其中 UTC 是世界标准时间,存储时会对当前时区进行转换,检索时再转换回当前时区。

三、字符串数据类型

  • 字符串类型用来存储字符串数据,还可以存储比如图片和声音的二进制数据;
  • MySQL 支持两种字符串类型:文本字符串和二进制字符串。

SQL数据类型详解

SQL数据类型详解

优化建议:

  • 字符串的长度相差较大用VARCHAR;
  • 字符串短,且所有值都接近一个长度用CHAR;
  • BINARY和VARBINARY存储的是二进制字符串,与字符集无关;
  • BLOB系列存储二进制字符串,与字符集无关;
  • TEXT是一个更大的VARCHAR;
  • BLOB和TEXT都不能有默认值。

1、char和varchar

  • CHAR(M) 为固定长度的字符串,在定义时指定字符串列长,当保存时在右侧填充空格以达到指定的长度,M 表示列长度,取值范围是 0~255 个字符,例如,CHAR(4) 定义了一个固定长度的字符串列,其包含的字符个数最大为 4,当检索到 CHAR 值时,尾部的空格将被删掉;
  • VARCHAR(M) 为可变长度的字符串,M 表示最大列长度,取值范围是 0~65535 ,VARCHAR 的最大实际长度由最长的行的大小和使用的字符集确定,而其实际占用的空间为字符串的实际长度加一(一个字符串结束符);

示例:

<!--新建一个表,字符类型分别为char和varchar-->
mysql> create table t9(c char(4),vc varchar(4));
Query OK, 0 rows affected (0.01 sec)
<!--插入数据,每条数据都是两个字母加两个空格-->
mysql> insert into t9 values(‘ab  ‘,‘ab  ‘);

调用length函数,查看插入的数据长度:

SQL数据类型详解

调用紧凑函数,查看其实际数据:

SQL数据类型详解

可以验证了,如果是char类型的列,尾部的空格会被删除掉,如果是varchar类型的列,空格不会被删除掉,而是一个空格占一个位。

需要注意的是,如果是char类型的列,假如定义数值的长度为4,那么就算插入的数值长度只有2,它还是会占4个长度的空间,而varchar则不会,因为前者属于不可变长度的数值类型,而后者是可变的。

2、TEXT

  • TINYTEXT 最大长度为 255 个字符;
  • TEXT 最大长度为 65536 个字符;
  • MEDIUMTEXT 最大长度为 16777215 个字符;
  • LONGTEXT 最大长度为 4294967295 个字符。

3、ENUM

在基本的数据类型中,无外乎就是些数字和字符,但是某些事物是较难用数字和字符来准确地表示的。比如一周有七天,分别是Sunday、Monday、Tuesday、Wednesday、Thursday、Friday 和 Saturday。如果我们用整数 0、1、2、3、4、5、6 来表示这七天,那么多下来的那些整数该怎么办?而且这样的设置很容易让数据出错,即取值超出范围。我们能否自创一个数据类型,而数据的取值范围就是这七天呢?因此有了 ENUM 类型(Enumeration,枚举),它允许用户自己来定义一种数据类型,并且列出该数据类型的取值范围。ENUM 是一个字符串对象,其值为表创建时在列规定中枚举(即列举)的一列值,语法格式为:字段名 ENUM (‘值1‘, ‘值2‘, ..... ‘值n‘) 字段名指将要定义的字段,值 n 指枚举列表中的第 n 个值,ENUM类型的字段在取值时,只能在指定的枚举列表中取,而且一次只能取一个。如果创建的成员中有空格时,其尾部的空格将自动删除。ENUM 值在内部用整数表示,每个枚举值均有一个索引值:列表值所允许的成员值从 1 开始编号,MySQL 存储的就是这个索引编号。枚举最多可以有 65535 个元素。

示例:

4、SET

  • SET 是一个字符串对象,可以有零个或多个值,SET 列最多可以有 64 个成员,其值为表创建时规定的一列值,语法:SET(‘值1‘,‘值2‘,...... ‘值n‘);
  • 与 ENUM 类型相同,SET 值在内部用整数表示,列表中每一个值都有一个索引编号;
  • 与 ENUM 类型不同的是,ENUM 类型的字段只能从定义的列值中选择一个值插入,而 SET 类型的列可从定义的列值中选择多个字符的联合;
  • 如果插入 SET 字段中列值有重复,则 MySQL 自动删除重复的值,插入 SET 字段的值的顺序并不重要,MySQL 会在存入数据库时,按照定义的顺序显示。

5、BIT

  • BIT 数据类型用来保存位字段值,即以二进制的形式来保存数据,如保存数据 13,则实际保存的是 13 的二进制值,即 1101;
  • BIT 是位字段类型,BIT(M) 中的 M 表示每个值的位数,范围为 1~64 ,如果 M 被省略,则默认为 1 ,如果为 BIT(M) 列分配的值的长度小于 M 位,则在值得左边用 0 填充;
  • 如果需要位数至少为 4 位的 BIT 类型,即可定义为 BIT(4) ,则大于 1111 的数据是不能被插入的。

6、BINARY 和 VARBINARY

  • BINARY 和 VARBINARY 类型类似于 CHAR 和 VARCHAR,不同的是它们包含二进制字节字符串;
  • BINARY 类型的长度是固定的,指定长度之后,不足最大长度的,将在它们右边填充 ‘\0‘ 以补齐指定长度;
  • VARBINARY 类型的长度是可变的,指定长度之后,其长度可以在 0 到最大值之间。

7、BLOB

  • BLOB 用来存储可变数量的二进制字符串,分为 TINYBLOB 、BLOB 、MEDIUMBLOB 、LONGBLOB 四种类型;
  • BLOB 存储的是二进制字符串,TEXT 存储的是文本字符串;
  • BLOB 没有字符集,并且排序和比较基于列值字节的数值;TEXT 有一个字符集,并且根据字符集对值进行排序和比较。

SQL数据类型详解

相关推荐