欢迎来到IDC91站长网!
解决服务器各种技术问题,加微信uecomzsr

MySQL

当前位置: IDC91 > 数据库 > MySQL

详解mysql中的字符集和校验规则

时间:2022-05-30 14:00:03|栏目:MySQL|点击:

1几种常见字符集

在MySQL中,最常见的字符集有ASCII字符集、latin字符集、GB2312字符集、GBK字符集、UTF8字符集等,下面我们简单介绍下这些字符集:

ASCII字符集

这个字符集使用1个字节进行编码,一个字节具有8位,总共可以保存128个字符,具体的对应关系如下:

latin字符集

latin字符集一共可以保存256个字符,相比ASCII码,它又包含了128个西欧常用字符。

GB2312字符集

它包含了中文汉字、拉丁字符、希腊字符等,其中汉字占了大多数,有6763个,其他文字符号638个,而且它兼容ASCII字符。当对ASCII编码的时候,它采用1个字节进行编码,也就是128位,当对其他字符进行编码的时候,它采用2个字节进行编码。可以理解它是一种边长编码方式。

GBK字符集

该字符集是对GB2312字符集的一个扩充,它兼容GB2312字符集,一般采用两个字节进行编码。

UTF8字符集

它通常由1~4个字节来进行编码,根据使用字节的不同,也可以分为UTF8和utf8mb4两种,mb4的意思就是最多4个字节的意思,一般来讲UTF8采用三个字节进行编码,除此之外,还有utf16以及utf32,utf16使用2个或4个字节编码一个字符,utf32使用4个字节编码一个字符。

需要注意的是,一些emoji表情需要使用utf8mb4来表示。

2 mysql中支持的字符集

MySQL支持很多字符集,以我本地的字符集为例,使用show charset;命令查看当前服务器支持的字符集,结果如下:

mysql--dba_admin@127.0.0.1:(none) 22:46:48>>show charset;
+----------+-----------------------------+---------------------+--------+
| Charset | Description         | Default collation  | Maxlen |
+----------+-----------------------------+---------------------+--------+
| big5   | Big5 Traditional Chinese  | big5_chinese_ci   |   2 |
| dec8   | DEC West European      | dec8_swedish_ci   |   1 |
| cp850  | DOS West European      | cp850_general_ci  |   1 |
| hp8   | HP West European      | hp8_english_ci   |   1 |
| koi8r  | KOI8-R Relcom Russian    | koi8r_general_ci  |   1 |
| latin1  | cp1252 West European    | latin1_swedish_ci  |   1 |
| latin2  | ISO 8859-2 Central European | latin2_general_ci  |   1 |
| swe7   | 7bit Swedish        | swe7_swedish_ci   |   1 |
| ascii  | US ASCII          | ascii_general_ci  |   1 |
| ujis   | EUC-JP Japanese       | ujis_japanese_ci  |   3 |
| sjis   | Shift-JIS Japanese     | sjis_japanese_ci  |   2 |
| hebrew  | ISO 8859-8 Hebrew      | hebrew_general_ci  |   1 |
| tis620  | TIS620 Thai         | tis620_thai_ci   |   1 |
| euckr  | EUC-KR Korean        | euckr_korean_ci   |   2 |
| koi8u  | KOI8-U Ukrainian      | koi8u_general_ci  |   1 |
| gb2312  | GB2312 Simplified Chinese  | gb2312_chinese_ci  |   2 |
| greek  | ISO 8859-7 Greek      | greek_general_ci  |   1 |
| cp1250  | Windows Central European  | cp1250_general_ci  |   1 |
| gbk   | GBK Simplified Chinese   | gbk_chinese_ci   |   2 |
| latin5  | ISO 8859-9 Turkish     | latin5_turkish_ci  |   1 |
| armscii8 | ARMSCII-8 Armenian     | armscii8_general_ci |   1 |
| utf8   | UTF-8 Unicode        | utf8_general_ci   |   3 |
| ucs2   | UCS-2 Unicode        | ucs2_general_ci   |   2 |
| cp866  | DOS Russian         | cp866_general_ci  |   1 |
| keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci |   1 |
| macce  | Mac Central European    | macce_general_ci  |   1 |
| macroman | Mac West European      | macroman_general_ci |   1 |
| cp852  | DOS Central European    | cp852_general_ci  |   1 |
| latin7  | ISO 8859-13 Baltic     | latin7_general_ci  |   1 |
| utf8mb4 | UTF-8 Unicode        | utf8mb4_general_ci |   4 |
| cp1251  | Windows Cyrillic      | cp1251_general_ci  |   1 |
| utf16  | UTF-16 Unicode       | utf16_general_ci  |   4 |
| cp1256  | Windows Arabic       | cp1256_general_ci  |   1 |
| cp1257  | Windows Baltic       | cp1257_general_ci  |   1 |
| utf32  | UTF-32 Unicode       | utf32_general_ci  |   4 |
| binary  | Binary pseudo charset    | binary       |   1 |
| geostd8 | GEOSTD8 Georgian      | geostd8_general_ci |   1 |
| cp932  | SJIS for Windows Japanese  | cp932_japanese_ci  |   2 |
| eucjpms | UJIS for Windows Japanese  | eucjpms_japanese_ci |   3 |
+----------+-----------------------------+---------------------+--------+
39 rows in set (0.00 sec)

上一篇:MySQL排序原理和案例详析

栏    目:MySQL

下一篇:MySQL 中行转列的方法

本文标题:详解mysql中的字符集和校验规则

本文地址:https://idc91.com/shujuku/4153.html

广告投放 | 联系我们 | 免责申明

重要申明:本站所有的文章、图片、评论等,均由网友发表或上传并维护或收集自网络,属个人行为,与本站立场无关。

如果侵犯了您的权利,请与我们联系,我们将在24小时内进行处理、任何非本站因素导致的法律后果,本站均不负任何责任。

Copyright © 2023 IDC91.COM 版权所有晋ICP备17006296号