关于mysql:MySQL如何存储Emoji表情UTF8和UTF8MB4字符编码有何区别

3次阅读

共计 1757 个字符,预计需要花费 5 分钟才能阅读完成。

不晓得为什么深秋的到来,让人变的有些许抑郁和不安

🏆前言

这篇应该算个小常识吧。平时习惯在写文章的时候都喜爱用 windowsemoji 表情 (win+.) 即可弹出,就如👨‍💻🏂🛌🛀🤽‍♂️⛹️‍♂️🤸‍♂️,还有、🏎🚠🛫💺🚀🛰⛵,这种🍟🍔🍿🌭🥞🥙🍰🥤🍸

之前开发的我的项目,没有存储过这种小表情,都是应用 mysql 的默认字符设置 UTF-8, 然而明天测试发现是行不通,而后就有了这篇小文章,心愿可能让你有所播种。

📚一、UTF-8 为什么不反对 Emoji 表情

在一个 utf- 8 表中所做测试,不反对插入数据中蕴含 emoji 表情的数据。

起因:MySQL 数据库的“utf8”并不是真正概念里的 UTF-8。目前可见字符集都只须要 3 个字节,蕴含了所有字符。然而问题出在 unicode6 系列编码上,它们须要 4 个字节,这部分就是有名的 emoji。所以,如果咱们的数据库应用默认字符设置,是无奈存储 emoji 表情的。

📑二、UTF-8 与 UTF-8MB4 的区别

2.1、UTF-8(Unicode)

咱们先谈谈 UTF-8, 最早只有 127 个字符被编码到计算机里,也就是大小写英文字母、数字和一些符号,这个编码表被称为 ASCII 编码,然而要解决中文显然一个字节是不够的,至多须要两个字节,而且还不能和 ASCII 编码抵触,所以,中国制订了 GB2312 编码,用来把中文编进去。你能够想得到的是,全世界有上百种语言,日本把日文编到 Shift_JIS 里,韩国把韩文编到 Euc-kr 里,各国有各国的规范,就会不可避免地呈现抵触,后果就是,在多语言混合的文本中,显示进去会有乱码。

因而,Unicode 应运而生。Unicode 把所有语言都对立到一套编码里,这样就不会再有乱码问题了。古代操作系统和大多数编程语言都间接反对 Unicode。

📦

所以在 UTF- 8 编码中,一个英文字符占用一个字节的存储空间,一个中文(含繁体)占用三个字节的存储空间。

📊

目前基本上可见字符集都只须要三个字节,蕴含了所有字符,然而目前问题出在了 unicode6 系列编码上,它们须要 4 个字节,这部分就是有名的 emoji。所以,你只有不是特种编码还是 unicode,且不存 emoji,保障不出问题。

另外在此处,我有一点须要补充的是:

MySQL 数据库的“utf8”并不是真正概念里的 UTF-8,起因下面是一点,还有一点是 MySQL 中的“utf8”编码只反对最大 3 字节每字符。真正的大家正在应用的 UTF- 8 编码是应该能反对 4 字节每个字符。

但其实 MYSQL 的开发者,并没有润饰这个 bug,而是推出了新的字符集,就是 UTF-8MB4 字符编码。如👇

2.2、UTF-8MB4

UTF8MB4:MySQL 在 5.5.3 之后减少了 utf8mb4 的编码,mb4 就是 most bytes 4 的意思,专门用来兼容四字节的 unicode。因而能够用来存储 emoji 表情。

从 8.0 后,MySQL 也将会在某个版本中开始应用 UTF-8MB4 作为默认的字符编码。

所以简略说即是:UTF-8MB4 才是 MySQL 中真正的 UTF- 8 编码

那么如何让 MySQL 存储 Emoji 表情勒。

📰三、如何让 MySQL 存储 Emoji 表情

咱们在创立数据库的时候,就须要选定 utf-8mb4 字符集,而不是 utf-8。

咱们在设置字段字符集的时候,也须要设置为 utf-8mb4 字符集。

这样我在 Navicat 中测试是能够的。

然而,我之前在网上查问相干材料的时候,说是须要批改一下 my.ini 配置文件,

[mysqld] 上面增加:character_set_server=utf8mb4,保留,重启 mysql,应该就能够解决了。

⌛四、喃喃自语

留神 下次再有人问起设置什么样的编码,记得间接举荐设置 utf-8mb4 哦,这个才是 MySQL 真正的 UTF- 8 编码哦。

开始想 11 月更文写什么,掘金大佬们,你说我当初开始学前端还有救吗。

大家也能够说说想看什么,我会就写写会,不会就去学学,给大家推推文。👨‍💻

咱们后端这阶段真的是处于一个 是人是鬼都在卷的期间,困难重重啊

大家好,我是博主 宁在春:主页

一名喜爱文艺却踏上编程这条路线的小青年。

心愿:咱们,待别日相见时,都已有所成

参考:

Mysql 中“utf-8”和 ”utf8mb4″ 的区别与应用场景

补充:发了这么多篇,终于有一个点赞了,开心一下

正文完
 0