PHP处理字符中的emoji表情
业务场景,开发的小程序和APP需要类似朋友圈一样的功能,然后好多客户都需要发带emoji表情的文字
所以,这里说一下php如何处理字符中的emoji表情
utf-8 编码的 emoji 表情或者某些特殊字符占用 4 个字节。utf-8 编码的常用中文字符占用 3 个字节。
三个 PHP 内置函数:
mb_strlen
mixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] ) // 返回具有 encoding 编码的字符串 str 包含的字符数。多字节的字符被计为 1。 // 如果给定的 encoding 无效则返回 FALSE
mb_substr
string mb_substr ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] ) // 根据字符数执行一个多字节安全的 substr() 操作。位置是从 str 的开始位置进行计数。第一个字符的位置是 0。第二个字符的位置是 1。 // mb_substr() 函数根据 start 和 length 参数返回 str 中指定的部分。
strlen
int strlen ( string $string ) // 返回给定的字符串 string 的长度。
判断字符串中是否含有 emoji 表情
函数如下:
function haveEmojiChar($str) { $mbLen = mb_strlen($str); $strArr = []; for ($i = 0; $i < $mbLen; $i++) { $strArr[] = mb_substr($str, $i, 1, ‘utf-8‘); if (strlen($strArr[$i]) >= 4) { return true; } } return false; }
移除字符串中的 emoji 表情
函数如下:
function removeEmojiChar($str) { $mbLen = mb_strlen($str); $strArr = []; for ($i = 0; $i < $mbLen; $i++) { $mbSubstr = mb_substr($str, $i, 1, ‘utf-8‘); if (strlen($mbSubstr) >= 4) { continue; } $strArr[] = $mbSubstr; } return implode(‘‘, $strArr); }
MySQL 如何储存含有 emoji 表情的字符串
MySQL 中使用 utf8mb4 字符集。
PHP 对字符串进行 base64 编码,从数据库中取出时再对字符串进行解码。
直接移除字符串中的 emoji 表情(该方法简单粗暴)
相关推荐
唐文 2020-06-28
ailxxiaoli 2020-11-16
austindev 2020-06-28
Andrea0 2020-01-14
Trustport 2019-12-01
coinone 2019-10-29
boox 2018-10-25
TinyDolphin 2019-10-30
happinessaflower 2019-10-26
xuefeng0 2015-04-13
haixianTV 2015-08-30
yzhj00 2017-11-23
AxDoctor 2016-04-12
quanhaoH 2012-04-21
85206537 2015-09-19
88286530 2015-09-19
81246831 2015-08-24
chh 2015-05-05