【MySQL】 字符集排序规则(字符集校验规则)命名格式

2024-01-09 09:33:01

排序规则命名格式

字符集_[编码|语言][_重音][_大小写敏感][_bin]
utf8mb4 字符集的默认校验规则为: utf8mb4_0900_ai_ci

格式中各部分含义

  • 字符集: utf8mb4 、gb2312 等
  • 编码:可选,值可能为 0900、unicode 或 unicode_520
  • 语言:可选,表示校验规则为特别语言而定制,如 _zh 表示适用于中文,_da 表示适用于丹麦语
  • 重音:可选,ai 表示不区分重音,as 表示区分重音
  • 大小写敏感:可选, ci 表示不区分大小写,cs 表示区分大小写
  • bin: 可选,指字符比较时采用二进制进行比较。 当将字符串视为二进制进行比较时,会将字符串中的每个字符视为一组字节(或比特)的序列,而不考虑字符的语义、语言、大小写或重音符号等特征。在进行二进制比较时,只比较字符的字节表示,而不考虑字符本身的含义。

示例

以 utf8mb4 所有字符集为例

校验规则描述
utf8mb4_0900_ai_ci基于Unicode 9.0.0版本,不区分大小写,适用于多语言环境,提供准确的排序结果。
utf8mb4_0900_as_ci基于Unicode 9.0.0版本,不区分大小写,适用于多语言环境,提供准确的排序结果。
utf8mb4_0900_as_cs基于Unicode 9.0.0版本,区分大小写,适用于多语言环境,提供准确的排序结果。
utf8mb4_0900_bin基于Unicode 9.0.0版本,进行严格的二进制比较和排序,区分大小写和字符编码。
utf8mb4_bin进行严格的二进制比较和排序,区分大小写和字符编码。
utf8mb4_croatian_ci不区分大小写,适用于克罗地亚语的比较和排序。
utf8mb4_cs_0900_ai_ci基于Unicode 9.0.0版本,不区分大小写,适用于捷克语的比较和排序。
utf8mb4_cs_0900_as_cs基于Unicode 9.0.0版本,区分大小写,适用于捷克语的比较和排序。
utf8mb4_czech_ci不区分大小写,适用于捷克语的比较和排序。
utf8mb4_danish_ci不区分大小写,适用于丹麦语的比较和排序。
utf8mb4_da_0900_ai_ci基于Unicode 9.0.0版本,适用于丹麦语,不区分大小写,提供准确的排序结果。
utf8mb4_da_0900_as_cs基于Unicode 9.0.0版本,适用于丹麦语,区分大小写,提供准确的排序结果。
utf8mb4_de_pb_0900_ai_ci基于Unicode 9.0.0版本,适用于德语(奥地利/瑞士),不区分大小写,提供准确的排序结果。
utf8mb4_de_pb_0900_as_cs基于Unicode 9.0.0版本,适用于德语(奥地利/瑞士),区分大小写,提供准确的排序结果。
utf8mb4_eo_0900_ai_ci基于Unicode 9.0.0版本,适用于世界语,不区分大小写,提供准确的排序结果。
utf8mb4_eo_0900_as_cs基于Unicode 9.0.0版本,适用于世界语,区分大小写,提供准确的排序结果。
utf8mb4_esperanto_ci不区分大小写,适用于世界语的比较和排序。
utf8mb4_estonian_ci不区分大小写,适用于爱沙尼亚语的比较和排序。
utf8mb4_es_0900_ai_ci基于Unicode 9.0.0版本,适用于西班牙语,不区分大小写,提供准确的排序结果。
utf8mb4_es_0900_as_cs基于Unicode 9.0.0版本,适用于西班牙语,区分大小写,提供准确的排序结果。
utf8mb4_es_trad_0900_ai_ci基于Unicode 9.0.0版本,适用于传统的西班牙语,不区分大小写,提供准确的排序结果。
utf8mb4_es_trad_0900_as_cs基于Unicode 9.0.0版本,适用于传统的西班牙语,区分大小写,提供准确的排序结果。
utf8mb4_et_0900_ai_ci基于Unicode 9.0.0版本,适用于爱沙尼亚语,不区分大小写,提供准确的排序结果。
utf8mb4_et_0900_as_cs基于Unicode 9.0.0版本,适用于爱沙尼亚语,区分大小写,提供准确的排序结果。
utf8mb4_general_ci不区分大小写的通用排序规则,适用于多语言环境。
utf8mb4_german2_ci不区分大小写,适用于德语的比较和排序,提供更严格的排序规则。
utf8mb4_hr_0900_ai_ci基于Unicode 9.0.0版本,适用于克罗地亚语,不区分大小写,提供准确的排序结果。
utf8mb4_hr_0900_as_cs基于Unicode 9.0.0版本,适用于克罗地亚语,区分大小写,提供准确的排序结果。
utf8mb4_hungarian_ci不区分大小写,适用于匈牙利语的比较和排序。
utf8mb4_hu_0900_ai_ci基于Unicode 9.0.0版本,适用于匈牙利语,不区分大小写,提供准确的排序结果。
utf8mb4_hu_0900_as_cs基于Unicode 9.0.0版本,适用于匈牙利语,区分大小写,提供准确的排序结果。
utf8mb4_icelandic_ci不区分大小写,适用于冰岛语的比较和排序。
utf8mb4_is_0900_ai_ci基于Unicode 9.0.0版本,适用于冰岛语,不区分大小写,提供准确的排序结果。
utf8mb4_is_0900_as_cs基于Unicode 9.0.0版本,适用于冰岛语,区分大小写,提供准确的排序结果。
utf8mb4_ja_0900_as_cs基于Unicode 9.0.0版本,适用于日语,区分大小写,提供准确的排序结果。
utf8mb4_ja_0900_as_cs_ks基于Unicode 9.0.0版本,适用于日语,区分大小写和偏旁部首,提供准确的排序结果。
utf8mb4_latvian_ci不区分大小写,适用于拉脱维亚语的比较和排序。
utf8mb4_la_0900_ai_ci基于Unicode 9.0.0版本,适用于拉丁语系语言,不区分大小写,提供准确的排序结果。
utf8mb4_la_0900_as_cs基于Unicode 9.0.0版本,适用于拉丁语系语言,区分大小写,提供准确的排序结果。
utf8mb4_lithuanian_ci不区分大小写,适用于立陶宛语的比较和排序。
utf8mb4_lt_0900_ai_ci基于Unicode 9.0.0版本,适用于立陶宛语,不区分大小写,提供准确的排序结果。
utf8mb4_lt_0900_as_cs基于Unicode 9.0.0版本,适用于立陶宛语,区分大小写,提供准确的排序结果。
utf8mb4_lv_0900_ai_ci基于Unicode 9.0.0版本,适用于拉脱维亚语,不区分大小写,提供准确的排序结果。
utf8mb4_lv_0900_as_cs基于Unicode 9.0.0版本,适用于拉脱维亚语,区分大小写,提供准确的排序结果。
utf8mb4_persian_ci不区分大小写,适用于波斯语的比较和排序。
utf8mb4_pl_0900_ai_ci基于Unicode 9.0.0版本,适用于波兰语,不区分大小写,提供准确的排序结果。
utf8mb4_pl_0900_as_cs基于Unicode 9.0.0版本,适用于波兰语,区分大小写,提供准确的排序结果。
utf8mb4_polish_ci不区分大小写,适用于波兰语的比较和排序。
utf8mb4_romanian_ci不区分大小写,适用于罗马尼亚语的比较和排序。
utf8mb4_roman_ci不区分大小写,适用于罗马语系的比较和排序。
utf8mb4_ro_0900_ai_ci基于Unicode 9.0.0版本,适用于罗马尼亚语,不区分大小写,提供准确的排序结果。
utf8mb4_ro_0900_as_cs基于Unicode 9.0.0版本,适用于罗马尼亚语,区分大小写,提供准确的排序结果。
utf8mb4_ru_0900_ai_ci基于Unicode 9.0.0版本,适用于俄语,不区分大小写,提供准确的排序结果。
utf8mb4_ru_0900_as_cs基于Unicode 9.0.0版本,适用于俄语,区分大小写,提供准确的排序结果。
utf8mb4_sinhala_ci不区分大小写,适用于僧伽罗语的比较和排序。
utf8mb4_sk_0900_ai_ci基于Unicode 9.0.0版本,适用于斯洛伐克语,不区分大小写,提供准确的排序结果。
utf8mb4_sk_0900_as_cs基于Unicode 9.0.0版本,适用于斯洛伐克语,区分大小写,提供准确的排序结果。
utf8mb4_slovak_ci不区分大小写,适用于斯洛伐克语的比较和排序。
utf8mb4_slovenian_ci不区分大小写,适用于斯洛文尼亚语的比较和排序。
utf8mb4_sl_0900_ai_ci基于Unicode 9.0.0版本,适用于斯洛文尼亚语,不区分大小写,提供准确的排序结果。
utf8mb4_sl_0900_as_cs基于Unicode 9.0.0版本,适用于斯洛文尼亚语,区分大小写,提供准确的排序结果。
utf8mb4_spanish2_ci不区分大小写,适用于西班牙语的比较和排序。
utf8mb4_spanish_ci不区分大小写,适用于西班牙语的比较和排序。
utf8mb4_sv_0900_ai_ci基于Unicode 9.0.0版本,适用于瑞典语,不区分大小写,提供准确的排序结果。
utf8mb4_sv_0900_as_cs基于Unicode 9.0.0版本,适用于瑞典语,区分大小写,提供准确的排序结果。
utf8mb4_swedish_ci不区分大小写,适用于瑞典语的比较和排序。
utf8mb4_tr_0900_ai_ci基于Unicode 9.0.0版本,适用于土耳其语,不区分大小写,提供准确的排序结果。
utf8mb4_tr_0900_as_cs基于Unicode 9.0.0版本,适用于土耳其语,区分大小写,提供准确的排序结果。
utf8mb4_turkish_ci不区分大小写,适用于土耳其语的比较和排序。
utf8mb4_unicode_520_ci不区分大小写,基于Unicode 5.2.0版本的通用排序规则。
utf8mb4_unicode_ci不区分大小写,基于Unicode的通用排序规则。
utf8mb4_vietnamese_ci不区分大小写,适用于越南语的比较和排序。
utf8mb4_vi_0900_ai_ci基于Unicode 9.0.0版本,适用于越南语,不区分大小写,提供准确的排序结果。
utf8mb4_vi_0900_as_cs基于Unicode 9.0.0版本,适用于越南语,区分大小写,提供准确的排序结果。
utf8mb4_zh_0900_as_cs基于Unicode 9.0.0版本,适用于中文,区分大小写,提供准确的排序结果。

文章来源:https://blog.csdn.net/m0_47406832/article/details/135408633
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。