正则式​​\p{名字}​

正则字符集大全1,微软给出的,注意​​不全​​,补充在下面,但仍然不全,​​还有几个小区间找不到​​:

字符区间

中文名

​0000-007F​

​是基本拉丁​

​0080-00FF​

​是拉丁补充​

​0100-017F​

​是拉丁扩展1​

​0180-024F​

​是拉丁扩展2​

​0250-02AF​

​是音标扩展​

​02B0-02FF​

​是空格修改器字母​

​0300-036F​

​是组合区分标记​

​0370-03FF​

​是希腊/是希腊和科普特​

​0400-04FF​

​是西里尔​

​0500-052F​

​是西里尔补充​

​0530-058F​

​是亚美尼亚​

​0590-05FF​

​是希伯来语​

​0600-06FF​

​是阿拉伯​

​0700-074F​

​是叙利亚​

​0780-07BF​

​是塔纳​

​0900-097F​

​是梵文​

​0980-09FF​

​是孟加拉语​

​0A00-0A7F​

​是锡克教文​

​0A80-0AFF​

​是吉吉拉特​

​0B00-0B7F​

​是奥利亚​

​0B80-0BFF​

​是泰米尔​

​0C00-0C7F​

​是泰卢固​

​0C80-0CFF​

​是加拿大​

​0D00-0D7F​

​是马拉亚兰​

​0D80-0DFF​

​是锡兰文​

​0E00-0E7F​

​是泰国​

​0E80-0EFF​

​是老挝​

​0F00-0FFF​

​是西藏​

​1000-109F​

​是缅甸​

​10A0-10FF​

​是乔治亚​

​1100-11FF​

​是朝鲜文​

​1200-137F​

​是埃塞俄比亚​

​13A0-13FF​

​是切诺基​

​1400-167F​

​是统一加拿大土著语音节​

​1680-169F​

​是欧甘​

​16A0-16FF​

​是北欧​

​1700-171F​

​是菲律宾​

​1720-173F​

​是哈奴奴​

​1740-175F​

​是布迪文​

​1760-177F​

​是泰格班瓦​

​1780-17FF​

​是柬埔寨​

​1800-18AF​

​是蒙古​

​1900-194F​

​是林布​

​1950-197F​

​是泰勒​

​19E0-19FF​

​是柬埔寨符号​

​1D00-1D7F​

​是语音扩展​

​1E00-1EFF​

​是拉丁附加扩展​

​1F00-1FFF​

​是希腊扩展​

​2000-206F​

​是一般标点​

​2070-209F​

​是上下标​

​20A0-20CF​

​是货币符号​

​20D0-20FF​

​是符号组合区分标记/是符号组合标记​

​2100-214F​

​是字母类符号​

​2150-218F​

​是数字形式​

​2190-21FF​

​是箭头​

​2200-22FF​

​是数学运算符​

​2300-23FF​

​是杂项工业技术​

​2400-243F​

​是控制图片​

​2440-245F​

​是可选特征识别​

​2460-24FF​

​是闭式字母数字​

​2500-257F​

​是盒画​

​2580-259F​

​是块元素​

​25A0-25FF​

​是几何形状​

​2600-26FF​

​是杂项符号​

​2700-27BF​

​是印刷​

​27C0-27EF​

​是杂项数学符1​

​27F0-27FF​

​是追加箭头1​

​2800-28FF​

​是盲文模式​

​2900-297F​

​是追加箭头2​

​2980-29FF​

​是杂项数学符2​

​2A00-2AFF​

​是补充数学操作符​

​2B00-2BFF​

​是杂项符号箭头​

​2E80-2EFF​

​是中日韩部首补充​

​2F00-2FDF​

​是康熙部首​

​2FF0-2FFF​

​是表意描述字符​

​3000-303F​

​是中日韩符号标点​

​3040-309F​

​是平假名​

​30A0-30FF​

​是片假名​

​3100-312F​

​是汉语拼音​

​3130-318F​

​是兼容朝鲜文​

​3190-319F​

​是象形​

​31A0-31BF​

​是汉语拼音扩展​

​31F0-31FF​

​是平假名音标扩展​

​3200-32FF​

​是闭式中日韩字母和月份​

​3300-33FF​

​是兼容中日韩​

​3400-4DBF​

​是中日韩统一象形文字扩展1​

​4DC0-4DFF​

​是易经六十四卦符号​

​4E00-9FFF​

​是中日韩统一象形文字​

​A000-A48F​

​是彝文音节​

​A490-A4CF​

​是彝文部首​

​AC00-D7AF​

​是韩文音节​

​D800-DB7F​

​是高替代​

​DB80-DBFF​

​是高自用替代​

​DC00-DFFF​

​是低替代​

​E000-F8FF​

​是自用/是自用区域​

​F900-FAFF​

​是兼容中日韩象形文字​

​FB00-FB4F​

​是字母表示​

​FB50-FDFF​

​是阿拉伯表示1​

​FE00-FE0F​

​是变量选择器​

​FE20-FE2F​

​是组合半标记​

​FE30-FE4F​

​是兼容中日韩形式​

​FE50-FE6F​

​是小型变体​

​FE70-FEFF​

​是阿拉伯表示2​

​FF00-FFEF​

​是半或全宽形式​

​FFF0-FFFF​

​是特殊​

补充在此,还缺少几个:

​字符区间​

​中英文​

​0750-077F​

​阿拉伯文补充(ArabicSupplement)​

​0780-07BF​

​马尔代夫语(Thaana)​

​07C0-07FF​

​西非书面语言​

​---------​

​分界​

​0800-085F​

​阿维斯塔语及巴列维语(AvestanandPahlavi)​

​0860-087F​

​曼达语(Mandaic)​

​0880-08AF​

​撒马利亚语(Samaritan)​

​--------​

​分界​

​08b0-08fF​

​**缺少**​

​1380-139F​

​埃塞俄比亚语补充(EthiopicSupplement)​

​----​

​分界​

​18B0-18FF​

​可汗语(Cham)​

​-----​

​分界​

​1980-19DF​

​新泰语(NewTaiLue)​

​----​

​分界​

​1A00-1A1F​

​布吉语(Buginese)​

​1A20-1A5F​

​巴达克(Batak)​

​1a60-1a7f​

​*缺少*​

​1A80-1AEF​

​兰纳(Lanna)​

​1af0-1aff​

​*缺少*​

​1B00-1B7F​

​巴厘语(Balinese)​

​1B80-1BB0​

​巽他语(Sundanese)​

​1bb1-1bbf​

​*缺少*​

​1BC0-1BFF​

​帕苗语(PahawhHmong)​

​1C00-1C4F​

​雷布查语(Lepcha)​

​1C50-1C7F​

​桑塔利(OlChiki)​

​1C80-1CDF​

​曼尼普尔语(Meithei/Manipuri)​

​1Ce0-1Cff​

​*缺少*​

​-----​

​分界​

​1D80-1DBF​

​语音学扩展补充​

​1DC0-1DFF​

​结合用读音符号补充(CombiningDiacriticsMarksSupplement)​

​----​

​分界​

​2C00-2C5F​

​格拉哥里字母(Glagolitic)​

​2C60-2C7F​

​拉丁文扩展3(LatinExtended-C)​

​2C80-2CFF​

​古埃及语(Coptic)​

​2D00-2D2F​

​格鲁吉亚语补充(GeorgianSupplement)​

​2D30-2D7F​

​提非纳文(Tifinagh)​

​2D80-2DDF​

​埃塞俄比亚语扩展(EthiopicExtended)​

​2E00-2E7F​

​追加标点(SupplementalPunctuation)​

​----​

​分界​

​2Fe0-2Fef​

​这一部分也是部首(*缺少*)​

​----​

​分界​

​31C0-31EF​

​中日韩笔画(CJKStrokes)​

​----​

​分界​

​A500-A61F​

​瓦伊(Vai)​

​A660-A6FF​

​统一加拿大土著语音节补充(UnifiedCanadianAboriginalSyllabicsSupplement)​

​A700-A71F​

​声调修饰字母(ModifierToneLetters)​

​A720-A7FF​

​拉丁文扩展4(LatinExtended-D)​

​A800-A82F​

​赛诺提(SylotiNagri)​

​A840-A87F​

​八思巴字(Phags-pa)​

​A880-A8DF​

​索拉什拉(Saurashtra)​

​A900-A97F​

​爪哇语(Javanese)​

​A980-A9DF​

​查克马(Chakma)​

​AA00-AA3F​

​瓦朗什提(VarangKshiti)​

​AA40-AA6F​

​索朗彭(SorangSompeng)​

​AA80-AADF​

​新瓦里(Newari)​

​AB00-AB5F​

​越泰语​

​AB80-ABA0​

​克耶文(KayahLi)​

​aba1-abff​

​(*缺少*)​

​-----​

​分界​