我正在尝试将英语和日语字符分开。我需要找到所有日语字符的 Unicode 范围。所有日语字符的 Unicode 范围是什么?
正如 zawhtut 提到的,this page有几个 unicode 范围的引用。
日式标点 (3000-303f)
平假名 (3040-309f)
片假名 (30a0-30ff)
全角罗马字符和半角片假名 (ff00-ffef)
CJK unifed 表意文字-常见和不常见的汉字(4e00-9faf)
虽然这个问题已经有了答案,但this blog post可能更完整。
请访问该网站并获取他们的指标,但对于后代,这里有一个复制粘贴。
HiraganaUnicode 代码点正则表达式:[\x3041-\x3096]
Unicode 块属性正则表达式:\p{Hiragana}
片假名(全宽)
Unicode 代码点正则表达式:[\x30A0-\x30FF]
Unicode 块属性正则表达式:\p{Katakana}
Unicode 代码点正则表达式:[\x3400-\x4DB5\x4E00-\x9FCB\xF900-\xFA6A]
Unicode 块属性正则表达式:\p{Han}
要列出的字符太多。
此正则表达式将匹配所有汉字,包括中文使用的汉字。
汉字字根
Unicode 代码点正则表达式:[\x2E80-\x2FD5]
以及,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个,一个。
片假名和标点(半宽)
Unicode 代码点正则表达式:[\xFF5F-\xFF9F]
上一篇:
日语符号和标点符号
Unicode 代码点正则表达式:[\x3000-\x303F]
、。朱雀射手〇〈〉《》「」【】
杂项日语符号和字符
Unicode 代码点正则表达式:[\x31F0-\x31FF\x3220-\x3243\x3280-\x337F]
是的,是的,是的,是的,是的,是的,是的,是的,是的,是的,是的,是的,是的,是的,是的,是的,是的,是的,是的。
字母数字和标点(全宽)
Unicode 代码点正则表达式:[\xFF01-\xFF5E]
!“售价 % &”()* +,- . / / / 1 2 3 4 6 6 6 6 6 6 8 8 6:;?
请参阅此page以供参考。它包含片假名,平假名和汉字 unicode 范围。
CJK(日语和韩语),平假名和片假名(包括半角片假名)
http://www.unicode.org/charts/本站系公益性非盈利分享网址,本文来自用户投稿,不代表边看边学立场,如若转载,请注明出处
评论列表(22条)