1200字范文 > python判断字符串包含中文_查询字符串中是否包含中文字符（Python实现）

python判断字符串包含中文_查询字符串中是否包含中文字符（Python实现）

时间：2019-09-17 09:56:22

Unicode 是全球文字统一编码。它把世界上的各种文字的每一个字符指定唯一编码，实现跨语种、跨平台的应用。

中文用户最常接触的是汉字 Unicode 编码。中文字符数量巨大，日常使用的汉字数量有数千个，再加上生僻字，数量达到数万个。下面这个表格将中文字符集的 Unicode 编码范围列出：

字符集

字数

Unicode编码范围基本汉字

20902

4E00-9FA5

基本汉字补充

9FA6-9FEF

扩展A

6582

3400-4DB5

扩展B

42711

20000-2A6D6

扩展C

4149

2A700-2B734

扩展D

222

2B740-2B81D

扩展E

5762

2B820-2CEA1

扩展F

7473

2CEB0-2EBE0

扩展G

4939

30000-3134A

康熙部首

214

2F00-2FD5

部首扩展

115

2E80-2EF3

兼容汉字

477

F900-FAD9

兼容扩展

542

2F800-2FA1D

PUA(GBK)部件

E815-E86F

部件扩展

452

E400-E5E8

PUA增补

207

E600-E6CF

汉字笔画

31C0-31E3

汉字结构

2FF0-2FFB

汉语注音

3105-312F

注音扩展

31A0-31BA

〇

3007

根据上述字符范围，可以编写以下函数，识别给定字符串是否含义中文字符。

# coding=utf-8

importre

defcontainChinese(content):

"""判断内容是否含有中文字符

Arguments:

content{string}--要检测的内容

Returns:

[bool]--是否包含中文

"""

zh_pattern=pile(

)

match=zh_pattern.search(content)

returnmatchisnotNone

a = '中文abcs短语'

print(containChinese(a)) # True

b = 'abcd'

print(containChinese(b)) # False

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。