【python】利用正则表达式过滤特殊字符

【python】利用正则表达式过滤特殊字符,第1张

to_glob_str = "1a A烫烫♪(^∇O(∩_∩)O^*){【《/*、\.." # 要过滤的字符串
re_exp = u"([^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a\’!\"#$%&\'()*+,-./:;<=>?@,。?、…【】《》?“”‘’!["u"\\]^_`{|}~\s])" # 过滤正则表达式,只保留中文、英文、数字及一些标点符号
re_exp_2 = u"([.*\[d+].*])" # 过滤形如[1]等的引用
result_str = re.sub(re_exp, "", to_glob_str)

附:各个符号对应的unicode编码

表达式说明
\u4e00-\u9fa5汉字
\u0030-\u0039数字
\u0041-\u005a大写字母
\u0061-\u007a小写字母
\uAC00-\uD7AF韩文
\u3040-\u31FF日文

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/langs/736321.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-04-28
下一篇2022-04-28

发表评论

登录后才能评论

评论列表(0条)

    保存