python 分词及语义识别

python 分词及语义识别,第1张

1、除去字符串中的符号
testtext=‘淮南市寿县炎刘镇机械厂1|淮南市寿县:安徽蓝博旺机械集团工程车辆有限公司(东门)【创业大道与242省道交叉口南150米】;’
pattern = re.compile(“[\u4e00-\u9fa5a-zA-Z0-9]”) # 只保留中英文、数字,去掉符号
content2 = re.sub(pattern, ‘’, testtext)
print(content2)

2、分词及去重
cutinfo=[x for x in jieba.cut(content2)]
cutinfo1=list(set(cutinfo))
cutinfo1.sort(key=cutinfo.index)
print(‘’.join(cutinfo1))

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/langs/873422.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-05-13
下一篇2022-05-13

发表评论

登录后才能评论

评论列表(0条)

    保存