
下载包
pip install jieba
导入包
#导入包 import jieba import jieba.posseg as pseg import jieba.analyse
使用自定义词典
jieba.load_userdict(r"userdict.txt")
添加词
jieba.add_word('程序员')
jieba.add_word('打游戏')
删除词
jieba.del_word('写代码')
元组类型测试数据
test_sent = (
"程序员喜欢打游戏,嘻嘻,不喜欢写代码"
)
将划分结果为变成列表类型输出
result = pseg.lcut(test_sent) print(result)
提取标签为x的实体,输出为列表
list=jieba.analyse.extract_tags(sentence=doctitle,topK=10,allowPOS=('x'))
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)