python jieba分词使用

python jieba分词使用,第1张

python jieba分词使用

下载包

pip install jieba

导入

#导入包
import jieba
import jieba.posseg as pseg
import jieba.analyse

使用自定义词典

jieba.load_userdict(r"userdict.txt")

 添加词

jieba.add_word('程序员')
jieba.add_word('打游戏')

删除词

jieba.del_word('写代码')

元组类型测试数据

 test_sent = (
    "程序员喜欢打游戏,嘻嘻,不喜欢写代码"
    )

 将划分结果为变成列表类型输出

result = pseg.lcut(test_sent)
print(result)

提取标签为x的实体,输出为列表

list=jieba.analyse.extract_tags(sentence=doctitle,topK=10,allowPOS=('x'))

 

 

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/5436876.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-12-11
下一篇2022-12-11

发表评论

登录后才能评论

评论列表(0条)

    保存