在Naive Bayes中使用稀疏矩阵在线学习(Python,scikit)

在Naive Bayes中使用稀疏矩阵在线学习(Python,scikit),第1张

概述我正在尝试在数据集上做Naive Bayes,该数据集有超过6,000,000个条目,每个条目有150k的特征.我试图从以下链接实现代码:Implementing Bag-of-Words Naive-Bayes classifier in NLTK问题是(据我所知),当我尝试使用dok_matrix作为参数运行train-method时,它无法找到iter

我正在尝试在数据集上做Naive Bayes,该数据集有超过6,000,000个条目,每个条目有150k的特征.我试图从以下链接实现代码:
Implementing Bag-of-Words Naive-Bayes classifier in NLTK

问题是(据我所知),当我尝试使用dok_matrix作为参数运行train-method时,它无法找到iterkeys(我已将OrderedDict的行与标签配对):

Traceback (most recent call last):  file "skitest.py",line 96,in 

我的问题是,有没有办法通过条目(在线)教授分类器条目来避免使用稀疏矩阵,还是有一种稀疏矩阵格式,我可以在这种情况下有效地使用而不是dok_matrix?还是我错过了一些明显的东西?

谢谢你的时间. 总结

以上是内存溢出为你收集整理的在Naive Bayes中使用稀疏矩阵/在线学习(Python,scikit)全部内容,希望文章能够帮你解决在Naive Bayes中使用稀疏矩阵/在线学习(Python,scikit)所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/langs/1205513.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-06-04
下一篇2022-06-04

发表评论

登录后才能评论

评论列表(0条)