
y<-matrix(runif(100030),nrow=1000)
xm<-(rowMeans(y)-05)sqrt(420)
x<-seq(-3,3,by=05)
F<-sum(sapply(x,function(y) xm<y))/1000
#F<-sum(c(xm< -3,xm< -25,xm< -2,xm< -15, xm< -1,xm< -05,xm<0,xm<05,xm<1,xm<15,xm<2,xm<25,xm<3))/1000
b<-pnorm(x) #b<-pnorm(seq(-3,3,by=05))
abs(b-F)
使用生物降解数据集,包含41个数值型变量,描述了1055种化学品的分子组成及属性。
建模的任务是根据这些属性来预测某个特定化学品是否会生物降解。
最后一列X42包含了输出变量,不可生物降解为NRB,可生物降解为RB,需要转换为因子型。其他数值型中有的也被识别为字符型,需要手动转换为数值型。
数据集不存在缺失值。
对特征进行归一化处理(让它们具有0均值和单位方差),消除量纲的影响,尤其是使用径向基核函数时。
Number of Support Vectors : 297,表示成为支持向量的数据点的数量为297个。
查看训练集的正确率。
训练集上的准确率为8698%,还不错。看看在测试集上的准确率。
测试集上表现略好于训练集,为8857%。
检查准确率:
可以看到,径向基核函数的性能比线性核函数要差一些。
K折交叉验证:将训练数据拆分为K个同样大小且不会重叠的分区,然后,用K-1个分区训练模型,并把剩下的1个分区作为测试集。这样一共进行K次,每次留出一个分区作为测试集。最后,对K个不同测试集上获得的所有估计进行汇总,来计算在未知数据上的精确度的整体估计。
使用10折交叉验证,再次对比两种核函数模型的性能。
使用10折交叉验证后,可以看到,径向基核函数的性能要优于线性核函数。
查看径向基核函数下,支持向量机模型的性能。
ROC曲线:
多分类ROC曲线。这个确实比较少众,一般诊断试验都是二分类的。百度到说有的是用三维的ROC曲线,也有的简单粗暴进行两两比较,这里是一篇博文,说的是使用python 来解决这个问题。 多分类ROC曲线 。
其实我是结局病理指标,把它分成了3个等级,总觉着两两比较是会出问题的,才去寻找,然而没有找到答案。
这是另外基于R语言实现的博客。 多分类下的ROC曲线和AUC
roc曲线截断值不是整数。因为R语言ROC曲线截断值、特异性、敏感性和曲线下面积AUC值的计算和显示_skywindy1的博客-CSDN博客_roc曲线截断值R语言ROC曲线截断值、特异性、敏感性和曲线下面积AUC值的计算和显示R语言绘制ROC曲线在临床医学中的应用ROC曲线分析详细解释(一)ROC曲线的概念受试者工作特征曲线(receiver operator characteristic curve,ROC曲线)。
以上就是关于R语言注释,最好能转为matlab语言全部的内容,包括:R语言注释,最好能转为matlab语言、84-预测分析-R语言实现-支持向量机、多分类ROC曲线等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)