R语言注释,最好能转为matlab语言

R语言注释,最好能转为matlab语言,第1张

y<-matrix(runif(100030),nrow=1000)

xm<-(rowMeans(y)-05)sqrt(420)

x<-seq(-3,3,by=05)

F<-sum(sapply(x,function(y) xm<y))/1000

#F<-sum(c(xm< -3,xm< -25,xm< -2,xm< -15, xm< -1,xm< -05,xm<0,xm<05,xm<1,xm<15,xm<2,xm<25,xm<3))/1000

b<-pnorm(x) #b<-pnorm(seq(-3,3,by=05))

abs(b-F)

使用生物降解数据集,包含41个数值型变量,描述了1055种化学品的分子组成及属性。

建模的任务是根据这些属性来预测某个特定化学品是否会生物降解。

最后一列X42包含了输出变量,不可生物降解为NRB,可生物降解为RB,需要转换为因子型。其他数值型中有的也被识别为字符型,需要手动转换为数值型。

数据集不存在缺失值。

对特征进行归一化处理(让它们具有0均值和单位方差),消除量纲的影响,尤其是使用径向基核函数时。

Number of Support Vectors : 297,表示成为支持向量的数据点的数量为297个。

查看训练集的正确率。

训练集上的准确率为8698%,还不错。看看在测试集上的准确率。

测试集上表现略好于训练集,为8857%。

检查准确率:

可以看到,径向基核函数的性能比线性核函数要差一些。

K折交叉验证:将训练数据拆分为K个同样大小且不会重叠的分区,然后,用K-1个分区训练模型,并把剩下的1个分区作为测试集。这样一共进行K次,每次留出一个分区作为测试集。最后,对K个不同测试集上获得的所有估计进行汇总,来计算在未知数据上的精确度的整体估计。

使用10折交叉验证,再次对比两种核函数模型的性能。

使用10折交叉验证后,可以看到,径向基核函数的性能要优于线性核函数。

查看径向基核函数下,支持向量机模型的性能。

ROC曲线

多分类ROC曲线。这个确实比较少众,一般诊断试验都是二分类的。百度到说有的是用三维的ROC曲线,也有的简单粗暴进行两两比较,这里是一篇博文,说的是使用python 来解决这个问题。 多分类ROC曲线 。

其实我是结局病理指标,把它分成了3个等级,总觉着两两比较是会出问题的,才去寻找,然而没有找到答案。

这是另外基于R语言实现的博客。 多分类下的ROC曲线和AUC

roc曲线截断值不是整数。因为R语言ROC曲线截断值、特异性、敏感性和曲线下面积AUC值的计算和显示_skywindy1的博客-CSDN博客_roc曲线截断值R语言ROC曲线截断值、特异性、敏感性和曲线下面积AUC值的计算和显示R语言绘制ROC曲线在临床医学中的应用ROC曲线分析详细解释(一)ROC曲线的概念受试者工作特征曲线(receiver operator characteristic curve,ROC曲线)。

以上就是关于R语言注释,最好能转为matlab语言全部的内容,包括:R语言注释,最好能转为matlab语言、84-预测分析-R语言实现-支持向量机、多分类ROC曲线等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zz/10136632.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-05
下一篇2023-05-05

发表评论

登录后才能评论

评论列表(0条)

    保存