首页 >通知公告 > > 正文

roc曲线spss步骤_roc曲线制作具体步骤-全球热闻

发布日期:2023-05-10 19:14:43 来源:互联网 分享

1、正因为我们比较关注正例的情形,所以设置了两个相应的指标:TPR与FPR。

2、  TPR:True Positive Rate,将实际的1正确地预测为1的概率,d/(c+d)。


(资料图片仅供参考)

3、  FPR:False Positive Rate,将实际的0错误地预测为1的概率,b/(a+b)。

4、  TPR也称为Sensitivity(即生物统计学中的敏感度),在这里也可以称为“正例的覆盖率”——将实际为1的样本数找出来的概率。

5、覆盖率是重要的指标,例如若分类的目标是找出潜在的劣质客户(响应变量取值为1),则覆盖率越大表示越多的劣质客户被找出。

6、  类似地,1-FPR其实就是“负例的覆盖率”,也就是把负例正确地识别为负例的概率。

7、  TPR与FPR相互影响,而我们希望能够使TPR尽量地大,而FPR尽量地小。

8、影响TPR与FPR的重要因素就是上文提到的“阈值”。

9、当阈值为0时,所有的样本都被预测为正例,因此TPR=1,而FPR=1。

10、此时的FPR过大,无法实现分类的效果。

11、随着阈值逐渐增大,被预测为正例的样本数逐渐减少,TPR和FPR各自减小,当阈值增大至1时,没有样本被预测为正例,此时TPR=0,FPR=0。

12、  由上述变化过程可以看出,TPR与FPR存在同方向变化的关系(这种关系一般是非线性的),即,为了提升TPR(通过降低阈值),意味着FPR也将得到提升,两者之间存在类似相互制约的关系。

13、我们希望能够在牺牲较少FPR的基础上尽可能地提高TPR,由此画出了ROC曲线。

14、  ROC曲线的全称为“接受者操作特性曲线”(receiver operating characteristic)  当预测效果较好时,ROC曲线凸向左上角的顶点。

15、平移图中对角线,与ROC曲线相切,可以得到TPR较大而FPR较小的点。

16、模型效果越好,则ROC曲线越远离对角线,极端的情形是ROC曲线经过(0,1)点,即将正例全部预测为正例而将负例全部预测为负例。

17、ROC曲线下的面积可以定量地评价模型的效果,记作AUC,AUC越大则模型效果越好。

18、  由于ROC曲线描述了在TPR与FPR之间的取舍,因此我一般将其理解为投入产出曲线,receive of cost。

19、(事实上我理解错了。

20、相对而言lorenz曲线更适合这个名字。

21、当然啦其实FPR可以理解为另一种cost。

22、2010.10.15)  当我们分类的目标是将正例识别出来时(例如识别有违约倾向的信用卡客户),我们关注TPR,此时ROC曲线是评价模型效果的准绳。

本文分享完毕,希望对你有所帮助。

标签:

Copyright ©  2015-2022 大众兽药网版权所有  备案号:豫ICP备20014643号-14   联系邮箱: 905 14 41 07@qq.com