accuracy_score 函数计算实体模型在验证集里的准

lxf2023-05-05 00:46:39

准确度

准确度主要是用于考量分类算法特性的指标之一,表明实体模型在大多数归类样本中恰当分类占比。准确度越大,模型特性就越好。

准确度计算公式如下所示:

Accuracy=TP TNTP TN FP FNAccuracy = \frac{TP TN}{TP TN FP FN}

在其中,TPTP表明真真正正例(True Positive),TNTN表明真典例(True Negative),FPFP表明假正例(False Positive),FNFN表明假典例(False Negative)。

以下属于一个简单的实例编码,展现怎么使用准确度来评价模型性能

from sklearn.metrics import accuracy_score
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

# 载入数据
iris = load_iris()
X = iris.data
y = iris.target

# 将数据分为测试集和验证集,比例是8:2
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 练习决策树模型
model = DecisionTreeClassifier()
model.fit(X_train, y_train)

# 预测分析验证集标签
y_pred = model.predict(X_test)

# 测算准确度
accuracy = accuracy_score(y_test, y_pred)
print('实体模型在验证集里的准确度为:', accuracy)

所述编码中,使用 accuracy_score 函数公式来预测模型在验证集里的准确度。最先,大家载入了鸢尾花数据,将数据依照 8:2 的比例分成测试集和验证集。随后,使用 DecisionTreeClassifier 类练习一个决策树模型,并用 predict 方式来评估验证集标签。最终,应用 accuracy_score 函数计算实体模型在验证集里的准确度。

特性

  1. 简易形象化:准确度计算公式简易,便于认知和表述。

  2. 容易受样本分布产生的影响:当样本不平衡时,准确度可能会对出虚假性得到的结果。比如,在一个二分类问题中,假如负样本约占样本量的绝大多数,实体模型将侧重于把所有的样版都预测分析为负样本,这时准确度可能很高,但实体模型并没具体的预测力。

  3. 不顾及误分类种类和严重度:准确度只注重模型预测得到的结果正确与否,且不关注模型预测不正确的种类和严重度。因而,当误分类种类和严重度对应用领域有较高的危害时,准确度肯定会是最佳的评价指标体系。

  4. 可用作较为不一样模型特性:准确度可用作较为不一样实体模型在同一数据里的特性,并帮助挑选最好模型。

  5. 只适用于分类任务:准确度只是针对分类任务,不得用于回归问题。

  6. 对数据规模敏感度低:准确度对数据规模敏感度低,因而可用作较为在各个体量的数据上练习模型性能。

需注意,准确度并非适合所有的分类任务,尤其是在类别不平衡的情形下,准确度可能存在虚假性。在这样的情况下,我们应该用其他指标来评价模型性能。

均方误差

在机器学习算法中,均方误差(Recall)是检验分类算法特性的一个重要指标之一。均方误差就是指全部正样本里被分类算法恰当识别占比,即:

Recall=TPTP FNRecall = \frac{TP}{TP FN}

在其中,TP(True Positive)表明被分类算法准确地鉴别为正样本的样本量,FN(False Negative)表明被分类算法不恰当地鉴别为负样本的反样本量。

以下属于一个简单的实例编码,展现怎样预测模型的均方误差:

import numpy as np
from sklearn.metrics import recall_score
from sklearn.linear_model import LogisticRegression

# 载入数据信息
data = np.loadtxt('data.csv', delimiter=',')
X = data[:, :-1]  # 特征矩阵
y = data[:, -1]   # 标识

# 训练算法
model = LogisticRegression()
model.fit(X, y)

# 在测试集上精准预测
y_pred = model.predict(X_test)

# 测算均方误差
recall = recall_score(y_test, y_pred)
print('模型均方误差为:', recall)

所述编码中,使用 recall_score 函数公式来预测模型在验证集里的均方误差。该函数公式必须键入2个主要参数:真正标识(y_test)和预测分析标识(y_pred)。

特性

  1. 均方误差考量是指全部正样本里被分类算法恰当识别占比,因而它对正样本的识别能力很关键。在一些应用领域下,如医疗诊断、欺诈检测等,均方误差的必要性很高。

  2. 均方误差与准确度(Precision)一样,都能够用于评价模型特性,但它们的着重点差异。准确度关心的是全部预测分析为正样本的样本中真真正正为正样本比例,而均方误差关心的是全部真真正正为正样本的样本中被准确预测分析为正样本比例。

  3. 均方误差越大,表明实体模型针对正样本的识别能力越高。可是,招回率的提高一般会伴随误判率(False Positive Rate)的提高。因而,实际应用中,必须根据实际情景充分考虑好几个指标值,选择适合自己的实体模型。

  4. 均方误差能够用不同的方式来改善,如提升训练样本、调节分类算法的阀值、应用更为复杂实体模型等。可是,这种改进方案可能会带来任何问题,如多重共线性、运算效率不高等。因而,必须实际应用中进行全面的衡量。

均方误差是一个重要的指标值,因为他可以反映实体模型针对正样本的识别能力。在一些应用领域下,如医疗诊断、欺诈检测等,针对正样本的识别能力很关键。假如模型均方误差太低,可能会致使误诊、漏验等严重危害。因而,在模型评估和选择的时候,必须充分考虑好几个指标值,并根据实际情景选择适合自己的实体模型。

本站是一个以CSS、JavaScript、Vue、HTML为中心的前端开发技术网址。我们的使命是为众多前端工程师者提供全方位、全方位、好用的前端工程师专业知识和技术服务。 在网站上,大家可以学到最新前端开发技术,掌握前端工程师最新发布的趋势和良好实践。大家提供大量实例教程和实例,让大家可以快速上手前端工程师的关键技术和程序。 本站还提供了一系列好用的工具软件,帮助你更高效地开展前端工程师工作中。公司提供的一种手段和软件都要经过精心策划和改进,能够帮助你节约时间精力,提高研发效率。 此外,本站还拥有一个有活力的小区,你可以在社区里与其它前端工程师者沟通交流技术性、交流经验、处理问题。我们坚信,街道的能量能够帮助你能够更好地进步与成长。 在网站上,大家可以寻找你需要的一切前端工程师网络资源,使您成为一名更加出色的网页开发者。欢迎你添加我们的大家庭,一起探索前端工程师的无限潜能!