【深度学习每日小知识】Logistic Loss 逻辑回归：损失和正则化

2024-01-09 13:28:44

逻辑回归的损失函数

线性回归的损失函数是平方损失。逻辑回归的损失函数是对数损失，定义如下：

$LogLoss=\sum_{(x,y)\in D}-y\log(y')-(1-y)\log(1-y')$

其中：

$(x,y)\in D$ 是包含许多有标签样本（即成对数据集）的数据集。 $(x,y)\in D$
$y$ 是有标签样本中的标签。由于这是逻辑回归，因此
的每个 $y$ 值都必须是 0 或 1。
$y^{'}$ 是针对 $x$ 中的一组特征的预测值（介于 0 和 1 之间）。

逻辑回归中的正则化

正则化在逻辑回归建模中极其重要。如果不进行正则化，高逻辑维度下的逻辑回归的渐近性会不断促使损失接近 0。因此，大多数逻辑回归模型都使用以下两种策略之一来降低模型复杂性：

L2 正则化。
早停法，即限制训练步数或学习速率。

（我们将在后续中讨论第三个策略，即 L1 正则化。）

假设您为每个示例分配一个唯一 ID，并将每个 ID 映射到其自己的特征。如果您不指定正则化函数，模型将完全过拟合。这是因为模型会尝试在所有样本上将损失降低为零，并且永远无法实现，从而将每个指示器特征的权重提高至 +无穷大或-无穷大。当有大量罕见的交叉时，仅在一个样本上发生，就会出现包含特征组合的高维度数据。

幸运的是，使用 $L_2$ 或早停法可以防止此问题出现。

AI插图

在这里插入图片描述
这是对逻辑回归中对数损失函数的可视化。图中展示了两条曲线：一条表示当预测值接近实际值时的损失，另一条表示当预测值远离实际值时的损失。X轴代表预测概率，Y轴代表损失。不同颜色的曲线和图例有助于区分这两种情况。

接下来，我将生成展示正则化效果的图像。

在这里插入图片描述

文章来源:https://blog.csdn.net/jcfszxc/article/details/135447706
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！