常见的损失函数

如题所述

第1个回答 2022-06-24

MSE也称为L2 loss：

随着预测与真实值的绝对误差的增加，均方差损失呈二次方增加。

Huber Loss将L1和L2结合起来，也被称做smoothed L1 Loss。增加了一个需要额外设置的超参数，来控制L2和L1的连接位置。在误差接近0的时候使用L2，使损失函数可导，梯度更加稳定；误差较大的时候用L1，可以降低outlier带来的巨大误差的影响。

二分类中，通常使用Sigmoid函数将模型的输出压缩到(0, 1)区间。给定输入，模型判断为正类/负类的概率：

合并成一个：

取对数加负号之后，得到：

N是所有样本的数量。

图中曲线可以看出，当预测值越接近目标值损失越小，随着误差变差，损失呈现指数增长。

真实值现在是一个One-hot向量，Sigmoid换成了Softmax来把输出值压缩到(0, 1)之间，所有维度的输出和为1.

Softmax公式：

表示K个类别中的一个，k只在对应的类别上是1，其他时候是0。
于是上式可以改写成：

是样本的目标类。

分类问题中为什么不用MSE? 因为MSE假设了误差服从高斯分布，在分类任务下这个假设无法满足，因此效果会很差。

第二个论点是从信息论的角度来分析的，是关于由KL散度的角度来推导Cross Entropy的过程（原文）

是另一种二分类损失函数，适用于Maximum-margin的分类，SVM的损失函数就是hinge loss + L2正则化

下图为，当y为正类的时候( )，不同的输出对应的loss图

当y为正类时，模型输出负值会有很大的惩罚。即使输出为正值在(0, 1)区间，也还是会有一个较小的惩罚。也就是只有置信度高的才会有零损失。使用hinge loss直觉上的理解是要找到一个决策边界，使得素有数据点被这个边界正确地，高置信度地被分类。
同时hinge loss也反应了一点，对于那些已经可以被很好分类的样本，它不再对loss产生贡献，可以让模型花更多的energy去学习难以分类的样本。

https://zhuanlan.zhihu.com/p/77686118

相似回答

常用的损失函数有哪些答：常见的损失函数有以下几种：0-1损失函数是最为简单的一种损失函数，多适用于分类问题中，如果预测值与目标值不相等，说明预测错误，输出值为1；如果预测值与目标值相同，说明预测正确，输出为0，言外之意没有损失。其数学公式可表示为：由于0-1损失函数过于理想化、严格化，且数学性质不是很好，难以...

机器学习中的损失函数答：三、指数损失函数（Adaboost）学过Adaboost算法的人都知道，它是前向分步加法算法的特例，是一个加和模型，损失函数就是指数函数。在Adaboost中，经过m此迭代之后，可以得到:Adaboost每次迭代时的目的是为了找到最小化下列式子时的参数和G：而指数损失函数(exp-loss）的标准形式如下可以看出，Adaboost...

常见损失函数汇总答：在机器学习的殿堂中，损失函数、代价函数和目标函数如同建筑师的灵魂，它们精准地衡量模型的预测与现实世界的契合度。让我们一一探索这些关键组件，从基本的MSE（均方误差）和MAE（平均绝对误差）出发，到更为复杂的Huber Loss、交叉熵，再到专门解决特定问题的Focal Loss。首先，MSE以其快速收敛的特性赢得青...

m估计器作用答：常见的损失函数包括绝对值损失函数（absolute loss function）和平方损失函数（squared loss function），还有一些其他的权重函数。以线性回归为例，通过最小二乘法可以得到一个普通最小二乘估计（Ordinary Least Squares，OLS）。但是，当数据中存在离群值时，OLS估计受到离群值的影响较大，估计的参数可能会...

反向传播算法的基本思想答：在反向传播算法中，我们需要定义一个损失函数来衡量网络输出与真实值之间的差距。常见的损失函数有均方差、交叉熵等。损失函数的选择取决于具体的问题和网络结构。三、反向传播过程反向传播是基于链式法则对网络中的权重进行更新的过程。首先，根据损失函数计算输出误差。然后，将输出误差从输出层向隐藏层逐...

经验风险,结构风险,损失函数答：期望损失：对于统计机器学习中常见的联合概率分布P(X,Y)学习任务，模型f(X)关于联合分布P(X,Y)的平均损失可以用损失函数的期望表示：这是理论上模型f(X)关于联合分布P(X,Y)的平均意义下的损失，称为风险函数或期望损失。学习的目标就是选择期望风险最小的模型。

深度学习损失函数答：2、定义损失函数L(x, y | theta)；3、误差信号back propagation。采用数学理论中的“链式法则”，求L(x, y | theta)关于参数theta的梯度；4、利用最优化方法（比如随机梯度下降法），进行参数更新；5、重复步骤3、4，直到收敛为止；在第2步中，我们通常会见到多种损失函数的定义方法，常见的有均方...

大家正在搜

常用的损失函数有哪些四种常见损失函数表达式常见的损失函数表达式分类常用的损失函数 MASE损失函数指数损失函数怎么理解平方损失函数 l2损失函数神经网络中常用的损失函数