如何解决PyTorch中BCELoss计算时输出NaN值的问题？

更新时间 2025-11-05

一、问题现象与根本原因

在使用PyTorch的BCELoss（二元交叉熵损失）时，开发者常会遇到损失值突然变为NaN的情况。这种情况通常发生在以下场景：

# 在模型输出后添加安全截断
pred = torch.clamp(model(input), 1e-7, 1-1e-7)
loss = criterion(pred, target)

这个组合函数内部自动处理数值稳定性问题：

criterion = nn.BCEWithLogitsLoss(pos_weight=pos_weight)
loss = criterion(logits, targets)  # 无需Sigmoid

交叉熵损失的数学表达式：

L = -[y·log(p) + (1-y)·log(1-p)]

当p→0或p→1时，log运算会产生无限大的梯度值，这是NaN产生的根本原因。

检查项	方法
梯度爆炸	`torch.isnan(grad).any()`
参数异常	Hook监控各层输出