import numpy as np
from sklearn.metrics import log_loss
from sklearn.preprocessing import LabelBinarizer
from math import log

# 三个样本对应的标签
# 这里指三幅图像分别对应着数值3、数字6、数字8
y_true = ['3', '6', '8']
# 预测值,这里使用softmax处理过了。所有概率和为0
# 例如:第一行对应着第一张图像的识别结果:0.1+0.3+0.6+一堆0=1
# 第2行:0.2+0.5+0.3+一堆0=1
# 第3行:0.3+0.5+0.2+一堆0=1
y_pred = [[0.1, 0, 0.3, 0.6, 0, 0, 0, 0, 0, 0],
[0, 0, 0.2, 0, 0, 0, 0.5, 0, 0.3, 0],
[0, 0.3, 0, 0, 0.5, 0, 0, 0, 0.2, 0]
# 标签对应的值(识别数字)
labels = ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']

# 方法0:手算
# 方法0:手算
# =============================================================================
# 真实值one-hot编码
t = [[0, 0, 0, 1, 0, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0, 1, 0, 0, 0],
[0, 0, 0, 0, 0, 0, 0, 0, 1, 0]]
y = np.array(y_pred) # 样本预测值
# 面临问题:log(0)为负无穷大,导致后续无法计算。
# 解决方案:将log(0)处理为一个log(接近零)
y[y < 1e-15] = 1e-15
Loss = 0
for i in range(3): # 逐个遍历样本
for k in range(10): # 逐个遍历标签
# 计算对应位置上的真实值*log(预测值)
Loss -= t[i][k] * log(y[i][k])
Loss /= 3
print("自定义的交叉熵:", Loss)

# 不用循环的可以改进计算:
# a = -np.multiply(t, np.log(y))
# print("自定义的交叉熵:",sum(map(sum, a))/3)
# 不用循环的可以改进计算:
# a = -np.multiply(t, np.log(y))
# print("自定义的交叉熵:",sum(map(sum, a))/3)
# =============================================================================

# =============================================================================
# 逐个处理也可以
# for i in range(3): # 逐个遍历样本
# for k in range(10): # 逐个遍历标签
# delta = 1e-15 # 控制值
# if y[i][k] < delta:
# y[i][k] = delta
# =============================================================================

# 方法1:使用sklearn计算
# 方法1:使用sklearn计算
# =============================================================================
# 说明:
# 传递给sklearn的y_true = ['3', '6', '8']
# 会根据参数【labels】被识别为one-hot形式。
# [[0 0 0 1 0 0 0 0 0 0]
# [0 0 0 0 0 0 1 0 0 0]
# [0 0 0 0 0 0 0 0 1 0]]

sk_log_loss = log_loss(y_true, y_pred, labels=labels)
print("sklearn交叉熵:", sk_log_loss)

# 方法2:自定义函数形式
# 方法2:自定义函数形式
# =============================================================================
def lilizong():
# 将样本标签处理为one-hot形式
lb = LabelBinarizer()
transformed_labels = lb.transform(y_true)
# transformed_labels值为:
# [[0 0 0 1 0 0 0 0 0 0]
# [0 0 0 0 0 0 1 0 0 0]
# [0 0 0 0 0 0 0 0 1 0]]
# 计算样本个数、标签个数
sn = len(y_true) # 样本个数
ln = len(labels) # 标签个数
# 初始化值
# log(0)为无穷大,这样一来,后续无法计算
# 保护性对策:添加一个极小值δ,防止负无限大的发生
delta = 1e-15 # 控制值
Loss = 0 # 损失值初始化
# 循环遍历
for i in range(sn): # 逐个遍历样本
for k in range(ln): # 逐个遍历标签
if y_pred[i][k] < delta:
y_pred[i][k] = delta
if y_pred[i][k] > 1-delta:
y_pred[i][k] = 1-delta
# 计算对应位置上的真实值*log(预测值)
Loss -= transformed_labels[i][k]*log(y_pred[i][k])
Loss /= sn
return Loss
# 调用自定义函数
print("自定义的交叉熵:", lilizong())

# =============================================================================
# 参考资料1:sklearn官网说明
# =============================================================================
# https://scikit-learn.org/stable/modules/model_evaluation.html#log-loss

# =============================================================================
# 参考资料2:sklearn中log_loss源代码
# =============================================================================
# https://github.com/scikit-learn/scikit-learn/blob/ed5e127b/sklearn/metrics/classification.py#L1576

