Skip to content

结果评价

图像与视频质量评估

PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)

  • PSNR 用于衡量重建图像或视频帧与参考图像在像素级的相似度。它基于图像的均方误差(MSE) 计算,表示信号(原始图像)与噪声(重建图像误差)的比值。
  • \(\mathrm{PSNR}=10\cdot\log_{10}\left(\frac{MAX^2}{\mathrm{MSE}}\right)\)
    • MAX:像素值的最大可能值(对于 8 位图像,通常是 255)。
    • \(\mathrm{MSE}=\frac1{M\cdot N}\sum_{i=1}^M\sum_{j=1}^N\left[I(i,j)-K(i,j)\right]^2\)
    • \(I(i,j)\):原始图像的像素值。
    • \(K(i,j)\):生成图像的像素值。
    • \(M, N\):图像的宽度和高度。
  • 特点
    • 值越大,表示生成图像与参考图像越接近,质量越好。
    • 对细节变化不敏感。例如,PSNR 对人眼感知的纹理、边缘等质量变化的反映有限。
    • 更适合评估整体误差,而非局部质量。

SSIM(Structural Similarity Index, 结构相似性)

  • SSIM 是一种衡量图像质量的感知指标,专注于模拟人眼对图像结构的感知能力。它通过比较亮度、对比度和结构信息来评估生成图像与参考图像的相似性。
  • \(\mathrm{SSIM}(x,y)=\frac{(2\mu_x\mu_y+C_1)(2\sigma_{xy}+C_2)}{(\mu_x^2+\mu_y^2+C_1)(\sigma_x^2+\sigma_y^2+C_2)}\)
    • \(x\)\(y\):参考图像和生成图像。
    • \(\mu_x, \mu_y\)\(x\)\(y\) 的平均值(亮度)。
    • \(\sigma_x^2, \sigma_y^2\)\(x\)\(y\) 的方差(对比度)。
    • \(\sigma_{xy}\)\(x\)\(y\) 的协方差(结构相似性)。
    • \(C_1, C_2\):为了稳定计算而加入的小常数,通常设置为:
      • \(C_1 = (K_1 \cdot L)^2\)
      • \(C_2 = (K_2 \cdot L)^2\)
      • \(L\) 是像素值的动态范围,\(K_1\)\(K_2\) 是小常数(如 \(K_1=0.01, K_2=0.03\))。
  • 特点
    • SSIM 值在 [0, 1] 之间,值越接近 1,表示图像质量越高。
    • 更关注图像的结构、纹理、边缘等局部信息。
    • 更贴近人眼的主观感知。但是计算复杂度较高