结果评价
图像与视频质量评估
PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)
- PSNR 用于衡量重建图像或视频帧与参考图像在像素级的相似度。它基于图像的均方误差(MSE) 计算,表示信号(原始图像)与噪声(重建图像误差)的比值。
- \(\mathrm{PSNR}=10\cdot\log_{10}\left(\frac{MAX^2}{\mathrm{MSE}}\right)\)
- MAX:像素值的最大可能值(对于 8 位图像,通常是 255)。
- \(\mathrm{MSE}=\frac1{M\cdot N}\sum_{i=1}^M\sum_{j=1}^N\left[I(i,j)-K(i,j)\right]^2\)
- \(I(i,j)\):原始图像的像素值。
- \(K(i,j)\):生成图像的像素值。
- \(M, N\):图像的宽度和高度。
- 特点
- 值越大,表示生成图像与参考图像越接近,质量越好。
- 对细节变化不敏感。例如,PSNR 对人眼感知的纹理、边缘等质量变化的反映有限。
- 更适合评估整体误差,而非局部质量。
SSIM(Structural Similarity Index, 结构相似性)
- SSIM 是一种衡量图像质量的感知指标,专注于模拟人眼对图像结构的感知能力。它通过比较亮度、对比度和结构信息来评估生成图像与参考图像的相似性。
- \(\mathrm{SSIM}(x,y)=\frac{(2\mu_x\mu_y+C_1)(2\sigma_{xy}+C_2)}{(\mu_x^2+\mu_y^2+C_1)(\sigma_x^2+\sigma_y^2+C_2)}\)
- \(x\) 和 \(y\):参考图像和生成图像。
- \(\mu_x, \mu_y\):\(x\) 和 \(y\) 的平均值(亮度)。
- \(\sigma_x^2, \sigma_y^2\):\(x\) 和 \(y\) 的方差(对比度)。
- \(\sigma_{xy}\):\(x\) 和 \(y\) 的协方差(结构相似性)。
- \(C_1, C_2\):为了稳定计算而加入的小常数,通常设置为:
- \(C_1 = (K_1 \cdot L)^2\)
- \(C_2 = (K_2 \cdot L)^2\)
- \(L\) 是像素值的动态范围,\(K_1\) 和 \(K_2\) 是小常数(如 \(K_1=0.01, K_2=0.03\))。
- 特点
- SSIM 值在 [0, 1] 之间,值越接近 1,表示图像质量越高。
- 更关注图像的结构、纹理、边缘等局部信息。
- 更贴近人眼的主观感知。但是计算复杂度较高