| 层数 \(D\) | 新增范围 | 累积 RF | 典型代表 |
|---|---|---|---|
| 1 | \(+2\) | \(3\times 3\) | 单层 conv |
| 3 | \(+2\) | \(7\times 7\) | SRCNN(\(9{+}1{+}5\) 大核组合 ≈ \(13\)) |
| 10 | \(+2\) | \(21\times 21\) | 中等深度 |
| 20 | \(+2\) | \(41\times 41\) | VDSR ★ |
| N(3×3 层数) | 等效核 | \(N\cdot 3^2\cdot C^2\) | \((2N+1)^2\cdot C^2\) | 参数节省 | ReLU 个数 |
|---|---|---|---|---|---|
| N = 2 | 5×5 | \(18\,C^2\) | \(25\,C^2\) | −28% | 2 · vs · 1 |
| N = 3 | 7×7 | \(27\,C^2\) | \(49\,C^2\) | −45% | 3 · vs · 1 |
| N = 5 | 11×11 | \(45\,C^2\) | \(121\,C^2\) | −63% | 5 · vs · 1 |
| N = 20 · VDSR | 41×41 | \(180\,C^2\) | \(1681\,C^2\) | −89% | 19 · vs · 1 |
| 设计维度 | VGG 的设计(分类任务) | VDSR 怎么处理(SR 任务) | 判定 |
|---|---|---|---|
| 卷积核 | 所有卷积核 = 3×3,stride 1,pad 1 | 完全照搬 — 20 层全部 3×3·64 | ✓ 照搬 |
| 通道数 | 每个 max-pool 后通道翻倍 (64→128→256→512) | 改为全程 64 通道不变 — SR 不需要日益抽象的语义特征 | ✎ 简化 |
| 下采样 | 5 个 max-pool 层(空间分辨率 ÷ 32) | 完全去掉 — SR 需要保留像素级空间信息 | ✗ 去除 |
| 输出层 | 末端 3 个全连接层 (4096 / 4096 / 1000) | 完全去掉 — 末层 conv 直接输出整张残差图 | ✗ 去除 |
| 激活函数 | ReLU 激活,所有隐藏层 | 完全照搬 — 19 个 ReLU(layer 1 到 19 之后) | ✓ 照搬 |
| 归一化 | 不使用 LRN(VGG 4.1 节验证无效) | 同样不用 — 验证 VGG 的结论也适用于 SR | ✓ 照搬 |
| 边界处理 | 每层 conv 后 zero-padding (size 1) | 完全照搬 — 输入输出尺寸严格一致,边缘像素也能 SR | ✓ 照搬 |
| 权重初始化 | 深网先训浅网,再用浅网权重初始化深网 | 改用 He 初始化(专为 ReLU 设计),更简单 | ✎ 替换 |
| 卷积核变体 | 1×1 conv(配置 C 实验用,但 D 更好) | 不用 — 全 3×3 已经够强 | ✗ 不用 |
| 优化器 | SGD + momentum 0.9 | 完全照搬 — SGD + momentum 0.9 | ✓ 照搬 |
| 权重衰减 | L2 weight decay = 5e-4(batch 256) | 调小到 1e-4(1/5)· batch 64 — 配合 10× 学习率 | ✎ 调整 |
| Epoch | 10 | 20 | 40 | 80 |
|---|---|---|---|---|
| Residual | 36.90 | 36.64 | 37.12 | 37.05 |
| Non-Res | 27.42 | 19.59 | 31.38 | 35.66 |
| Δ | 9.48 | 17.05 | 5.74 | 1.39 |
| Epoch | 10 | 20 | 40 | 80 |
|---|---|---|---|---|
| Residual | 36.74 | 36.87 | 36.91 | 36.93 |
| Non-Res | 30.33 | 33.59 | 36.26 | 36.42 |
| Δ | 6.41 | 3.28 | 0.65 | 0.52 |
| Epoch | 10 | 20 | 40 | 80 |
|---|---|---|---|---|
| Residual | 36.31 | 36.46 | 36.52 | 36.52 |
| Non-Res | 33.97 | 35.08 | 36.11 | 36.11 |
| Δ | 2.35 | 1.38 | 0.42 | 0.40 |
| Test / Train | ×2 | ×3 | ×4 | ×2,3 | ×2,4 | ×3,4 | ×2,3,4 | Bicubic |
|---|---|---|---|---|---|---|---|---|
| ×2 | 37.10 | 30.05 | 28.13 | 37.09 | 37.03 | 32.43 | 37.06 | 33.66 |
| ×3 | 30.42 | 32.89 | 30.50 | 33.22 | 31.20 | 33.24 | 33.27 | 30.39 |
| ×4 | 28.43 | 28.73 | 30.84 | 28.70 | 30.86 | 30.94 | 30.95 | 28.42 |
| Dataset | Scale | Bicubic | A+ [22] | RFL [18] | SelfEx [11] | SRCNN [5] | VDSR (Ours) |
|---|---|---|---|---|---|---|---|
| PSNR/SSIM/time | PSNR/SSIM/time | PSNR/SSIM/time | PSNR/SSIM/time | PSNR/SSIM/time | PSNR/SSIM/time | ||
| Set5 | ×2 | 33.66/0.9299/0.00 | 36.54/0.9544/0.58 | 36.54/0.9537/0.63 | 36.49/0.9537/45.78 | 36.66/0.9542/2.19 | 37.53/0.9587/0.13 |
| ×3 | 30.39/0.8682/0.00 | 32.58/0.9088/0.32 | 32.43/0.9057/0.49 | 32.58/0.9093/33.44 | 32.75/0.9090/2.23 | 33.66/0.9213/0.13 | |
| ×4 | 28.42/0.8104/0.00 | 30.28/0.8603/0.24 | 30.14/0.8548/0.38 | 30.31/0.8619/29.18 | 30.48/0.8628/2.19 | 31.35/0.8838/0.12 | |
| Set14 | ×2 | 30.24/0.8688/0.00 | 32.28/0.9056/0.86 | 32.26/0.9040/1.13 | 32.22/0.9034/105.00 | 32.42/0.9063/4.32 | 33.03/0.9124/0.25 |
| ×3 | 27.55/0.7742/0.00 | 29.13/0.8188/0.56 | 29.05/0.8164/0.85 | 29.16/0.8196/74.69 | 29.28/0.8209/4.40 | 29.77/0.8314/0.26 | |
| ×4 | 26.00/0.7027/0.00 | 27.32/0.7491/0.38 | 27.24/0.7451/0.65 | 27.40/0.7518/65.08 | 27.49/0.7503/4.39 | 28.01/0.7674/0.25 | |
| B100 | ×2 | 29.56/0.8431/0.00 | 31.21/0.8863/0.59 | 31.16/0.8840/0.80 | 31.18/0.8855/60.09 | 31.36/0.8879/2.51 | 31.90/0.8960/0.16 |
| ×3 | 27.21/0.7385/0.00 | 28.29/0.7835/0.33 | 28.22/0.7806/0.62 | 28.29/0.7840/40.01 | 28.41/0.7863/2.58 | 28.82/0.7976/0.21 | |
| ×4 | 25.96/0.6675/0.00 | 26.82/0.7087/0.26 | 26.75/0.7054/0.48 | 26.84/0.7106/35.87 | 26.90/0.7101/2.51 | 27.29/0.7251/0.21 | |
| Urban100 | ×2 | 26.88/0.8403/0.00 | 29.20/0.8938/2.96 | 29.11/0.8904/3.62 | 29.54/0.8967/663.98 | 29.50/0.8946/22.12 | 30.76/0.9140/0.98 |
| ×3 | 24.46/0.7349/0.00 | 26.03/0.7973/1.67 | 25.86/0.7900/2.48 | 26.44/0.8088/473.60 | 26.24/0.7989/19.35 | 27.14/0.8279/1.08 | |
| ×4 | 23.14/0.6577/0.00 | 24.32/0.7183/1.21 | 24.19/0.7096/1.88 | 24.79/0.7374/394.40 | 24.52/0.7221/18.46 | 25.18/0.7524/1.06 |