Skip to content

thdlrt CsNotes

神经网络架构与技术

thdlrt CsNotes

Home
其他内容
其他内容
- Web开发（前后端）
  Web开发（前后端）
  - 前端
    前端
    
    html
    
    Js
    
    Ts
    
    扩展补充
    
    工具
    工具
    
    PostMan中文文档
    
    Webpack
    
    库&框架
    库&框架
    
    Vue
    
    组件
    组件
    
    Apache ECharts
    
    Elementplus
    
    Gsap动画库
    
    Vueuse
    
    Windycss
  - 后端
    后端
    
    Nodejs
  - 数据
    数据
    
    SQL基本语法
    
    NoSQL
    NoSQL
    
    MongoDB
    
    Redis
    
    关系数据库
    关系数据库
    
    MySQL
    
    Data
    Data
    
    MySQL卸载文档 Windows版
    
    MySQL安装
    
    大数据
    大数据
    
    海量数据处理
    
    Hadoop
    Hadoop
    
    HBase
    
    Google MapReduce
    
    Hive
    
    NoSQL
    
    Spark
    
    云计算
    
    大数据概述
  - 网络安全
    网络安全
    
    SQL注入
- 人工智能
  人工智能
  - Pytorch
  - 动手学深度学习
  - 机器学习理论基础
  - 神经网络架构与技术神经网络架构与技术
    Table of contents
    
    网络结构图
    
    常见网络架构
    
    上/下采样金字塔 Encoder–Decoder
    
    长短程跳跃连接
    
    具体实现
    
    U-Net
    
    常见技术
    
    上下采样
    
    像素重排 PixelShuffle
    
    融合
    
    通道拼接 Concat
    
    逐元素相加 Add
  - 实验
    实验
    
    训练框架使用
- 代码质量
  代码质量
  - 重构改善既有代码的设计
- 游戏开发&图形学
  游戏开发&图形学
  - Lua
    Lua
    
    Xlua
  - 游戏开发
    游戏开发
    
    八股
    
    性能优化
    
    游戏安全
    
    游戏设计
    
    网络联机
    
    游戏客户端
    游戏客户端
    
    LibGDX
    
    Cocos
    
    Unreal
    
    Unity
    Unity
    
    Unity URP
    
    C#
    
    fairyGui(UnitySDK)
    
    Unity基础
    
    Unity资源管理
    
    插件
    插件
    
    In game Debug Console
    
    Spine 2D骨骼动画
    
    使用UnityYamlMerge处理冲突
    
    游戏引擎
    游戏引擎
    
    Games104游戏引擎
    
    游戏设计
    游戏设计
    
    信息
    信息
    
    信息整理
  - 计算机图形学
    计算机图形学
    
    API编程
    API编程
    
    Opengl
    Opengl
    
    learnOpengl&glsl
    
    Pyopengl
    
    Shader
    Shader
    
    shaderToy学习
    
    unity shader（HLSL）
    
    三维重建
    三维重建
    
    笔记
    
    专题
    专题
    
    超分插帧
    超分插帧
    
    开源算法
    开源算法
    
    FSR
    FSR
    
    FSR
    
    GSR
    GSR
    
    GSR
    
    经典算法
    经典算法
    
    TAA
    
    图形学基础
    图形学基础
    
    光栅化
    
    光线追踪
    
    几何
    
    动画
    
    材质
    
    线性代数与变换
    
    实验
    实验
    
    Tinyraytracer
    
    Tinyrender
    
    杂项
    杂项
    
    后处理
    
    结果评价
    
    课程
    课程
    
    Games202高质量实时渲染
  - 阅读
    阅读
    
    实时渲染第四版
- 移动端开发
  移动端开发
  - 安卓
    安卓
    
    Android
    
    Kotlin
  - 鸿蒙
    鸿蒙
    
    ArkTS
    
    界面开发
- 软件工程
  软件工程
  - Uml
  - 设计模式
  - 项目管理
  - 编程思想与规范
    编程思想与规范
    
    代码规范
    
    并发编程
    
    抽象ADT
    
    文档
    
    编程思想
    
    调试
  - 软件测试
    软件测试
    
    测试
学校课程
学校课程
- 归档课程
  归档课程
  - 金融机构
  - 金融经济学
  - 公司金融学
    公司金融学
    
    复习题2023
    
    期末复习
  - 大数据
    大数据
    
    期末复习
    
    作业
    作业
    
    P1
    
    P10
    
    P2
    
    P3
    
    P4
    
    P5
    
    P6
    
    P7
    
    P8
    
    P9
    
    实验
    实验
    
    P1
    
    P2
    
    P3
    
    P4
    
    笔记
    笔记
    
    HBase
    
    Google MapReduce
    
    Hive
    
    NoSQL
    
    Spark
    
    云计算
    
    大数据概述
  - 操作系统
    操作系统
    
    实验笔记
    
    操作系统
    
    代码
    代码
    
    Cv sem
    Cv sem
    
    Index
    
    Fish
    Fish
    
    Index
    
    Os model
    Os model
    
    Index
    
    Thread lib
    Thread lib
    
    Index
    
    笔记
    笔记
    
    并发
    
    持久化
    
    绪论
    
    虚拟化
    
    补充
  - 数字逻辑与计算机组成
    数字逻辑与计算机组成
    
    Logisim
    
    数字逻辑与计算机组成
    
    作业
    作业
    
    P1
    
    P2
    
    P3
    
    P4
    
    P5
    
    P7
    
    P8
    
    实验报告
    实验报告
    
    P1
    
    P2
    
    P3
    
    P4
    
    P5
    
    P6
    
    笔记
    笔记
    
    U1二进制编码
    
    数字逻辑电路基础
    
    U3组合逻辑电路
    
    U4时序逻辑电路
    
    U6 运算
    
    U7 指令系统
    
    U8 中央处理器
  - 数据结构
    数据结构
    
    数据结构
    
    作业
    作业
    
    P1
    
    P2
    
    P3
    
    P4
    
    P5
    
    P6
    
    P7
    
    笔记
    笔记
    
    图
    
    排序
    
    搜索结构
    
    文件系统
    
    树
    
    线性数据结构
  - 编译原理
    编译原理
    
    编译原理
    
    作业
    作业
    
    P1
    
    P10
    
    P11
    
    P12
    
    P13
    
    P2
    
    P3
    
    P4
    
    P5
    
    P6
    
    P7
    
    P8
    
    P9
    
    答案
    答案
    
    Dragon book exercise answers master
    Dragon book exercise answers master
    
    Compilers Principles, Techniques, & Tools (purple dragon book) second edition exercise answers
    
    Ch01
    Ch01
    
    1.1
    1.1
    
    Exercises for Section 1.1
    
    1.3
    1.3
    
    Exercises for Section 1.3
    
    1.6
    1.6
    
    Exercises for Section 1.6
    
    Ch02
    Ch02
    
    2.2
    2.2
    
    Exercises for Section 2.2
    
    2.3
    2.3
    
    2.3 Exercises for Section 2.3
    
    2.4
    2.4
    
    2.4
    
    2.6
    2.6
    
    Exercises for Section 2.6
    
    2.8
    2.8
    
    Exercises for Section 2.8
    
    Key point
    Key point
    
    第2章要点
    
    Ch03
    Ch03
    
    3.1
    3.1
    
    Exercises for Section 3.1
    
    3.3
    3.3
    
    Exercises for Section 3.3
    
    3.4
    3.4
    
    3.4 节的练习
    
    3.5
    3.5
    
    Exercises for Section 3.5
    
    3.6
    3.6
    
    3.6 Exercises for Section 3.6
    
    3.7
    3.7
    
    Exercises for Section 3.7
    
    3.8
    3.8
    
    Exercises for Section 3.8
    
    3.9
    3.9
    
    Exercises for Section 3.9
    
    Key point
    Key point
    
    第3章要点
    
    Ch04
    Ch04
    
    4.2
    4.2
    
    Exercises for Section 4.2
    
    4.3
    4.3
    
    4.3 节的练习
    
    4.4
    4.4
    
    4.4 节的练习
    
    4.5
    4.5
    
    4.5 节的练习
    
    4.6
    4.6
    
    4.6 节的练习
    
    4.7
    4.7
    
    4.7 节的练习
    
    Key point
    Key point
    
    第4章要点
    
    Ch05
    Ch05
    
    5.1
    5.1
    
    5.1 节的练习
    
    5.2
    5.2
    
    5.2 节的练习
    
    5.3
    5.3
    
    5.3 节的练习
    
    5.4
    5.4
    
    5.4 节的练习
    
    5.5
    5.5
    
    5.5 节的练习
    
    Ch06
    Ch06
    
    6.1
    6.1
    
    6.1 节的练习
    
    6.2
    6.2
    
    6.2 节的练习
    
    6.3
    6.3
    
    6.3 节的练习
    
    6.4
    6.4
    
    6.4 节的练习
    
    6.5
    6.5
    
    6.5 节的练习
    
    6.6
    6.6
    
    6.6 节的练习
    
    6.7
    6.7
    
    6.7 节的练习
    
    Ch07
    Ch07
    
    7.2
    7.2
    
    Exercises for Section 7.2
    
    7.3
    7.3
    
    Exercises for Section 7.3
    
    7.4
    7.4
    
    Exercises for Section 7.4
    
    7.5
    7.5
    
    Exercises for Section 7.5
    
    7.6
    7.6
    
    Exercises for Section 7.6
    
    7.7
    7.7
    
    Exercises for Section 7.7
    
    Ch08
    Ch08
    
    8.2
    8.2
    
    Exercises for Section 8.2
    
    8.3
    8.3
    
    Exercises for Section 8.3
    
    8.4
    8.4
    
    Exercises for Section 8.4
    
    8.5
    8.5
    
    Exercises for Section 8.5
    
    Ch12
    Ch12
    
    12.3
    12.3
    
    Exercises for Section 12.3
    
    12.7
    12.7
    
    Exercises for Section 12.7
    
    实验
    实验
    
    实验笔记(编译工具的使用)
    
    笔记
    笔记
    
    中间代码生成
    
    代码生成
    
    引论
    
    机器无关优化
    
    词法分析
    
    语法分析
    
    语法制导的编译技术
    
    运行时刻环境
    
    题目
    题目
    
    往年题
  - 计算机系统基础
    计算机系统基础
    
    期末
    
    目录
    
    Data
    Data
    
    2
    
    3
    
    4
    
    6
    
    7
    
    8
    
    作业
    作业
    
    U2
    
    U3
    
    U4
    
    U6
    
    U7
    
    U8
    
    实验
    实验
    
    实验笔记
    
    实验手册
    实验手册
    
    计算机系统基础 PA 实验指导 (for NJU students)
    
    Ch
    Ch
    
    Ch ack
    
    附录A. I386手册勘误
    
    附录B. Git入门教程
    
    ch appendix C local vm
    
    Ch pa 0 setup
    
    PA 1-1 数据在计算机内的存储
    
    PA 1-2 整数的表示、存储和运算
    
    PA 1-3 浮点数的表示和运算
    
    PA 2-1 指令解码与执行
    
    PA 2-2 装载ELF文件
    
    PA 2-3 可选任务：完善调试器
    
    PA 3-1 Cache的模拟
    
    PA 3-2 保护模式
    
    PA 3-3 分页机制 & 虚拟地址转换
    
    PA 4-0 SSH和X11转发配置说明
    
    PA 4-1 异常和中断的响应
    
    PA 4-2 外设与I/O
    
    PA 4-3 可选任务：游戏移植
    
    实验报告
    实验报告
    
    Pa2
    
    pa3-1
    
    pa3-2
    
    pa3-3
    
    pa4-1
    
    pa4-1
    
    PA-1实验报告
  - 计算机网络
    计算机网络
    
    目录
    
    重点
    
    Data
    Data
    
    传输层
    
    应用层
    
    网络安全
    
    网络层
    
    链路层
    
    作业
    作业
    
    作业七
    
    作业三
    
    作业五
    
    作业六
    
    作业四
    
    实验
    实验
    
    实验笔记
    
    实验报告
    实验报告
    
    南京大学本科生实验报告
    
    南京大学本科生实验报告
    
    南京大学本科生实验报告
    
    南京大学本科生实验报告
    
    南京大学本科生实验报告
    
    南京大学本科生实验报告
  - 软件体系结构
    软件体系结构
    
    软件体系结构(Spring)
    
    笔记
    笔记
    
    Spring
    
    SpringBoot
    
    可扩展
    
    微服务SpringCloud
    
    SSM
    SSM
    
    SpringMVC
  - 软件工程
    软件工程
    
    笔记
    
    重点
  - 金融工程学
    金融工程学
    
    作业
    
    金融经济学背诵部分
    
    笔记
  - 金融风险管理
    金融风险管理
    
    笔记
  - 高级程序设计
    高级程序设计
    
    面向对象
技能&工具
技能&工具
- Git
  Git
  - Git
  - Github
- Latex
  Latex
  - Latex template
  - 数学语法
- Linux与shell
  Linux与shell
  - Shell编程
  - linux
  - vim
  - 八股
  - Linux
    Linux
    
    文件系统
    
    文本处理
    
    日志系统
    
    权限管理
    
    环境配置
    
    网络
    
    进程管理
- Pc日常
  Pc日常
  - 数据备份
    数据备份
    
    数据备份
    
    数据迁移更换硬盘
- Vscode
  Vscode
  - 运行配置
- 实用工具
  实用工具
  - vscode
  - Scoop
- 折腾
  折腾
- 杂项
  杂项
- 构建&编译&调试
  构建&编译&调试
  - C++
  - Java
  - Makefile
- 虚拟化
  虚拟化
  - Docker
  - Vms
知识点（保研&工作）
知识点（保研&工作）
- 保研
  保研
  - 数学
    数学
    
    概率论
    
    离散数学
    
    线性代数
  - 机试
    机试
    
    使用 VSCode 编写 C++ 单文件程序 (Windows 系统).md · main · 田昊东 / NJUCS-BAOYAN · GitLab
    
    笔记
  - 笔试
    笔试
    
    simpread 南京大学计院夏令营历年机试笔试题汇总（刷题版）南京大学计算机夏令营笔试 CSDN 博客
    
    补充习题
    补充习题
    
    Linux 操作系统期末考试试题及答案 - 选择题_linux 操作系统题库及答案 - CSDN 博客
    
    离散数学
    
    编译原理期末复习题 (选择)_编译原理选择题 - CSDN 博客
    
    软件工程期末考试题库（超全）_软件工程题库 - CSDN 博客
  - 计算机科学
    计算机科学
    
    操作系统
    
    数据结构与算法
    
    编译原理
    
    补充
    
    计算机组成原理
    
    计算机网络
  - 面试
    面试
    
    Simpread 2022 南大 cs 夏令营笔试面试准备
    
    问题
    
    英语
    英语
    
    【英语】问题准备
    
    相关词汇
- 工作
  工作
  - 知识图谱
  - 计算机科学
    计算机科学
    
    并发编程
    
    杂项
    
    计算机图形学
    
    计算机网络
  - 面试技巧
    面试技巧
    
    HR面
    
    职责
算法竞赛
算法竞赛
编程语言
编程语言
- C++
  C++
  - C++Primer
  - 面向对象
  - 八股
  - 库
    库
    
    线性代数engin
  - 笔记（整理前）
    笔记（整理前）
    
    1
    
    10
    
    11
    
    12
    
    13
    
    14
    
    15
    
    16
    
    2
    
    3
    
    4
    
    5
    
    6
    
    7
    
    8
    
    9
- Java
  Java
  - Java基础
  - 八股
  - javaWeb
    javaWeb
    
    JDBC
    
    Kafka
  - Java基础
    Java基础
    
    Util
    Util
    
    Math类
    
    日志
    
    时间类
    
    集合
    集合
    
    Collections工具类
    
    Iterator
    
    Io
    Io
    
    NIO
    
    控制台IO
    
    文件
    
    旧IO
    
    网络编程
    
    并发编程
    并发编程
    
    基本概念
    
    异常处理
    
    线程与线程池
    
    线程安全的数据类型
    
    高级
    
    数据类型
    数据类型
    
    基本数据类型与包装类
    
    字符串
    
    拷贝与引用
    
    数组类型
    
    枚举类型
    
    流
    
    杂项
    杂项
    
    Javadoc
    
    Java编码规范
    
    equals()与hashCode()
    
    Final
    
    函数式编程
    
    包
    
    反射
    
    异常
    
    泛型
    
    注解
    
    测试
    
    流程控制
    流程控制
    
    Switch
    
    面向对象
    面向对象
    
    内部类
    
    接口
    
    构造方法
    
    高级
    高级
    
    Record记录
    
    代理模式
    
    使用享元自定义Collecction和Map
    
    序列化与反序列化
  - 工具
    工具
    
    Maven&gradle
    
    Jvm
    
    Lombok
    
    环境配置与命令
- Python
  Python
  - 基本语法
  - 并发编程
  - 工具
    工具
    
    Conda
    
    Jupyter
    
    打包发布
  - 应用
    应用
    
    爬虫
  - 拓展包
    拓展包
    
    Pyqt
    
    数据分析库
论文研读
论文研读
- 超分插帧
  超分插帧
  - 超分插针融合
    超分插针融合
    
    ExtraSS A Framework for Joint Spatial Super Sampling and Frame Extrapolation
    
    实验

神经网络架构与技术

网络结构图¶

常见网络架构¶

上/下采样金字塔 Encoder–Decoder¶

编码端逐级下采样扩大感受野与抽象语义；解码端逐级上采样恢复空间分辨率
典型形状：逐级等比变化
- 编码：长宽减少，通道升高
- 解码：通道减少，长宽增加
优点
- 语义与细节的平衡：深层有全局上下文，浅层保留局部边界；金字塔汇聚多尺度信息。
- 计算可控：大部分重计算发生在低分辨率层。

长短程跳跃连接¶

短程跳跃连接
- 典型形态：块内的输出直接加到块内的输出
- 通常跨越很浅的层/一个残差块（2–3 个卷积层）
- 解决退化/梯度消失：深层网络训练难，恒等映射更易学；残差把学习目标从“映射”转为“残差”，优化曲面更平滑。
- 信息保真：保留低频/主成分，F(x) 只需补充高频/细节，提升收敛与泛化。
长程跳跃连接
- 典型形态：编码器早期的高分辨率特征，与解码器后期对应分辨率的特征融合
- 跨越多层/多个stage，连接网络的“远端”部分
- 多尺度与定位：编码器越深，语义更强但空间分辨率下降；把浅层的高分辨率边界/纹理特征送到解码端，可恢复精确定位。
- 梯度捷径：为早期层提供远端监督信号的“捷径”，缓解深层梯度衰减。
t 跳跃后可用 add、concat 等策略进行叠加

具体实现¶

U-Net¶

一种编码器——解码器式的卷积神经网络架构 - U 型架构：左侧编码器逐步下采样取高层语义，右侧解码器逐步上采样回复空间分辨率，并通过跳跃连接把编码器对应层的特征拼接到解码器 - 一种编码器-解码器金字塔+长程跳连架构 - 是金字塔模型的一种具体实现架构

常见技术¶

上下采样¶

最简单的方法就是：卷积/池化（下采样）+最近邻/双线性（上采样）

像素重排 PixelShuffle¶

Space-to-Depth / Depth-to-Space（像素重排，S 2 D/D 2 S）
S 2 D：把相邻 r×r 的空间邻域重排到通道维，相当于“降分辨率、升通道”的可逆重排操作。
D 2 S：反操作，又称 PixelShuffle，把通道里的亚像素信息还原到更高分辨率的空间网格。
形状变化
- 输入: (B, C, H, W)
- S 2 D (r): (B, C·r², H/r, W/r)
- D 2 S (r): (B, C/(r²), H·r, W·r)
r=2 的示意图
pytorch 提供了内置实现 nn.PixelUnshuffle(r), nn.PixelShuffle(r)
优势
- 计算效率：把大分辨率问题转为低分辨率高通道，后续卷积算力更省。（\(n^2\to n\)）
- 细节表达：将亚像素信息编码到通道，利于网络学习超分与抗走样。
- 可逆无损：与插值不同，重排不丢信息，端到端可微。

融合¶

通道拼接 Concat¶

把两个特征在通道维拼到一起，信息保留更加完整，后续通过卷积融合
(B, C1, H, W) || (B, C2, H, W) → (B, C1+C2, H, W)
优点：保留完整信息，利于细节；
缺点：通道数变大、算力和显存上升。

逐元素相加 Add¶

要求融合的两张向量形状一致，直接叠加特征
(B, C, H, W) + (B, C, H, W) → (B, C, H, W)
优点：轻量稳定，便于残差学习；
缺点：可能压掉差异性，信息融合更“保守”。