渲染流水线

渲染流水线的工作任务是：将三维场景里的物体投到屏幕上，生成一张二维图像。
可分为三个阶段：应用阶段、几何阶段、光栅化阶段。

应用阶段
CPU负责的阶段，应用主导，开发者有绝对的控制权，主要有三个任务：
- 准备好场景数据
- 不可见物体剔除，提高渲染性能
- 设置好每个模型的渲染状态，如：材质、纹理、Shader等
该阶段最重要的输出是渲染图元，如：点、线、三角面等，会被传递到下一个有GPU负责的阶段——几何阶段。
几何阶段
GPU负责的阶段，与每个渲染图元打交道，将三维空间的顶点数据转换到屏幕空间中，再将转换后的数据交给下一个阶段——光栅化阶段处理。关键词：逐顶点。
光栅化阶段
GPU负责的阶段，从上一阶段接过图元在屏幕空间的数据，差值计算后，决定图元里哪些像素会被绘制到屏幕中、被绘制成什么颜色。关键词：逐像素。

CPU和GPU之间的通信

应用阶段的三个阶段：

把数据加载到显存
数据加载到显存后，RAM的数据就可以移除了。但从硬盘加载到RAM过程十分耗时，CPU依然要访问数据，所以有些RAM中的数据不会马上移除。

调用Draw Call
Draw Call就是CPU发起命令，告诉GPU去执行一个渲染过程。一次DC（Draw Call）会指向本次调用需要渲染的图源列表。

GPU从CPU那里拿到顶点数据后，经过几何阶段和光栅化阶段将场景里的物体绘制到屏幕中。

几何阶段
- 顶点着色器
  完全可编程，实现顶点的空间变换、顶点着色等功能。
- 曲面细分着色器
  可选的着色器，用于细分图元。
- 几何着色器
  可选的着色器，执行逐图元的着色操作，或者生产更多的图元。
- 裁剪
  将不存在摄像机视野内的顶点裁掉，并剔除某些三角图元的面片；也可以通过指令控制裁剪三角图元的正面或背面。
- 屏幕映射
  不可配置、不可编程，负责把每个图元的坐标转换到屏幕坐标系中。
光栅化阶段
- 三角形设置
  固定函数的阶段。
- 三角形遍历
  固定函数的阶段。
- 片元着色器
  完全可编程，实现逐片元的着色操作。
- 逐片元操作
  不可编程，但可配置性很高，负责执行很多重要操作，如：修改颜色、深度缓冲、进行混合等。

我们需要重点关注的是顶点着色器（Vertex Shader）和片元着色器（Fragment Shader）。

顶点着色器需要完成工作主要有：坐标转换和逐顶点光照。

坐标转换，将模型的顶点坐标从模型空间转换到其次裁剪空间。

需要注意：
OpenGL中NDC的z分量范围是[-1, 1]
DirectX中NDC的z分量范围是[0, 1]

NDC，全称Normalized Device Coordinates，归一化的设备坐标。（后续会详细了解）

一个图元和摄像机视野的关系有3种：

屏幕映射前，顶点的坐标仍然在三维坐标系下，屏幕映射的任务是将每个图元的x、y坐标转换到屏幕坐标系下。
屏幕坐标系和z坐标一起构成了窗口坐标系。

屏幕坐标系在OpenGL和DirectX之间的差异：

光栅化的第一个流水线阶段。
光栅化两个最重要的目标：

三角形设置是一个计算三角形网格表示数据的过程，提供三角形边界的表示方式，为下阶段三角形遍历做准备。

遍历判断每个像素是否被一个三角网格覆盖，若覆盖，则生成一个片元（fragment），这个过程也叫扫描变换。片元的信息数据通过三个顶点差值得到。

DirectX中也被称为像素着色器（Pixel Shader）。
片元着色器的输入是顶点着色器的输出差值得到的结果，片元着色器的输出是一个或多个颜色值。

OpenGL里称为逐片元操作，DirectX中称为输出合并阶段。这个阶段有几个主要任务：

深度测试、模板测试的简化流程图：

模板测试
高度可配置。
模板缓冲，和颜色缓冲、深度缓冲几乎是一类东西。即当前像素读取的参考值和模板缓冲中读取的参考值进行比较，满足条件则通过模板测试，条件规则由开发者指定。
不管模板测试有没有通过，我们都可以根据模板测试和深度测试的结果来修改模板缓冲区，操作修改可由开发者指定。
深度测试
高度可配置。
与模板测试类似，将当前片元的深度值和深度缓冲区的深度值进行比较，比较函数可由开发者设置，通常这个比较函数是小于等于的关系，也就是显示距离相机更近的物体。
如果深度测试没有通过，它没有权利更改深度缓冲区中的值；如果通过了，开发者可以指定是否用这个片元的深度值盖掉缓冲区中的深度值——通过开启/关闭深度写入来控制。