详细讲解Antialiasing 的理论（上）

2016-05-29 来源：CloudBest 阅读量： 234

关键词：程序设计

　　在这篇文章中，我们会从数位讯号处理的理论角度来看 3D 电脑绘图中的 antialiasing 问题。当然，这并不是教科书（我也没能力写教科书 :P），所以我会尽可能避开数学式，而只是从观念的角度来说明这个问题。
　　首先，我们从数位讯号的基础来看。因为我们现在所用的电脑，几乎都是数位电脑，所以它们当然也只能处理数位的资料。所谓的数位资料，其实就是一堆数字，或更正确的说，一堆整数。因为数位电脑只能处理 0 和 1，所以它们所能处理的东西，可以说都是有限的整数。当然，我们可以用一些整数来表示有理数（用分数来表示），所以数位电脑也可以用来处理一些小数。
　　
　　不过，有很多东西不是用有理数就可以表示的。不过，这还不是最大的问题。最大的问题是，很多讯号都是连续的。这里所谓的连续，并不是微积分里面的那种连续，而只是说讯号就像一个实数函数一样，在任何参数上都有值。这告诉我们，即使是随便一小段讯号，都需要用无限多个数字才能表示。很明显的，数位电脑是不能存放无限多个数字的。下图是一个例子：
　　

　　在上图中，垂直方向是讯号的强度，在影像中就是 intensity。而水平方向则是讯号的位置，我们称为 spatial domain。如果是声音讯号的话，那它就不是位置，而是时间了，也就是 time domain。不过，因为我们这里只讨论影像，所以基本上水平方向就是 spatial domain。
　　
　　不过，因为这样的讯号是连续的，所以，就像前面所说的，需要无限多个数字才能存放这个讯号。但是电脑不能存放无限多个数字，所以，只好取其中的一些数字。比如说，如果上图中垂直方向的虚线，就是 pixel 的边界，那我们可以只取讯号中，在 pixel 正中间的值。这样我们只需要存放八个数字。这就是所谓的取样（sampling）。以上例来说，取样得到的八个数字分别是 0.548、0.468、0.760、0.296、0.400、0.348、0.460、和 0.507。这些取样得到的数字，就形成了数位讯号。
　　
　　这些数位讯号在经过处理后（所谓的处理，也许只是存放在某个地方，像是光碟片里面），最后还是需要让人看到结果。因为人是没办法光从一堆数字就看得出来那是什么东西，所以，一定要设法把这些数位讯号，再转换成连续的、人可以接受讯号（像是显示在萤幕上，或是对声音讯号来说，用喇叭发出声音）。这个过程就称为重建（reconstruction）。比如说，上面的数位讯号，利用 sample and hold 的方式重建的话（也就是说，在整个 pixel 的范围中，都输出该 pixel 的取样值），会变成如下图：
　　　

　　不用说，这是一个蛮差的重建方式，因为它重建出来的讯号，和原来的讯号实在是相差太多了。不过，其实这也是没办法的事，因为对一个连续的讯号（原来需要无限多个数字才能表示），只用八个数字来表示，本来就会丢失很多资讯。不过，我们当然还是希望能够尽可能达到最好的效果。这就是理论发挥作用的时候了。
　　
　　究竟在取样的时候，发生了什么事呢？这就得从 frequency domain 的角度来看了。所谓的 frequency domain，就是指讯号所拥有的各种频率的成份。也就是说，我们可以用一大堆不同频率的正弦波，合成我们所要的讯号。或是说，我们要找出我们所要的讯号，是由哪些不同频率、不同强度、和不同相位的正弦波所组成的。这可以利用 Fourier transform 把一个讯号从 spatial domain 或 time domain 转换成 frequency domain，或利用 inverse Fourier transform 把它从 frequency domain 转回来。
　　
　　下图是一个讯号和它的 Fourier transform：
　　　

　　要注意的是，一个讯号的 Fourier transform，对任一个频率实际上有两个成份，一个是讯号的强度（magnitude），另一个是相位（phase）。在上图中只显示出强度，而没有显示出相位。另外，在频率为 0 的地方，称为 DC，等於是整个讯号在 spatial domain（或 time domain）的总合，所以特别大。在后面的图中，有时会把 DC 值切掉，以让其它频率的值更容易看出来。
　　
　　假设现在要对一个讯号在每个 pixel 的中间进行取样，也就是保留讯号在 pixel 中间的值，而把其它地方的值变成 0。这其实可以利用乘上另一个讯号的方式来做，也就是乘上一个「在每个 pixel 中间为 1、其它地方为 0」的讯号。如下图所示：
　　　

　　原始讯号
　　　

　　Comb filter
　　　

　　取样后的讯号
　　上图是一个原始讯号，在乘上 comb filter 后，得到取样后的讯号。Comb filter 的名字来自於它的形状，因为它在每个 pixel 中间的值为 1，其它地方的值为 0，看起来长得像梳子，所以叫 comb filter。
　　
　　究竟取样的时候，发生什么事呢？这要从 frequency domain 来看才会清楚。下图是同样的讯号，在 frequency domain 的形状：
　　　

　　原始讯号
　　　

　　Comb filter
　　　

　　取样后的讯号
　　可以看到，经过取样后的讯号，在 frequency domain 变成一个不停重覆的东西。不过，它在 -1 和 1 之间的形状，和原来的形状并不相同。这是因为原始讯号在 -1 和 1 之外还有东西（像是 1 和 2 之间的突起，这是来自原始讯号右边的那三个尖角，它们的频率太高了），这些东西「干扰」到原来在 -1 和 1 之间的东西。这个现象

上一篇：详细讲解Antialiasing 的理论... Z buffer 和 W buffer ...：下一篇

突发性能实例 t5

新用户专享，限购1台 CPU内存：1核带宽：1M 系统盘：40G

￥ 96.9 /1年

标准型SA2

新用户专享 CPU内存：2核带宽：3M 系统盘：50G

￥ 428 /1年

ECS共享型s6

新用户专享，限购1台 CPU内存：2核带宽：3M 系统盘：40G

￥ 565.9 /1年