小波变换介绍

· · 个人记录

这世界上数不清有多少曲子,音符却只有几十个。小波变换就是把图像看成一首乐曲,然后把曲子谱出来的过程。合理地选择用到的“音符”,可以使图像被高效压缩。这个过程,是将“时间(或空间)上的感受”转化为“不同频率的振动”,即将时域变换到频域,这是图像处理中重要的思想。

小波:图像压缩中的琴键

小波\psi(t)是被选择用来拟合图像的函数,这就如同决定用哪种乐器来演奏乐曲。它被要求是均值为零(\int_{-\infty}^{\infty}\psi(t)dt = 0)的能量为有限值的函数(这里的能量是信号处理中的概念)。小波显然可以有很多种,就如同用来演奏的乐器可以有不同的音色。实际应用中,选择合适的小波以取得最优效果。

小波基:图像压缩中的音符

小波基\psi _{l,t_0}(t)是由小波经过拉长和平移得到的新函数,这里的lt_0是用来做拉伸和平移变换的一组数,进行小波变换时需要使用很多组(l,t_0),得到多个小波基。这些小波基共同组成一个小波组合。这就是出现在谱子里不同时间不同长度的音符了。

为了保证函数的能量不变,需要乘上系数\frac{1}{\sqrt{l}}, 即\psi_{l,t_0}(t) = \frac{1}{\sqrt{l}}\psi(\frac{t-t_0}{l})。同时,他们需要相互正交,所以l,t_0需要精心构造。

小波变换:谱曲时间

从小波组合里选出要用到的小波基,对每一个小波基做这样一件事:把小波基的每一个点同图像函数的每一个点乘起来再加和。就像这样:

W_\omega( l, t_0) = f(t)*\psi(t,l,t_0) = \int_{-\infty}^{\infty}f(t)\psi(t,l,t_0)dt

这一步是在确定这个音符的强度,这个运算称为卷积(当然,这可不是卷积的定义形式)。自此,图像这首抽象的乐曲就被谱成了“乐谱”,并且,这个“乐谱”还可以通过相似的逆变换还原出原来的“乐曲”。

实际应用中,卷积被替换为离散化的形式,以便用计算机完成运算。有技巧地选择小波、小波基可以加快计算,提高压缩比和图像质量。另外,卷积的计算还可以通过快速傅里叶变换(FFT)加速,不过,这又是另一个话题了。

总结

小波变换是图像处理中非常强大的工具,它体现着深刻的数学、哲学思想,蕴含着数学之美。

参考文献