「为可微计算机图形学奠定基础」,太极二作李
机器之心报道
参与:魔王、蛋酱、杜伟
刚刚,顶级计算图形学机构 ACM SIGGRAPH 颁发了 2020 年最佳博士论文奖。MIT CSAIL 博士后研究员、太极(Taichi)论文第二作者李子懋(Tzu-Mao Li)获得该奖项。SIGGRAPH 颁奖词中称他的博士论文「为新兴的可微计算机图形学奠定了基础」。
\r\t\t\t\t\t\t\t\t\t\r\t\t\t\t\t\t\t\t在这篇 148 页的博士论文中,李子懋探讨了视觉计算、编程系统和统计学习之间的关系。他将经典计算机图形学和图像处理算法与现代数据驱动方法相结合,从而增强了物理理解。李子懋利用统计学中的数学工具和机器学习开发能够解决图形和视觉问题的新算法。此外,他开发的编程系统简化了可学得视觉计算算法的高效实现和数学推导。
该论文的主题是解决计算和应用复杂图形学 pipeline 导数所面临的挑战,以便利用这些导数更好地拟合和采样参数或者解决逆问题(inverse problem)。这项研究被认为「解决了图形学算法中的不连续性以及现代硬件的大规模并行性问题,其贡献远远超出了传统的自动微分」。
在颁奖词中,SIGGRAPH 称该论文「为新兴的可微计算机图形学研究领域奠定了基础」,李子懋是「物理可微渲染领域的先行者」。
这篇论文的主要贡献包括以下三项:
首先,它推导并实现了首个全面的可微渲染解决方案,该方案可以正确计算涉及任意场景参数(如相机姿态、场景几何、材料和光照)的渲染图像上标量函数的导数。这使得多种图形学和视觉算法能够使用导数分析图像的 3D 属性,包括 3D 重建和对抗样本生成。
其次,论文的另一项贡献是提出了一个领域特定的自动微分编译器,它基于 Halide 编程语言构建,用于微分图像处理算法。该编译器只需研究人员付出很少的编程努力,即可以高性能自动生成复杂图像处理算法的梯度。这就为使用灵活构造块开发高效准确的数据驱动图像处理算法开辟了新的路径,与深度学习中常用的粗粒度算子形成鲜明对比。
最后,该论文提出了首个 MCMC(马尔可夫链蒙特卡罗)渲染算法,该算法使用光路吞吐量的二阶导数,来加速移动焦散或光滑材料多反射照明等高难度特效的渲染进程。具体来说,该研究使用光传输贡献的 Hessian 矩阵来捕获被积函数的强各向异性(anisotropy)。
获奖博士论文
现在我们来看这篇博士论文《Differentiable Visual Computing》的具体内容。
\r\t\t\t\t\t\t\t\t\t