共计 3293 个字符,预计需要花费 9 分钟才能阅读完成。
本文转载自 HyperAI 超神经微信公众号~
内容一览:从诞生的那一刻起,人类对宇宙的摸索就从未进行。现在,这门古老的迷信再次借助 AI 取得加速度。本文将展现 AI 与天文学的联合擦出了怎么的火花。
关键词:AI 地理图像 弱引力透镜
大气层的存在,对于地球生命至关重要,但对于地理观测而言,大气层会导致蒙气差、视宁度、大气消光等景象的呈现,即便是用世界上最好的高空地理望远镜,取得的地理图像也很含糊。这种含糊有时会造成谬误的物理测量,影响天文学家的科研停顿。
为了应答这一挑战,近日,来自清华大学的李天骜和来自美国西北大学的艾玛·亚历山大 (Emma Alexander) 等科研人员,利用模仿数据训练了一种计算机视觉算法,对地理图像进行锐化「还原」,同时,这一算法还与薇拉·C·鲁宾天文台的成像参数进行了匹配,明年天文台凋谢时,该工具能够间接与之兼容。
目前,这项名为 Galaxy image deconvolution for weak gravitational lensing with unrolled plug-and-play ADMM 的研究成果,已发表在《皇家天文学会月刊》上。
论文地址:
https://academic.oup.com/mnrasl/article/522/1/L31/7075894
试验详解:用 AI 算法为地理图像「祛魅」
本论文中,钻研小组针对实际模仿数据对经典和古代的去除含糊的办法进行了基准测试,包含椭圆度误差 (ellipticity errors)、计算工夫和对 PSF 误差的灵敏度等方面,结果表明,unrolled- ADMM 与传统打消含糊的经典办法相比,误差缩小了 38.6%;与古代办法相比,误差缩小了 7.4%。
古代办法 GitHub 地址:
https://github. com/lukeli0425/galaxy-deconv
图像处理
要想对经典办法创立 Benchmark 并训练神经网络,清洁的 ground truth image 必须与实在的 PSF 和噪声含糊图像进行配对。为此,钻研人员借助 Galsim(modular galaxy image simulation toolkit) 及 COSMOS (COSMOS real galaxy dataset) 模仿基于高空的观测,创立了试验数据集。
Galsim:
https://github.com/GalSim-developers/GalSim
COSMOS real galaxy dataset:
https://doi.org/10.5281/zenodo.3242143
原始图像被随机剪切和旋转以模仿弱引力透镜效应 (weak lensing effects),而后应用随机的大气和光学 PSF 对这些图像进行卷积,并在增加高斯噪声前按比例缩放亮度。最初,将所有图像下采样到 LSST 的像素尺度。
目前该数据集已上线 HyperAI 超神经官网:
https://hyper.ai/datasets/23544
神经网络训练
钻研人员应用 Adam 优化器在 NVIDIA GeForce RTX 2080 Ti GPU 上对 40,000 个样本进行训练,其中用多尺度 L1 损失函数对 ground truth 图像及重建图像训练了 50 个 epoch。每个迭代数 (N=2,4,8) 都训练了一个独自的网络,ResUNet 作为降噪插件 (17,007,744 个参数),在神经网络中引入 skip connection,从而防止因迭代次数减少、神经网络加深而引起的梯度隐没或爆炸。同时,训练 CNN (80,236 参数) 来学习步长超参数。
神经网络训练过程中,钻研人员应用的是 PyTorch,同步提供了数据集生成和基准测试工具。
GitHub 地址:
https://github.com/Lukeli0425/Galaxy-Deconv
不同 SNR 程度下的性能体现
钻研人员在不同的 SNR 程度下对提出的办法进行了测试,并将其性能与其余算法进行了比拟(如下图所示)。能够发现,低信噪比时,Richardson-Lucy 算法会产生噪声更大的重建后果,其中,galaxy 会逐步吞没在背景的噪声模式 (noisy pattern) 中。
古代办法尽管能够克制背景噪声,但会扭曲 galaxy 形态,特地是在低信噪比时分外显著。钻研人员应用 FPFS 套件进行椭圆度评估 (ellipticity estimation),联合已知的 PSF 进行逆向滤波 (inverse filtering),或应用单点 PSF 作为无需逆向滤波的 stable estimator,这被利用于本篇论文中所有波及的反卷积办法的 output。
随着 SNR 的升高,除本论文提出的 unrolled-ADMM 外,所有办法逐步生效。
如上图所示,随着 SNR 的升高,论文中提出来的 8 次迭代 unrolled-ADMM 神经网络,在不同 SNR 中性能最佳。
工夫 - 性能衡量
如下图所示,3 张图对应的 galaxy image 信噪比别离为 20、40 及 100。误差棒显示了 5 倍的标准误差,括号中的数字示意迭代次数。
论文中提出的 8 次迭代 unrolled-ADMM 办法,在不同 SNR 程度下显示出比其余办法更优的性能和更低的方差 (variance),但代价是更长的计算工夫。
PSF 中系统误差的稳健性
在理论观测中,星系核心的 PSF 是通过恒星测量的 PSF 插值计算失去的,然而视场中 PSF 的空间方差往往很难建模,因而,插值不能准确地重建星系间的无效 PSF,这要求反卷积算法对 PSF 中的系统误差具备稳健性。
如下图所示,左侧图对应假如 PSF 中的剪切误差 (shear error),右侧图对应 PSF 中的尺寸误差 (FWHM)。横轴下方的 cartoon bar 能够直观地显示 PSF 的系统误差。
钻研人员提出的 unrolled-ADMM 和经典办法,对 model mismatch 的敏感度更高。当 PSF 误差很大时,unrolled-ADMM 与古代办法体现相当甚至要更好。
融化钻研
通过扭转网络结构并从新训练,钻研人员拆散出个别设计抉择对 unrolled-ADMM 的影响。如下图所示,将损失函数从提议的多尺度损失改为 Shape Loss(如青色虚线)或 MSE(如青色实线),会稍微升高性能;删除超参数 SubNet(紫色虚线)或后续迭代层,会升高高 SNR 下的性能;训练降噪器但不训练反卷积 (ADMMNet-style training),会显著升高性能。
通过试验,本次钻研取得了以上成绩,但钻研人员提出将来在以下方面仍能进行相干改良:
- 思考和解决 PSF 中更高阶的误差,以取得更好的性能;
- 模仿数据可通过更精确的 LSST PSF 光学模型和更实在的生成模型进行改良;
- PSF 插值能够蕴含在 Pipeline 中,并与低秩反卷积 (low-rank deconvolution) 相结合。
目前,该钻研从新生成模仿数据的代码以及数据集链接曾经开源。
清华学霸将趣味与科研完满联合
值得关注的是,本论文的一作李天骜,本科就读于清华大学电子工程系。据其集体网站信息显示,他曾负责清华大学视觉智能与计算成像实验室负责钻研助理,目前在美国西北大学生物启发式视觉实验室负责钻研实习生,师从艾玛·亚历山大(该论文二作)。
据介绍,他次要关注计算成像、计算机视觉、信号处理、优化和机器学习的穿插畛域,尤其关注成像中的反问题求解、物理学疏导的机器学习以及地理成像方面的钻研。
现在,Science AI 在各行各业衰亡,在天文学畛域也不例外。算力的晋升、大数据时代的降临给原本须要微小算力的天文学畛域带来了更多的可能性。
日本科学家们正在应用智能 AI 驱动望远镜对太空中的物体进行分类,从而帮忙物理学家编写和测验假如。印度天文学家发明了一种新的 AI 算法,从已知的 5,000 颗行星中,找出了大概 60 颗可能适宜人类寓居的行星。一批天文学家首次在一项星系合并钻研中应用 AI,确认星系合并导致了恒星暴发。腾讯与国家天文台启动「探星打算」,用来进步探星效率……
越来越多的天文学家正将 AI 作为一种弱小的摸索工具,正如中国科学院国家天文台研究员、FAST 首席科学家李菂所说,如果问天文学使不应用机器学习、深度学习等技术,就如同问「20 年前天文学用不必电脑」一样。