看人工智能 如何发现夜空中最亮的星
本报记者 高 博
寻找暗物质,机器比人的眼神好。近期《计算天体物理学和宇宙学》发表的一篇论文显示,美国劳伦兹伯克利国家实验室(以下简称“伯克利实验室”)等机构共同研制的深度学习AI框架,能够探寻宇宙里暗物质的迹象。
近几年,人工智能越来越多应用于天文学研究。深度学习需要海量数据,而天文学正是AI大显身手的领域。机器可以替人类从茫茫大海里捞针,捕捉到新的恒星、新的地外行星甚至暗物质。
辨认“引力透镜”,AI立功了
寻找“引力透镜”是研究暗物质分布的基本方法。巨大质量的物体会像透镜一样扭曲路过的光线,找出这种扭曲就能捕捉到不发光的质量物。
论文显示,伯克利实验室建立的深度学习AI框架CosmoGAN,可以分析引力透镜与暗物质的关联。它可以创建高保真、弱引力透镜收敛图。
曾几何时,寻找“引力透镜”所需的模拟和数据处理很麻烦。20名科学家花费了好几个月的时间只能查看一小块空间图像。物理模拟需要数十亿个计算小时,占用数兆字节的磁盘空间。
神经网络的进步提供了机会。伯克利实验室领导的团队引入一种“生成性对抗网络(GANs)”。研究者穆斯塔法说:“也有别的深度学习方法可以从许多图像中得到收敛图,但与竞争方法相比,GANs生成非常高分辨率的图像,同时仍有神经网络的高效率。”
现在,天文学家可以用CosmoGAN分析大得多的天区,速度也更快。
CosmoGAN不是唯一取得进展的天文学深度学习神经网络。比如多伦多大学利用深度学习技术解析月球陨石坑的卫星图像,P8超级计算机的神经网络在仅仅几个小时内发现6000个新的陨石坑,是过去几十年中人类发现陨石坑数量的2倍。伊利诺伊大学厄巴纳-香槟分校利用深度学习来探测和分析黑洞碰撞的引力波。AI在天文学遍地开花。
数据太多,没机器玩不转
过去几年里,天文领域的大多数方向都在尝试使用人工智能。考虑到天文学要处理的数据之多,这是一个很自然的思路。让机器练习去分析蛛丝马迹,不如此,未来的天文学将无法运转。
不久前举办的2019年GPU技术大会吸引了全世界的人工智能学者。大会请来加州大学圣克鲁兹分校的天文学家布兰特·罗伯特森演讲,他指出:“天文学正在一场新的数据革命的风口”。罗伯特森认为,新一代天文仪器必须配合由深度学习驱动的新一代软件。
比如预计在3年后运行的大口径全天巡视望远镜(LSST)。它巡视南天那一半宇宙中的370亿个星系,生成一部时长十年的不间断视频。LSST配备的是32亿像素的相机,每晚产生25TB的数据,相当于现在先进天文望远镜一生贡献的所有数据。
再比如平方公里阵列射电望远镜(SKA)。它遍布全球,一部分天线在非洲南部8国部署,还有100多万天线位于澳大利亚和新西兰。它的原始数据每天达到5千个PB,处理后也有50个PB左右。
“暗能量巡天”编制几亿个星系的星图;“盖亚”卫星测绘银河系数十亿恒星;“兹威基”项目每小时能够扫描3750平方度的天区。在中国,FAST每天的数据量将达150TB;郭守敬望远镜观测了901万条光谱,是世界上最大的天体光谱库……
捕捉人类看不出的模式
数据越来越多,科学家试图聚合它们。但在GPU大会上,罗伯特森说,未来几个大型天文望远镜一起产生大量数据,聚合之后复杂到人类无法直接利用。而加州大学圣克鲁斯分校的科学家试图解决这个问题。计算机科学系一名博士生创建的Morpheus深度学习框架,可以基于望远镜的原始数据,逐像素地分类天体。