关于人工智能:人工智能如何帮助自然科学

40次阅读

共计 4333 个字符,预计需要花费 11 分钟才能阅读完成。

背景

人工智能 (AI) 正日益成为其余迷信和技术畛域钻研人员的工具,促成跨学科单干。加州斯坦福大学编制了一个跟踪人工智能相干数据的索引,该大学在其 2021 年报告中发现,从 2019 年到 2020 年,人工智能期刊出版物的数量增长了 34.5%;从 2018 年到 2019 年的 19.6% 回升(见 go.nature.com/3mdt2yq)。2019 年,人工智能出版物占寰球所有同行评审迷信出版物的 3.8%,高于 2011 年的 1.3%。

五位人工智能钻研人员形容了这些单干的成绩,超过了期刊出版物,并探讨了他们如何帮忙突破学科之间的阻碍。

FABIO COZMAN:治理冀望

巴西圣保罗大学人工智能核心 (C4AI) 主任。

在我领导人工智能核心 (C4AI) 的巴西圣保罗大学,咱们的次要指标是发展对社会和行业有间接影响的机器智能钻研。咱们有五个外围打算。一个指标是极大地改良巴西语言葡萄牙语的自然语言解决和翻译,以便通过计算机语音工具更好地翻译、转录和了解葡萄牙语使用者所说的话。另一个,蓝色亚马逊大脑,钻研气候变化、生物多样性和矿产资源对巴西大西洋海岸线和寓居在那里的人们的影响。该核心于 2020 年 10 月停业,每年从技术公司 IBM 取得 200 万巴西雷亚尔(38 万美元)的资金,200 万雷亚尔来自圣保罗钻研基金会,400 万雷亚尔来自圣保罗大学。州政府提供进一步的财政反对。

该核心宽泛单干,但合作者通常对计算机科学能够实现的指标有不同的冀望。这些冀望能够通过与合作者明确人工智能能够做什么和不能做什么来解决。对于研究成果的一致经常出现:例如,自然科学界的人们通常认为期刊论文是流传钻研的最佳形式,而依据我的教训,人工智能钻研人员更看重会议。

另一个挑战是一些钻研人员只想要一个程序员。这样的钻研人员须要更违心分享他们的常识和问题,而不是仅仅采纳“来帮我编程”的办法。合作须要成为旨在解决和答复问题的伙伴关系。

人工智能倒退得如此之快,以至于计算机科学和工程畛域的人们感觉他们必须伸出援手来解决事实世界的问题:仅仅做咱们本人的事件对咱们来说不再那么无益了。咱们正在追寻一个趋势:所有次要的人工智能实验室和核心当初都在参加现实生活中的利用问题。对于心愿与人工智能专家单干的钻研人员,我的倡议是首先治理您的冀望:您是否心愿让“善于计算机”的人帮忙您进行一些数据分析,或者您是否真的须要提出更深层次的问题,哪个 AI 能够帮你答复?

一点背景常识和实践经验对合作者很有用。

PHIALA SHANAHAN:偏心地运作

剑桥麻省理工学院实践物理学家。

我与该公司的 AI 钻研部门 Google DeepMind 有继续的单干。该协会始于几年前在以色列举办的一次会议。我和我的学生展现了咱们在剑桥麻省理工学院 (MIT) 开始的一些我的项目,这些我的项目采纳了伦敦 DeepMind 的高级钻研科学家 Danilo Jimenez Rezende 提出的一些想法;Rezende 的工作包含简单数据的建模,例如医学图像、视频、3D 场景几何和简单的物理零碎。他实现了一些咱们曾经利用于根底物理问题的要害机器学习钻研。

咱们进行了交谈,并由此产生了更长期的单干。它当初波及 DeepMind 的几个人,我的几个博士后和一个博士生。在过来的几年里,咱们曾经写了四五篇论文,并且的确做了一些翻新的事件,应用机器学习模型来减速已建设的物理计算。最终,指标是使咱们可能进行现有算法和资源在计算上不可能进行的钻研。

使咱们的单干胜利的货色是平等感。我的团队正在像 DeepMind 团队一样致力推动 AI 方面。DeepMind 小组的人也十分理解他们的物理学。单方都能够做迷信的两个局部,所以这是一次十分平均和动静的单干,十分乏味。

我参加了效率较低的单干,他们的态度是“一组应该放心物理局部,一组应该放心计算机科学局部”,咱们在两头相遇。所产生的状况是,这两个群体最终都变得孤立并与语言障碍作奋斗。我发现这样的单干不是互动的。

实际上,与 DeepMind 的这种更严密、更均衡的关系意味着咱们每周与参加该项目标每个人开一次会。咱们在合作平台 Slack 上也有一个联结频道,咱们在此期间聊天,并且我在一周内与我本人小组中正在从事该项目标人散会更频繁。
[[作者: 吴宏伟]](https://wuxiongwei.com)

SIMON OLSSON:找到要解决的问题

瑞典哥德堡查尔姆斯理工大学利用人工智能助理传授。

在我去年 10 月开始的实验室中,咱们开发了机器学习办法来解决自然科学中的计算问题。例如,目前,咱们正在与英国 - 瑞典公司阿斯利康合作开发药物设计办法,该公司在我所在大学左近的哥德堡设有钻研核心。咱们还在钻研如何将试验数据整合到蛋白质构造和动力学的机器学习模型中。

咱们应用来自自然科学的已发表论文和数据来训练算法,而不是让它们本人解决问题。例如,如果你想弄清楚一种蛋白质是如何折叠的,或者一种药物是如何与它相互作用的,那么应用一个计算模型来思考对于该蛋白质的文献,以及管制它的物理和化学定律。行为,可能会有所帮忙。

如果你有计算机科学背景并且想在学习自然科学的同时进入人工智能,试着找出你感兴趣的畛域并找到你想解决的问题。例如,我最后是通过钻研分子动力学和分子设计而被这个畛域所吸引,其中分子及其相互作用是在计算机中模仿的,通常用于药物发现的目标。人工智能有可能使以前无奈解决的问题在这些畛域中失去解决,这些畛域对计算的要求十分高。

如果您不是来自计算机科学背景,那么学习编程并把握机器学习实践的基础知识是很重要的。一个终点是 learnpython.org,它提供了对于 Python 编程语言的交互式教程。美国在线课程平台 Coursera 和 YouTube 上也有对于机器学习的在线课程。或者你能够在你的大学加入机器学习或数据迷信课程。

学习应用 AI 编程的基础知识还意味着倒退利用统计常识和钻研机器学习算法的工作原理,以及它们解决数据和从教训中“学习”的一些形式。把握这些概念是重要的第一步。

我认为意识到机器学习和人工智能的有用性实际上归结为问本人:“这些办法如何帮忙咱们改良,从根本上推动迷信向前倒退?”

我倡议对人工智能感兴趣的人开始学习编程,只需尝试自动化他们在工作生存中常常做的事件:无论是发送模板电子邮件还是将数据输出电子表格。如果反复这是一项无聊的工作,那么自动化它的能源将很快到来。之后,逐步用越来越简单的工作挑战本人。

ROMAN LIPSKI:我的机器学习缪斯

柏林艺术家,将人工智能融入他的作品。

2016 年 4 月,我开始在柏林美术学院传授难民课程,在那里我遇到了数据科学家 Florian Dohmann。咱们开始单干,尝试应用人工智能摸索艺术。我看过 Google 的数据科学家应用 AI 制作的图片。它们是由反复元素制成的恐怖故事图像,以具备 1,000 只眼睛或 1,000 英尺的动物为特色。

起初我有点天真:我想兴许咱们会立刻拍出有史以来最好的照片。我晓得有微小的后劲,但我不晓得如何应用人工智能。弗洛里安和我开始应用由德国蒂宾根大学的科学家创立的开源算法,该算法旨在应用机器学习辨认形态和色彩。为了忠于我的艺术准则,咱们决定只在我本人的工作上训练算法。咱们拍摄了我在职业生涯中创作的每一幅画,创立了一个小数据集来传授算法,而后要求它创作一件原创作品。

后果又是惨不忍睹。它看起来就像我从谷歌工程师那里看到的画——反复的形态和色彩,没有增加任何新货色。从艺术上讲,它们比其余任何货色都更具噱头。

咱们决定创立一个新的数据集,应用一个反复的主题——灵感来自安迪沃霍尔的坎贝尔汤罐——我在本人的画作中应用过。主题是我在 2016 年 3 月拜访过的洛杉矶一条非常简单的街道景观。我用不同的色彩和纹理屡次绘制了雷同的场景。

咱们将这组图像数字化,我意识到我制作的艺术不是为了向人类观众展现,而是为了让机器“看到”和解决:这是我和机器之间对话的开始。

这一次,当咱们要求算法翻新并制作新图片时,后果令人惊叹。不是每张照片都好,但咱们失去了成千上万的不同艺术风格的平凡成绩,具备真正的艺术品质和我本人无奈达到的模式。

在遇见弗洛里安的前一年,我遇到了彻底的艺术危机。我感觉我曾经用完了我本人世界里能够用油漆讲述的故事。我当初又开始画画了,但不是简略地打印 AI 算法生成的货色,而是应用它的输入作为灵感来创作我本人的原创作品。我当初激励其他人将该算法用作名为 Unfinished 的社区艺术我的项目的一部分,帮忙他们应用 AI 工具体验我的创作过程并创作本人的画作。

我的倡议是不要被人工智能设施吓倒,而只是开始应用它们:就像任何工具一样,它们有其长处和毛病。但对我来说,人工智能扭转了我的职业生涯。
[[作者: 吴宏伟]](https://wuxiongwei.com)

SIDDHARTH MISHRA-SHARMA:寻找平凡的导师

剑桥麻省理工学院粒子物理学博士后研究员。

作为本科生,我在英国剑桥大学做过一些试验高能物理学和天体物理学的实习。其中包含在瑞士日内瓦左近的欧洲粒子物理实验室欧洲核子研究中心的几个夏天。在新泽西州普林斯顿大学攻读粒子物理学博士学位期间,我还涉足了机器学习,并在我目前在麻省理工学院的职位上回到了机器学习畛域。人工智能工具往往是物理学的一个很好的补充。咱们常常应用来自粒子对撞机或望远镜的宏大数据集,这些数据集能够产生 PB 级的数据。

例如,假如你有一个宏大的数据集,能够通过咱们的河汉跟踪恒星的静止。暗物质能够对恒星的静止产生乏味的影响,将它们略微拉向一侧或另一侧,或者扭曲来自它们的光。因为成果很奥妙,很难独自剖析超过 1000 亿颗恒星。最终,它变成了一个大数据问题:机器学习办法能够帮忙咱们识别模式,并且能够扩大以解决宏大的数据集。

而且因为有如此多类型的地理数据集可用——从单个星系的图像到银河系的地图——没有一种机器学习办法能够无效地用于寻找暗物质的影响。当机器学习开始用于天体物理学时,办法被大规模调整,在新的环境中应用已建设的算法。例如,如果机器学习办法善于辨别猫和狗的图像,它将实用于辨别不同星系的图像。

然而明天,物理学家和其余自然科学从业者的需要能够为机器学习办法的倒退提供信息。我不再间接解决间接来自对撞机或望远镜的海量数据集。相同,我日常工作的一部分波及查看哪种办法对给定的问题或察看成果很好,如果不存在这种办法,则尝试创立它。在这样的工作中,物理和机器学习之间的信息流是双向的,两个学科正在互相告诉。我很快乐能参加其中。

我激励其他人分割潜在的导师并说:“这是一个乏味的问题——我认为你的办法非常适合它。”通常,单干另一方的人对批改他们的办法以满足您的需要或提供倡议感到兴奋。他们通常只是太高兴地思考你的问题。

原文链接

正文完
 0