相关文章推荐
心软的打火机  ·  Android中Glide加载Https图片 ...·  3 周前    · 
爱运动的打火机  ·  【Python】 已解决:ERROR: ...·  3 周前    · 
坚韧的松鼠  ·  前沿 | ...·  3 周前    · 
无邪的芹菜  ·  什么是Apache Spark_云计算主题库 ...·  3 周前    · 
酷酷的作业本  ·  【开源样本库分享】GID-ENVIForma ...·  2 周前    · 
坏坏的麦片  ·  c++ stl二进制转换_使用C ++ ...·  1 年前    · 
曾深爱过的手链  ·  Java 死锁示例和解决方案 · ...·  1 年前    · 
深沉的火柴  ·  Hibernate ...·  1 年前    · 
玩篮球的火龙果  ·  Environments and ...·  2 年前    · 
酷酷的电梯  ·  YUV 转 RGB 公式中,YUV ...·  2 年前    · 
Code  ›  前沿 | GAN用于材料设计:哈佛大学新研究登上Science开发者社区
gan 社区功能 机器学习
https://cloud.tencent.com/developer/article/1191444
坚韧的松鼠
3 周前
机器之心

前沿 | GAN用于材料设计:哈佛大学新研究登上Science

腾讯云
开发者社区
文档 建议反馈 控制台
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
发布
首页
学习
活动
专区
圈层
工具
MCP广场
返回腾讯云官网
机器之心
首页
学习
活动
专区
圈层
工具
MCP广场
返回腾讯云官网
社区首页 > 专栏 > 前沿 | GAN用于材料设计:哈佛大学新研究登上Science

前沿 | GAN用于材料设计:哈佛大学新研究登上Science

作者头像
机器之心
发布 于 2018-08-21 11:40:58
发布 于 2018-08-21 11:40:58
1.1K 0
举报
文章被收录于专栏: 机器之心 机器之心

选自Science

作者:Benjamin Sanchez-Lengeling等

机器之心编译

在材料领域,机器学习技术经常被用于特性预测,学到一个函数能绘制出符合选择特性的分子材料。而近日哈佛大学与多伦多大学的研究者在Science上发表了一篇关于新材料设计的论文,该论文将深度生成模型引入反演设计,从而合成有机物甚至设计新型药物。

论文:Inverse molecular design using machine learning: Generative models for matter engineering

论文地址:http://science.sciencemag.org/content/361/6400/360

摘要:新材料的发现能为社会与科技发展带来巨大进步。当今环境下,全面探索潜在材料空间在计算方面非常困难。在这篇文章中,我们回顾了反演设计方法(inverse design)——一种以特定预期功能为起点发现专门材料的方法。近期人工智能领域的快速发展,特别是机器学习的子领域深度学习的发展,带来了思维转变,提出了反演分子设计的方法且快速得以利用。其中,深度生成模型被应用到了大量材料类别上:新型药物的合理设计、有机化合物合成、太阳光电与液流电池优化以及多种固态材料等。

介绍

从个性化医疗到能源生产与存储,21 世纪的许多挑战都存在一个共同主题:材料永远是解决方案的一部分。有时,这些问题的解决方案都受限于材料的物化特性,例如材料带隙(materials bandgap)关系对太阳能发电的限制。

先前,重大材料的发现都是科学家偶然间或者多次试验得到的。例如,人们观察到用硫等添加剂加热可以提高橡胶的耐用性,于是在 19 世纪从其混合物中制造了硫化橡胶。在分子层面,单个高分子链交叉结合,形成的新链在宏观力学特性上得到增强。其他值得一提的例子像聚四氟乙烯、麻醉剂、凡士林、苯胺紫、盘尼西林也都是通过这种形式得到的。此外,这些材料来自于天然的化学成分。其他潜在药物要么是在化学实验室中合成的,要么是从植物、土壤细菌或者真菌中提取出来的。例如,直到 2014 年,49% 的小分子抗癌药物都是天然化合物或者是天然化合物的衍生物。

未来,物质发现的爆炸性进展来自于所有可能的分子和固态化合物集合中未开发的区域,即化学空间。其中最大的一个分子集合——化学空间计划——已经绘制了 1664 亿个分子,至多包含 17 个重原子。其中与药理学相关的小分子,结构数量据估计约为 1060 个。考虑到从亚纳米到微观到介观(mesoscopic)的尺度层级,对化学空间的探索整体上变得复杂。因此,任何想要覆盖这一空间的全局策略看起来都无法实现。模拟为在不做实验的情况下探索这一空间提供了可能。这些分子的物化特性都由量子力学掌控,也就是可通过薛定谔方程式求解来达到精确。但在实际中,常通过损失部分准确率的近似法来减少计算时间。

尽管理论上有了巨大进步,但如今以常规方法建模分子、群集以及含缺陷的周期性固体,化学空间依然庞大无比,且需要智能导航。有鉴于此,机器学习、深度学习以及人工智能非常有潜力,因为它们的计算策略是通过经验自动改进的。在材料领域,机器学习技术经常被用于特性预测,学到一个函数能绘制出符合选择特性的分子材料。深度生成模型是深度学习方法的一种,能以非线性的方式建模结构与特征以及与它们相关的潜在可能性分布。通过利用大量数据中的模式,这些模型能提取表现分子特性的平均的、显著的特征。

反演设计是发现复杂材料过程的一部分。从在实验室发现到形成商业产品,新技术的部署周期一般是 15-20 年。依照惯例,这一过程(下图 1)涉及到以下步骤:(i) 生成全新的或者改进材料概念并模拟其潜在适用性;(ii) 合成材料;(iii) 把材料组合成设备或者系统; (iv) 表现并测量其预期特性。这一周期生成反馈,不断重复、改进、精炼。每个步骤都可能花费数年。

图 1:材料发现范式的对比图解。当前范式如左图所示,用有机液流电池作为示例。闭环范式如右图所示。完成这一闭环需要融合反演设计、智能软件、AI/ML、嵌入式系统和机器人,组成一个融合的生态系统。图:K. HOLOSKI 编辑。

在物质工程的时代,科学家们试图加速这一闭环,减少每一步所需要的时间。最终目标是兼顾提出、创造、特征化新材料,每部分构成都能同时传送、接收数据。这一过程被称为「闭环」(closing the loop),且反演设计是重要的组成。

反演设计

图 2:不同分子设计方法图解。反演设计始于期望分子特性,终于化学空间,这不同于从化学空间到分子特性的直接方法。图:K. HOLOSKI 编辑。

分子表征

图 3:应用于 AQDS 分子的不同类型分子表征,这种分子被用于构建有机液流电池。从最上面顺时针来看:(1)量化分子环境的出现和缺失的指纹向量;(2)使用简化文本编码来描述化学空间结构的 SMILES 字符串;(3)可建模模型相互作用或对称性的势能函数;(4)包含原子和键权重的图;(5)库仑矩阵;(6)分子键和分子碎片的集合;(7)原子及原子电荷的 3D 几何图形;(8)电子密度。图:K. HOLOSKI 编辑。

图 4:生成模型中几种架构的示意图。RNN 用于序列生成。VAE 展示的是半监督变体,由分子(x)和属性(y)联合训练。Z 表示潜在空间,z 表示潜在向量。在 GAN 设定中,噪声最终通过对抗训练转换成分子结构。强化学习(RL)展示了 MTCS 在 SMILES 补全任务时获得任意奖励的策略梯度。图的右下方是混合结构(如 AAE,对抗自编码器)及 ORGAN,表示 GAN 和 RL。图:K. HOLOSKI 编辑。

展望

反演设计是加速设计物质所需的复杂框架的重要组成。反演设计的工具(尤其是那些从机器学习领域发展而来的工具)近年来发展迅速,并成功将化学空间纳入概率数据驱动模型中。生成模型可以生成大量的候选分子,并且这些候选分子的物理实现将需要自动化的高吞吐量工程来验证生成方法。社区目前并没有开发出足够多的成功的物质设计闭环方法。理论和实验之间壁垒的倒塌将为我们带来 AI 驱动的自动化实验设备。

反演设计工具与主动学习方法(例如贝叶斯优化)的结合可以让模型在探索化学空间时实现自适应,这将使得在高度不确定性的区域扩展模型成为可能,并允许发现包含所需特性的分子空间区域(作为组成的函数)。目标函数空间的主动学习也许能帮助我们更好地理解在开展机器学习过程中对最佳奖励的搜索。

如我们所见,机器学习方法论的核心是分子的表征;编码相关物理过程的表征将具有更好的泛化能力。尽管我们取得了可观的进展,但仍存在很多需要完成的工作。分子的图和分层表征还需要进一步研究。

将机器学习作为一种新的知识支柱集成到化学、生化、医学和材料科学领域中,研究者们就能更迅速地采用本研究中总结出的方法。

本文为机器之心编译,转载请联系本公众号获得授权。

本文参与 腾讯云自媒体同步曝光计划 ,分享自微信公众号。
原始发表:2018-08-08 ,如有侵权请联系 cloudcommunity@tencent.com 删除
其他

本文分享自 机器之心 微信公众号, 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!

其他
评论
登录 后参与评论
0 条评论
热度
最新
登录 后参与评论
推荐阅读
相关产品与服务
腾讯云 TI 平台
腾讯云 TI 平台(TencentCloud TI Platform)是基于腾讯先进 AI 能力和多年技术经验,面向开发者、政企提供的全栈式人工智能开发服务平台,致力于打通包含从数据获取、数据处理、算法构建、模型训练、模型评估、模型部署、到 AI 应用开发的产业 + AI 落地全流程链路,帮助用户快速创建和部署 AI 应用,管理全周期 AI 解决方案,从而助力政企单位加速数字化转型并促进 AI 行业生态共建。腾讯云 TI 平台系列产品支持公有云访问、私有化部署以及专属云部署。
产品介绍
AI驱动 智领未来
领券
  • 社区

    • 技术文章
    • 技术问答
    • 技术沙龙
    • 技术视频
    • 学习中心
    • 技术百科
    • 技术专区
  • 活动

    • 自媒体同步曝光计划
    • 邀请作者入驻
    • 自荐上首页
    • 技术竞赛
  • 圈层

    • 腾讯云最具价值专家
    • 腾讯云架构师技术同盟
    • 腾讯云创作之星
    • 腾讯云TDP
  • 关于

    • 社区规范
    • 免责声明
    • 联系我们
    • 友情链接
    • MCP广场开源版权声明

腾讯云开发者

扫码关注腾讯云开发者

扫码关注腾讯云开发者

领取腾讯云代金券

热门产品

  • 域名注册
  • 云服务器
  • 区块链服务
  • 消息队列
  • 网络加速
  • 云数据库
  • 域名解析
  • 云存储
  • 视频直播

热门推荐

  • 人脸识别
  • 腾讯会议
  • 企业云
  • CDN加速
  • 视频通话
  • 图像分析
  • MySQL 数据库
  • SSL 证书
  • 语音识别

更多推荐

  • 数据安全
  • 负载均衡
  • 短信
  • 文字识别
  • 云点播
  • 大数据
  • 小程序开发
  • 网站监控
  • 数据迁移

Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有

深圳市腾讯计算机系统有限公司 ICP备案/许可证号: 粤B2-20090059 深公网安备号 44030502008569

腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287

问题归档 专栏文章 快讯文章归档 关键词归档 开发者手册归档 开发者手册 Section 归档

Copyright © 2013 - 2025 Tencent Cloud.

All Rights Reserved. 腾讯云 版权所有

登录 后参与评论
 
推荐文章
心软的打火机  ·  Android中Glide加载Https图片失败的解决方案-阿里云开发者社区
3 周前
爱运动的打火机  ·  【Python】 已解决:ERROR: Could not install packages due to an OSError: [WinError 5] 拒绝访问。: ‘e:\anaconda\i
3 周前
坚韧的松鼠  ·  前沿 | GAN用于材料设计:哈佛大学新研究登上Science开发者社区
3 周前
无邪的芹菜  ·  什么是Apache Spark_云计算主题库-阿里云
3 周前
酷酷的作业本  ·  【开源样本库分享】GID-ENVIFormat|新机器学习与深度学习在遥感图像分类中的应用 - ENVI-IDL技术殿堂
2 周前
坏坏的麦片  ·  c++ stl二进制转换_使用C ++ STL中的stoi()函数将二进制字符串转换为整数-CSDN博客
1 年前
曾深爱过的手链  ·  Java 死锁示例和解决方案 · HowToDoInJava 中文系列教程 · 看云
1 年前
深沉的火柴  ·  Hibernate JPA递归查询-腾讯云开发者社区-腾讯云
1 年前
玩篮球的火龙果  ·  Environments and deployments | GitLab
2 年前
酷酷的电梯  ·  YUV 转 RGB 公式中,YUV 的取值范围都是0到255吗? - 知乎
2 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
Code - 代码工具平台
© 2024 ~ 沪ICP备11025650号