相关文章推荐
玩滑板的啄木鸟  ·  java如何从字符串获得行数 | ...·  2 月前    · 
强健的大白菜  ·  2020 曼島TT 宣佈取消 | Talk GP·  5 月前    · 
细心的筷子  ·  gtest环境安装 - 小得盈满 - 博客园·  5 月前    · 
豁达的跑步鞋  ·  人人都是歌手的时代,边界正在被打破|王菲|网 ...·  9 月前    · 
年轻有为的开水瓶  ·  河南理工大学魏绍亮一行到访我校智能制造工程专 ...·  1 年前    · 
Code  ›  【分类+biomarkers识别】MOGONE:一种基于深度学习的多组学数据分类新算法开发者社区
大数据 云数据 分类数据
https://cloud.tencent.com/developer/article/1970855
失眠的烤地瓜
2 年前
作者头像
尐尐呅
0 篇文章

【分类+biomarkers识别】MOGONE:一种基于深度学习的多组学数据分类新算法

前往专栏
腾讯云
开发者社区
文档 意见反馈 控制台
首页
学习
活动
专区
工具
TVP
文章/答案/技术大牛
发布
首页
学习
活动
专区
工具
TVP
返回腾讯云官网
社区首页 > 专栏 > 国家基因库生命大数据平台 > 正文

【分类+biomarkers识别】MOGONE:一种基于深度学习的多组学数据分类新算法

发布 于 2022-04-01 16:51:10
389 0
举报

为了充分利用组学技术的进步,更全面地了解人类疾病,需要新的计算方法对多种类型的组学数据进行综合分析。2021年6月《 Nature Communications 》发表了一个 有监督的多组学数据分析新方法:MOGONE , 它是第一个利用图卷积网络(GCNs) 进行组学数据学习以对新样本进行有效类别预测的有监督的多组学集成方法。

多年来,人们提出了许多方法来对各种问题进行多组学数据整合。然而, 大多数现有的研究集中于无监督的多组分数据整合 。随着个性化医疗的快速发展,具有详细注释的管理数据集(用于描述样本的表型或特征)变得越来越广泛。因此, 有监督的多组学整合方法越来越受到关注,这种方法可以识别疾病相关的生物标志物并对新样本进行预测。

MOGONE是什么?

MOGONET是一个用于生物医学分类任务的多组学数据分析框架 ,其在标签空间将组学特定学习与多组学综合分类相结合。具体而言,MOGONET利用GCNs进行组学特定学习。 与全连通的神经网络相比,GCN充分利用了相似网络描述的组学特征和样本间的相关性,提高了分类性能。 除了直接连接每个组学数据类型的标签分布外,MOGONET还利用视图相关性发现网络(VCDN)探索标签空间的交叉组学相关性,以实现有效的多组学集成。

在预处理和特征预选以去除噪声和冗余特征之后,MOGONET首先使用GCN分别学习每种组学数据类型的分类任务。然后,进一步利用每个特定于组学的GCN生成的初始预测来构建跨组学发现张量,该张量反映了跨组学标签的相关性。最后,跨组学发现张量被重新塑造成一个向量并转发到VCDN以进行最终的标签预测。VCDN可以通过探索更高级别标签空间中不同组学数据类型的潜在相关性,有效地整合来自每个特定组学网络的初始预测。MOGONET是一个端到端的模型,组学特定的GCN和VCDN交替训练直到收敛。

MOGONE 的功能测试

研究团队通过广泛的生物医学分类应用,包括阿尔茨海默病患者分类、脑低级别胶质瘤(LGG)的肿瘤分级分类、肾癌类型分类和浸润性乳腺癌亚型分类,展示了MOGONET的功能和通用性;指出了整合多种组学数据类型的必要性,以及通过综合消融研究结合GCN和VCDN进行多组学数据分类的重要性;此外还证明了MOGONET可以识别与所研究的生物医学问题相关的重要组学特征和生物标记。

MOGONET在各种分类任务中优于现有有监督的多组学集成方法。 研究团队比较了MOGONET与9种现有的组学数据分类算法的分类性能,观察到MOGONET在大多数分类任务中的表现优于其他方法,唯一的例外是在LGG等级分类中,XGBoost和MOGONET的平均AUC相同。

MOGONET 在各种分类任务中的表现优于其变化。 为了检验GCN和VCDN对有效的多组学数据分类的必要性,研究团队对其提出的方法进行了广泛的消融研究,其中比较了MOGONET的三种额外变化(NN_NN、NN_VCDN、MOGONET_NN),观察到MOGONET在所有分类任务中都优于NN_NN和NN_VCDN。虽然MOGONET_NN在LGG等级分类等任务中取得了与MOGONET相似的性能,但在所有分类任务中,MOGONET始终比MOGONET_NN产生更好的平均度量。

MOGONET可以扩展到不同数量的组学数据类型。 为了证明MOGONET在不同数据模式选择下的有效性,研究团队仅使用两种类型的组学数据:mRNA和DNA甲基化数据,在BRCA数据集上比较了其与其他方法的性能,观察到与三种不同的组学数据类型的情况类似,当使用mRNA和DNA甲基化数据进行训练时,MOGONET仍然始终优于BRCA数据集上的现有方法。

另外,研究团队在mRNA、DNA甲基化和miRNA数据上 证明了在生物医学应用中整合多种类型的组学数据以提高分类性能的必要性 ,同时 进一步证明了GCN在组学数据分类问题中的有效性,以及使用VCDN对组学数据进行跨组学学习的有效性。

MOGONET在不同超参数 k 下保持性能稳定。 为了进一步证明超参数k在二元分类和多类分类任务中对MOGONET性能的影响,研究团队使用ROSMAP数据集和BRCA数据集在广泛的 k 值下训练MOGONET,观察到MOGONET的分类性能随着 k 的变化而波动,但MOGONET对 k 的变化仍然是稳健的,因为它在不同的 k 值下一直优于现有方法。

MOGONET鉴定的重要生物标志物。 通过MOGONET鉴定的生物标志物在每种疾病中的功能和富集的生物过程方面是相当多样化的。对于AD患者分类,MOGONET将8个mRNA特征、5个DNA甲基化特征和17个miRNA特征确定为前30个重要的生物标记物;对于BRCA PAM50亚型分类,MOGONET将15个mRNA特征、9个DNA甲基化特征和6个miRNA特征确定为前30个重要的生物标记物;同时,MOGONET鉴定的高等级基因和miRNA也被证明与AD和乳腺癌相关。

此外,研究团队还通过对BRCA数据集中来自不同机构的不同患者队列进行训练和测试来评估其性能,观察到MOGONET与随机划分训练和测试样本的实验取得了相似的性能,这表明 MOGONET模型可以推广到同一分类任务的不同数据集。

虽然文中涉及的多组学分类任务中只利用了mRNA、DNA甲基化和miRNA数据,但 特定于组学的GCN和多组学整合组件都可以被扩展以适应不同或更多类型的数据。因此,MOGONET是一个有监督的多组学分类框架,可以被推广以适应许多不同的组学数据类型,其具有卓越的性能和良好的可解释性。

文中涉及的源代码可以从GitHub下载:https://github.com/txWang/MOGONET

参考文献

Wang, T., Shao, W., Huang, Z. et al. MOGONET integrates multi-omics data using graph convolutional networks allowing patient classification and biomarker identification. Nat Commun 12, 3445 (2021).

图片来源于NC官网和参考文献,如有侵权请联系删除。

点击展开阅读全文
文章分享自微信公众号:
国家基因库大数据平台
国家基因库大数据平台

扫码关注公众号

本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!

原始发表:2021-09-26 ,如有侵权请联系 cloudcommunity@tencent.com 删除

音视频点播加速
数据分析
登录 后参与评论
关于作者
0
文章
0
累计阅读量
0
获赞
前往专栏
关注 - 腾讯云 开发者 公众号
将获得
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
扫码关注腾讯云开发者
NEW
切换旧版
领券
  • 社区

    • 专栏文章
    • 阅读清单
    • 互动问答
    • 技术沙龙
    • 技术视频
    • 团队主页
    • 腾讯云TI平台
  • 活动

    • 自媒体分享计划
    • 邀请作者入驻
    • 自荐上首页
    • 技术竞赛
  • 资源

    • 技术周刊
    • 社区标签
    • 开发者手册
    • 开发者实验室
  • 关于

    • 社区规范
    • 免责声明
    • 联系我们
    • 友情链接

腾讯云开发者

扫码关注腾讯云开发者

扫码关注腾讯云开发者

领取腾讯云代金券

热门产品

  • 域名注册
  • 云服务器
  • 区块链服务
  • 消息队列
  • 网络加速
  • 云数据库
  • 域名解析
  • 云存储
  • 视频直播

热门推荐

  • 人脸识别
  • 腾讯会议
  • 企业云
  • CDN加速
  • 视频通话
  • 图像分析
  • MySQL 数据库
  • SSL 证书
  • 语音识别

更多推荐

  • 数据安全
  • 负载均衡
  • 短信
  • 文字识别
  • 云点播
  • 商标注册
  • 小程序开发
  • 网站监控
  • 数据迁移

Copyright © 2013 - 2023 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有

深圳市腾讯计算机系统有限公司 ICP备案/许可证号: 粤B2-20090059 深公网安备号 44030502008569

腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287

问题归档 专栏文章 快讯文章归档 关键词归档 开发者手册归档 开发者手册 Section 归档
 
推荐文章
玩滑板的啄木鸟  ·  java如何从字符串获得行数 | PingCode智库
2 月前
强健的大白菜  ·  2020 曼島TT 宣佈取消 | Talk GP
5 月前
细心的筷子  ·  gtest环境安装 - 小得盈满 - 博客园
5 月前
豁达的跑步鞋  ·  人人都是歌手的时代,边界正在被打破|王菲|网络歌手|歌手_新浪科技_新浪网
9 月前
年轻有为的开水瓶  ·  河南理工大学魏绍亮一行到访我校智能制造工程专业交流-青岛理工大学 机械与汽车工程学院
1 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
Code - 代码工具平台
© 2024 ~ 沪ICP备11025650号