免疫系统在肿瘤分型和治疗中发挥着重要的作用。TCR 和 BCR 都属于适应性免疫受体 Adaptive immune receptor repertoires (AIRR)。AIRR 组成信息结合 MHC,年龄,性别等,在基于受体库的预测和分析免疫状态(健康,疾病,感染等)方面有特殊作用,可应用于疾病诊断。基于序列的抗原和表位结合预测对 AIR-based 的治疗靶标发现和工程化改造具有重要意义。
机器学习(ML)用于 AIRR 的分析面临一些特殊问题:(1)每个个体在任意时间含有大约 - 数目的 AIR;(2)基于受体库的 ML 中,每种免疫状态都非常罕见,每 100 万个淋巴细胞才能分泌一种抗体与特定抗原结合;(3)基于序列的 ML,高度多样性短序列(CDR3)使得统计分析变得复杂。
immuneML 是一个开源合作的 AIRR 分析平台,文章于 2021 年发表在《Nature Machine Intelligence》。该平台可用于分析受体库水平(免疫状态)或序列水平(抗原结合)的实验数据和模拟数据,包括从数据预处理到模型训练和验证的全过程。它提供命令行工具以及 Galaxy 网页交互界面,同时可以部署在云平台或本地服务器。immuneML 兼容其他 AIRR 分析软件和序列注释格式,从而能够整合第三方分析工具和 AIRR 结果的下游分析。比如用于序列处理和注释的 MiXCR,Immcantation 和 immunarch 框架。VDJdb 等 TCR 数据库可直接下载到 immuneML Galaxy。另外 immuneML 也整合了基于注意力机制的 AIRR 深度学习工具 DeepRC,针对 TCR 的聚类方法 TCRdist,同时也兼容 GLIPH2。
(Ref: Pavlović et al, Nature Machine Intelligence, 2021)
-
immuneML 可以离线或在线读取分析实验生成的单链和配对数据,以及生成模拟数据用于 ML 基准测试。数据格式为 AIRR-C
标准,MIXCR,10x Genomics,ImmunoSEQ 和 VDJdb 格式。
-
immuneML 支持多个 ML 框架,并输出多种可视化图表。支持 scikit-learn 和 PyTorch,并提供针对 AIRR
数据优化过的 ML 方法,比如实现了其他文献中的算法。
-
提升了 ML 分析模型的易用性,可重复性,互通性,可扩展性和透明度。 易用性,文档丰富,适合各水平的使用者。Galaxy
平台无需代码即可使用。同时在 github,pip,docker 提供下载,可通过过命令行或 python 包使用。
-
可重复性,Galaxy 平台可分享不同用户的分析记录。通过代码使用时,全部配置指定在 yaml 文件中(Galaxy 分析也可下载
yaml 文件),方便分享。
-
互通性,支持导入多种数据源,导出特定格式便于第三方工具进行下游分析。
-
可扩展性,通过模块化设计,可以方便地增加新 ML 方法,编码方式,报告结果,预处理方式等。
-
透明度,(1) 可在 yaml 中定义分析规范并可导出参数;(2) 友好的 Galaxy 界面可以让免疫专家专注于免疫受体相关分析;(3)
每个分析步骤都能提供数据用于进一步核查。
Pavlović, M., Scheffer, L., Motwani, K. et al. The immuneML ecosystem for machine learning analysis of adaptive immune receptor repertoires. Nat Mach Intell 3, 936–944 (2021). https://doi.org/10.1038/s42256-021-00413-z
https://docs.immuneml.uio.no/latest/index.html
免疫系统在肿瘤分型和治疗中发挥着重要的作用。TCR 和 BCR 都属于适应性免疫受体 Adaptive immune receptor repertoires (AIRR)。AIRR 组成信息结合 MHC,年龄,性别等,在基于受体库的预测和分析免疫状态(健康,疾病,感染等)方面有特殊作用,可应用于疾病诊断。基于序列的抗原和表位结合预测对 AIR-based 的治疗靶标发现和工程化改造具有重要意义。
GIANA:基于几何等距的TCR匹配算法
GIANA用于快速比对10 7 TCR高变
CDR
3
序列
。 GIANA应用数学框架执行氨基酸
序列
的等距编码。 ipynb文件中描述了此编码过程。
GIANA是由开发和维护的。 请将有关GIANA的问题直接发送给Bo Li: 。
GIANA是用Python3编写的,具有以下依赖关系:
安装完这些依赖项后,请下载最新版本的GIANA源代码(当前为v4),query.py和关联的TRBV等位基因数据(Imgt_Human_TRBV.fasta)。
输入python GIANA.py -h以显示所有命令行选项:
-h, --help
显示此帮助消息并退出
-d DIRECTORY, --directory=DIRECTORY
输入库音序文件目录。 请确保目录中的所有文件均为输入文件。
-f FILE, --file=FIL
航空可视化图书馆
可视化库,用于构建
AIR
R语义结构化数据的标准图形表示形式。
该可视化库解析
AIR
R DATA,并为iReceptor Stats API启用标准的视觉叙述。
iR + Stats API规范
iReceptor Stats API定义可以在或通过。
该库旨在通过全局变量window.
air
rvisualization或实例化各个类来使用。
使用window.
air
rvisualization您可以获得Class VisualizationLibrary的实例。
可以在文件 , 和找到工作示例。
(UML(维护中)类图)
请注意,您必须在计算机上安装npm 。
安装依赖项
首先在命令行上安装依赖项:
npm install
要构建可视化库运行(在安装依赖项之后):
npm run build
为发展而建设
如果需要build源,请
免疫
ML
immunoML是用于基于机器学习的自适应
免疫
受体
和库(
AIR
R)的
分析
和分类的
平台
。
它支持对实验性B细胞和T细胞
受体
数据以及用于基准测试的合成数据进行
分析
。
在
immuneML
中,用户可以定义灵活的工作流,以支持不同的机器学习库(例如scikit-learn或PyTorch),对不同方法进行基准测试,大量数据特征报告,ML算法及其预测以及结果可视化。
此外,用户可以通过定义自己的数据表示,ML模型,报告和可视化来扩展
平台
。
有用的链接:
主要网站: :
文档: :
Galaxy Web界面: :
可以直接安装
immuneML
。
immuneML
使用Python 3.7或3.8,我们建议使用这些Python版本之一在虚拟环境中安装
immuneML
。
有关更多详细说明(虚拟环境,故障排除,Docker,开发人员安装),请参阅。
使用pip安装
空气React
该库由几个组件组成,这些组件可帮助使用ReactJS构建单页应用程序。
air
r-react定义了每个应用程序都需要的一些基本UI类和功能。 核心组件负责维护应用程序中的导航。 缩小并压缩后的重量约为11.8kB( )。
库可用于:
创建外观独特的应用程序,
为dektop,电话和平板电脑浏览器创建PWA或标准响应式Web应用程序,
快速设计展示您想法的原型。
简单的场景
场景API
viewsConfig
changeView
openSidepanel
hideSidepanel
openMayer
closeMayer
导航栏菜单
SidepanelConfig
ViewConfig
MayerButtonProps
免疫
组库数据
分析
(三):
免疫
组库数据可视化
在系列文章第二篇《
免疫
组库数据
分析
(二):Excel
分析
免疫
组库数据》中,
分析
了
免疫
组库中V基因、J基因、V-J组合的使用频率。在氨基酸水平,
分析
了
CDR
3 的氨基酸的长度分布以及20种氨基酸的使用频率;在
免疫
组库多样性方面,
分析
了4种不同的多样性指数。
本篇将利用作图软件Graphpad prism 8以及Excel 将上述
分析
的数据进行可视化,此外利用在线工具
分析
CDR
3 氨基酸保守性,或者两组样本
CDR
3长度的氨基酸差异。
数据可视化
1.
免疫
组库
什么是 Adobe
AIR
Adobe Integrated Runtime (
AIR
) 是一个跨操作系统的运行时,利用现有的Web开发技术(Flash,Flex,HTML,JavaScript,Ajax)来构建富Internet应用程序并部署为桌面应用程序。
AIR
支持现有的Web技术如Flash,Flex,HTML,JavaScript和AJAX,可以用你最熟练的技术来开发您所见过的最具
One ring to rule them all
作者:FerencLivak & André Nussenzweig
远处的DNA区域并置在一起,形成不同的
免疫
系统基因,编码抗体和T细胞
受体
。这两种类型的基因似乎都是依靠通过一个叫做凝聚蛋白的蛋白质环挤压DNA而形成。
<更多精彩,可关注微信公众号:AIPuFuBio,和大型免费综合生物信息学资源和工具
平台
AIPuFu:www....
知乎圈子:数据
分析
圈|5000+关注(Top 1)
2020年5月份,184个R新包收录于CRAN(2020年4月份收录148个),累计收录16,606个R包!由于CRAN会不定时进行R包增删,所以具体数量会随时间略有变化。
此次整理了11个类别,分别为数据、效率工具、可视化工具、金融、基因组学、市场营销
机器学习、医学、科学、统计学、时间
序列
。
以下是本期(.
使用MindSpore Profiler的官方例子时出现错误:mindspore.profiler.common.exceptions.exceptions.ProfilerFileNotFoundE
C++ 与cocos2d-x-4.0完成太空飞机大战 (一)动画演示AppDelegate编码:AppDelegate.cppAppDelegate编码:AppDelegate.hAction1场景编码:Action1.cppAction1场景编码:Action1.h
AppDelegate编码:AppDelegate.cpp
#include "AppDelegate.h"
#include "Action1.h"
#include "Util.h"
#if USE_AUDIO_ENGINE