相关文章推荐
朝气蓬勃的饼干  ·  NameError when trying ...·  1 月前    · 
眉毛粗的回锅肉  ·  vba-commandbutton,text ...·  2 年前    · 
开朗的毛衣  ·  ubuntu vm - ip camera ...·  2 年前    · 
谦虚好学的罐头  ·  dpkg: 处理软件包 ...·  2 年前    · 
SCENICprotocol:可扩展的SCENIC工作流程,用于单细胞基因调控网络分析
收藏

SCENICprotocol:可扩展的SCENIC工作流程,用于单细胞基因调控网络分析
  • 143.29MB
  • 2021-05-02 19:38
  • zhangjames
    • VIP
    可扩展的SCENIC工作流程,用于单细胞基因调控网络分析 该存储库描述了如何对单细胞数据运行pySCENIC基因调控网络推断分析以及基本的“最佳实践”表达分析。 这包括: 独立的Jupyter笔记本电脑,用于交互式分析 Nextflow DSL1工作流程,它提供了一种半自动化且简化的方法来运行这些步骤 pySCENIC安装,使用和下游分析的详细信息 另请参阅《自然规约》中的相关出版物: : 。 有关此协议中步骤的高级实现,请参阅 ,这是pySCENIC的Nextflow DSL2实现,具有用于表达式分析的全面且可自定义的管道。 这包括其他pySCENIC功能(多次运行,集成的基于主题和基于轨迹的regulon修剪,织机文件生成)。 PBMC 10k数据集(10x基因组学) 完整的SCENIC分析,以及过滤,群集,可视化和SCope就绪的织机文件创建: | SCEN
    SCENICprotocol-master.zip
    (44个子文件)
    SCENICprotocol-master.zip
    SCENICprotocol-master
    .gitignore 109B
    requirements.txt 2KB
    nextflow.config 1KB
    bin
    filtering-basic.py 4KB
    grnboost2_without_dask.py 4KB
    integrateOutput.py 6KB
    arboreto_with_multiprocessing.py 6KB
    preprocess_visualize_project_scanpy.py 5KB
    scenic_protocol.yml 5KB
    LICENSE 34KB
    .github
    workflows
    nextflow_test.yml 501B
    notebooks
    SCENIC Protocol - Case study - Mouse brain data set.ipynb 2.24MB
    PBMC10k_SCENIC-protocol-CLI.html 5.18MB
    PBMC10k_SCENIC-protocol-CLI-tracks.html 3.7MB
    SCENIC Protocol - High resolution images.ipynb 5.88MB
    SCENIC Protocol - Case study - Cancer data sets.ipynb 29.89MB
    PBMC10k_downstream-analysis.html 23.38MB
    SCENIC Protocol - Case study - Cancer data sets.html 30.3MB
    Figure - Speed comparison R and Python.ipynb 44KB
    SCENIC Protocol - Case study - Mouse brain data set.html 2.53MB
    PBMC10k_SCENIC-protocol-CLI-tracks.ipynb 3.36MB
    pbmc10k_garnett_results.txt 396KB
    PBMC10k_SCENIC-protocol-CLI.ipynb 4.84MB
    PBMC10k_downstream-analysis.ipynb 23.06MB
    main.nf 6KB
    README.md 8KB
    example
    allTFs_mm.txt 11KB
    test_TFs_tiny.txt 5B
    allTFs_hg38.txt 11KB
    genome-ranking.feather 44.14MB
    sample_data_tiny.tar.gz 12KB
    allTFs_dmel.txt 5KB
    expr_mat.loom 472KB
    expr_mat_small.loom 35KB
    expr_mat_tiny.loom 35KB
    sample_data_small.tar.gz 11KB
    sample_data.tar.gz 468KB
    test_TFs_small.txt 9B
    motifs.tbl 30.56MB
    conf
    test.config 540B
    .gitattributes 30B
    docs
    pipeline.md 1KB
    figs
    Figure01.png 678KB
    installation.md 5KB
    # A scalable SCENIC workflow for single-cell gene regulatory network analysis This repository describes how to run a pySCENIC gene regulatory network inference analysis alongside a basic "best practices" expression analysis for single-cell data. This includes: * Standalone Jupyter notebooks for an interactive analysis * A Nextflow DSL1 workflow, which provides a semi-automated and streamlined method for running these steps * Details on pySCENIC installation, usage, and downstream analysis See also the associated publication in **Nature Protocols**: https://doi.org/10.1038/s41596-020-0336-2. For an advanced implementation of the steps in this protocol, see **[VSN Pipelines](https://github.com/vib-singlecell-nf/vsn-pipelines)**, a Nextflow DSL2 implementation of pySCENIC with comprehensive and customizable pipelines for expression analysis. This includes additional pySCENIC features (multi-runs, integrated motif- and track-based regulon pruning, loom file generation). ## Overview * [Quick start](#quick-start) * [Requirements](#general-requirements-for-this-workflow) * [Installation](docs/installation.md) * Case studies * PBMC 10k dataset (10x Genomics) * Full SCENIC analysis, plus filtering, clustering, visualization, and SCope-ready loom file creation: * [Jupyter notebook](notebooks/PBMC10k_SCENIC-protocol-CLI.ipynb) [HTML render](http://htmlpreview.github.io/?https://github.com/aertslab/SCENICprotocol/blob/master/notebooks/PBMC10k_SCENIC-protocol-CLI.html) * Extended analysis post-SCENIC: * [Jupyter notebook](notebooks/PBMC10k_downstream-analysis.ipynb) [HTML render](http://htmlpreview.github.io/?https://github.com/aertslab/SCENICprotocol/blob/master/notebooks/PBMC10k_downstream-analysis.html) * To run the same dataset through the VSN Pipelines DSL2 workflow, see [this tutorial](https://vsn-pipelines-examples.readthedocs.io/en/latest/PBMC10k.html). * Cancer data sets * [Jupyter notebook](notebooks/SCENIC%20Protocol%20-%20Case%20study%20-%20Cancer%20data%20sets.ipynb) [HTML render](http://htmlpreview.github.io/?https://github.com/aertslab/SCENICprotocol/blob/master/notebooks/SCENIC%20Protocol%20-%20Case%20study%20-%20Cancer%20data%20sets.html) * Mouse brain data set * [Jupyter notebook](notebooks/SCENIC%20Protocol%20-%20Case%20study%20-%20Mouse%20brain%20data%20set.ipynb) [HTML render](http://htmlpreview.github.io/?https://github.com/aertslab/SCENICprotocol/blob/master/notebooks/SCENIC%20Protocol%20-%20Case%20study%20-%20Mouse%20brain%20data%20set.html) * [References and more information](#references-and-more-information) <p align="center"> <img src="docs/figs/Figure01.png" width="600" alt="SCENIC workflow diagram"> ## Quick start ### Running the pySCENIC pipeline in a Jupyter notebook We recommend using [this notebook](notebooks/PBMC10k_SCENIC-protocol-CLI.ipynb) as a template for running an interactive analysis in Jupyter. See the [installation instructions](docs/installation.md) for information on setting up a kernel with pySCENIC and other required packages. ### Running the Nextflow pipeline on the example dataset #### Requirements (Nextflow/containers) The following tools are required to run the steps in this Nextflow pipeline: * [Nextflow](https://www.nextflow.io/) * A container system, either of: * [Docker](https://docs.docker.com/) * [Singularity](https://www.sylabs.io/singularity/) The following container images will be pulled by nextflow as needed: * Docker: [aertslab/pyscenic:latest](https://hub.docker.com/r/aertslab/pyscenic). * Singularity: [aertslab/pySCENIC:latest](https://www.singularity-hub.org/collections/2033). * [See also here.](https://github.com/aertslab/pySCENIC#docker-and-singularity-images) #### Using the test profile A quick test can be accomplished using the `test` profile, which automatically pulls the testing dataset (described in full below): nextflow run aertslab/SCENICprotocol \ -profile docker,test This small test dataset takes approximately 70s to run using 6 threads on a standard desktop computer. #### Download testing dataset Alternately, the same data can be run with a more verbose approach (this is more illustrative for how to substitute other data into the pipeline). Download a minimum set of SCENIC database files for a human dataset (approximately 78 MB). mkdir example && cd example/ # Transcription factors: wget https://raw.githubusercontent.com/aertslab/SCENICprotocol/master/example/test_TFs_tiny.txt # Motif to TF annotation database: wget https://raw.githubusercontent.com/aertslab/SCENICprotocol/master/example/motifs.tbl # Ranking databases: wget https://raw.githubusercontent.com/aertslab/SCENICprotocol/master/example/genome-ranking.feather # Finally, get a tiny sample expression matrix (loom format): wget https://raw.githubusercontent.com/aertslab/SCENICprotocol/master/example/expr_mat_tiny.loom #### Running the example pipeline Either Docker or Singularity images can be used by specifying the appropriate profile (`-profile docker` or `-profile singularity`). Please note that for the tiny test dataset to run successfully, the default thresholds need to be lowered. ##### Using loom input nextflow run aertslab/SCENICprotocol \ -profile docker \ --loom_input expr_mat_tiny.loom \ --loom_output pyscenic_integrated-output.loom \ --TFs test_TFs_tiny.txt \ --motifs motifs.tbl \ --db *feather \ --thr_min_genes 1 By default, this pipeline uses the container specified by the `--pyscenic_container` parameter. This is currently set to `aertslab/pyscenic:0.9.19`, which uses a container with both pySCENIC and Scanpy `1.4.4.post1` installed. A custom container can be used (e.g. one built on a local machine) by passing the name of this container to the `--pyscenic_container` parameter. ##### Expected output The output of this pipeline is a loom-formatted file (by default: `output/pyscenic_integrated-output.loom`) containing: * The original expression matrix * The pySCENIC-specific results: * Regulons (TFs and their target genes) * AUCell matrix (cell enrichment scores for each regulon) * Dimensionality reduction embeddings based on the AUCell matrix (t-SNE, UMAP) * Results from the parallel best-practices analysis using highly variable genes: * Dimensionality reduction embeddings (t-SNE, UMAP) * Louvain clustering annotations ## General requirements for this workflow * Python version 3.6 or greater * Tested on various Unix/Linux distributions (Ubuntu 18.04, CentOS 7.6.1810, MacOS 10.14.5) ## References and more information ### SCENIC * [SCENIC (R) on GitHub](https://github.com/aertslab/SCENIC) * [SCENIC website](http://scenic.aertslab.org/) * [SCENIC publication](https://doi.org/10.1016/j.cell.2018.05.057) * [pySCENIC on GitHub](https://github.com/aertslab/pySCENIC) * [pySCENIC documentation](https://pyscenic.readthedocs.io/en/latest/) * [VSN Pipelines](https://github.com/vib-singlecell-nf/vsn-pipelines), a repository of pipelines for single-cell data in Nextflow DSL2, including an implementation of pySCENIC. ### SCope * [SCope webserver](http://scope.aertslab.org/) * [SCope on GitHub](https://github.com/aertslab/SCope) * [SCopeLoomR](https://github.com/aertslab/SCopeLoomR) * [SCopeLoomPy](https://github.com/aertslab/SCopeLoomPy) ### Scanpy * [Scanpy on GitHub](https://github.com/theislab/scanpy) * [Scanpy documentation](https://scanpy.readthedocs.io/) * [Scanpy publication](https://doi.org/10.1186/s13059-017-1382-0)   |  feather:1个
    你可能感兴趣的资源
    PyPI 官网下载 | pyscenic-0.11.1-py3-none-any.whl
    资源来自pypi官网,解压后可用。 资源全名:pyscenic-0.11.1-py3-none-any.whl
    SCENIC:SCENIC是一种R软件包,可从单细胞RNA序列数据推断基因调控网络和细胞类型
    风景 SCENIC(单细胞重组网络推断和聚类)是一种从单细胞RNA序列数据推断基因调控网络和细胞类型的计算方法。 该方法的描述和一些使用示例可在《。 当前在R(此存储库)和Python中有SCENIC的实现。 如果您不太喜欢使用R,我们建议您检查一下SCENIC(其中包含Nextflow工作流程)和Python / Jupyter笔记本,以轻松运行SCENIC (强烈建议您批量运行SCENIC
    论文研究 - 外周血淋巴细胞培养
    细胞遗传学鉴定对于生物的表征非常重要。 在两栖动物中,直接方法是染色体表征的常规技术,但对于牺牲拷贝是必需的。 这项工作的目的是在不牺牲标本的情况下开发用于莱茵夜蛾物种的淋巴细胞培养技术。 材料与方法:在圣路易斯(San Luis)收集雄性标本的“ Rhinella arenarum”。 通过心脏穿刺获得血液样品。 测试的培养基是:培养基:具有HEPES和谷氨酰胺,MEM和F10的RPMI 169
    loom:交互式可视化的无数据共享
    config.json格式 "window": { "x": 1, "y": 1, "width": 1, "height": 1 "targets": [ "type": "linear", "actor": "arcball" "type": "helper"
    scenic_timer:首次尝试使用Scenic
    自述文字在这里 从模板
    scenery_layout_o_matic:Elixir的Scenic框架的布局库
    scenery_layout_o_matic:Elixir的Scenic框架的布局库
    Scenic:Scenic 场景描述语言的编译器和场景生成器
    有关该语言及其一些应用的描述,请参阅,它扩展了我们的(注意:自以来,Scenic 的语法略有变化,并且添加了许多功能,例如支持动态场景;这些在预印本中进行了描述)。 Scenic 由 Daniel J. Fremont、Edward Kim、...
    回归树matlab代码-GENIE3:基于机器学习的方法可根据表达数据推断基因调控网络
    基于机器学习的方法,可根据表达数据推断基因调控网络。 GENIE3方法在以下论文中描述(可用): Huynh-Thu V. A., Irrthum A., Wehenkel L., and Geurts P. Inferring regulatory networks from expression data ...
    scenic_new:为Scenic应用程序混合Scenic.New任务
    scenic.new混合任务,它将为您生成一个入门应用程序。 这是设置新的Scenic项目的最简单方法。 Erlang / Elixir版本 请注意,它目前需要OTP 21和Elixir 1.7。 如果您在编译时遇到麻烦,请检查是否首先运行了这些版本...
    Python库 | generators-2018.2.20.tar.gz
    资源分类:Python库 所属语言:Python 资源全名:generators-2018.2.20.tar.gz 资源来源:官方 安装方法:https://lanzao.blog.csdn.net/article/details/101784059
    scFunctions:单细胞数据分析功能
    Florian Wuennemann的单细胞数据分析功能集合。 主要对Seurat对象进行操作。 有关Seurat和对象结构的更多信息,请参见 。 安装 使用devtools install_github函数安装软件包,如下所示: library(devtools) ...
    scenic_driver_glfw:用于窗口OS的风景级渲染和输入驱动程序
    也许也可以在其他系统上工作,但是我只测试了这两个系统... 有关实际安装步骤,请参见主要的Scenic文档。 在MacOS上安装 在MacOS上安装的最简单方法是使用Homebrew。 只需在终端中运行以下命令: brew update brew...
    景区旅游行业小程序 hawk_scenic 5.5.6 安装更新一体包 (2).rar
    景区旅游行业小程序 hawk_scenic 5.5.6 安装更新一体包 (2).rar
    scenic:核心风景图书馆
    Scenic主要用于固定屏幕连接的设备(IoT),但也可以用于构建便携式应用程序。 有关更多信息,请参见和。 其他可用资源包括: ElixirConf 2018的视频 ,介绍了Scenic及其致力于解决的问题。 目标 可用: Scenic...
    景区旅游行业小程序 hawk_scenic 5.5.6 安装更新一体包.zip微信小程序模板源码
    景区旅游行业小程序 hawk_scenic 5.5.6 安装更新一体包.zip微信小程序模板源码
    scenic:Bidi路由库的包装,使路由更“漂亮”
    风景优美的Scenic是围绕一个简单的精简包装器,它可以将route.rb-ish文件中的路由转换为Bidi路由数据结构。用法示例创建一个路由文件,并将其放在类路径的某个位置(例如,my_project / resources / my_routes....
    景区旅游行业小程序 hawk_scenic 5.4.5 安装更新一体包.rar
    景区旅游行业小程序 hawk_scenic 5.4.5 安装更新一体包.rar
    PyPI 官网下载 | scenic-2.0.0b1.tar.gz
    资源来自pypi官网。 资源全名:scenic-2.0.0b1.tar.gz
    Scenic_asteroids:使用风景秀丽的UI库用Elixir编写的玩具小行星克隆
    风景秀丽的小行星 这是用Elixir和Nerves编写的小行星克隆,更多用于娱乐和学习。 另外,由于代码(和行为)相对简单,因此我希望它可以作为Scenic,Nerves的示例以及简单的。 有关详细信息,它已获得3条款BSD许可...
    sr1:scenic一个风景秀丽的全美框架,用于在响应中进行状态管理和路由
    国道1号 一个风景优美的全美框架,用于在React中进行状态管理和路由设计SR1导出三个单例对象: State , Store和Route 。 您可以从导入SR1的任何模块中使用它们。 它们之间是应用程序的所有全局状态: State用于瞬态...
    scenic_driver_nerves_touch:Scenic.Driver.Nerves.Rpi-为Nerves设备提供触摸输入的风景驱动程序
    Scenic_driver_nerves_touch 用于在Nerves设备上接收触摸输入的主驱动程序。 到目前为止,仅在Raspberry Pi 3设备上进行了测试。 换句话说,对于该驱动程序来说还处于初期。 将来可能会发生变化。 特别是关于多点...
    scenic-view:Scenic View是一个JavaFX应用程序,旨在使您可以轻松了解应用程序场景图的当前状态,并且还可以轻松地操作场景图的属性,而无需继续编辑代码。 这使您可以查找错误,并使像素完美无缺,而无需执行编译-检查-编译之舞
    Scenic View是一个JavaFX应用程序,旨在使您可以轻松了解应用程序场景图的当前状态,并且还可以轻松地操作场景图的属性,而无需继续编辑代码。 这样一来,您就可以查找错误,并使像素完美无缺,而无需执行“编译-...
    scenic2:风景区叉2(https
    Scenic是一个舞台电话会议系统,它允许在任何IP网络上实时传输视听数据和任意数据流。 远程呈现系统可以在各种艺术环境中使用,以便两个不同的创意空间可以相互交流或呈现组合的表演。 Scenic是对以前的Scenic软件的...
    2023最新的Python全套教程,从入门到进阶到实战
    从0开始学习Python,一个菜鸟到高手的进阶之路 本课程共分为3个部分 01,Python基础语法 02,Python终极 03,Python中高级课程 Python的实战项目
    python大作业 含爬虫、数据可视化、地图、报告、及源码(2016-2021全国各地区粮食产量).rar
    (含源码及报告)本程序分析了自2016年到2021年(外加)每年我国原油加工的产量,并且分析了2020年全国各地区原油加工量等,含饼状图,柱状图,折线图,数据在地图上显示。运行本程序需要requests、bs4、csv、pandas、matplotlib、pyecharts库的支持,如果缺少某库请自行安装后再运行。文件含6个excel表,若干个csv文件以及一个名字为render的html文件(需
    python多个excel合并软件
    python多个excel合并软件
    2023年泰迪杯数据挖掘挑战赛B题订单分析与需求预测+python源码
    2023年泰迪杯数据挖掘挑战赛B题,产品订单数据分析与需求预测问题的源码和数据。博主自己做的结果,python实现,代码都有注释说明,可供参考学习,有问题欢迎私聊。 本题主要包括两问,第一问进行数据预处理+数据分析。第二问是模型训练和预测,主要用了svr,随机森林,xgboost,lgb等模型进行训练和预测
    如何使用python调用ChatGPT API?
    ChatGPT 是由 OpenAI 开发的一个语言模型。OpenAI 是一家领先的人工智能研究机构。ChatGPT 基于变换器架构,使用深度学习生成会话风格的文本。该模型在大量文本数据上进行训练,并可以针对特定任务进行微调。例如,它可以用于生成问答对话、对话生成、文本摘要等等。 ------ 以上回答来自ChatGPT