更新时间: 2023.02.10 20:00:02
Bio-OS的交互式分析环境集成了Jupyter Notebook. Jupyter Notebook是一个开源分析环境,您可以在其中通过交互式分析和可视化效果实时了解研究数据。您可以导入数据——包括存储在云中的已处理基因组学、表型和转录组学数据——并使用 R 或 Python 中的自定义或预建库进行分析。 Jupyter Notebooks 环境可供新手使用,并具有可移植性和可重复性。Notebooks以易于理解和分享的形式将分析方法和发现结合在一个地方。作为传统科学论文的逻辑演变,Jupyter Notebook极大地缩短了阅读分析完成方式和实际重现分析之间的路径。很难夸大这个概念的强大程度以及Notebooks对计算科学中发现的可重用性和可重复性的影响。
Notebook支持切换Notebooks的运行资源,可以切换应用配置以及资源配置。应用配置主要是选择启动的默认镜像,资源配置则可以选择资源规格。
点击【运行资源配置】
选择应用配置和资源配置
点击更新环境(如果当前Notebook实例已经启动,点击更新环境将会删除实例并重新启动)
当前提供三个预设的镜像:datascience、GATK以及Bioconductor。 Datascience镜像为平台提供的最基础镜像,仅包含一些数据科学的常用工具 GATK镜像中包含GATK4.2.6.1、Python3.7.12和R4.1.3。 GATK 是用于分析高通量测序数据的工具的集合,可用于变异发现。另外镜像中还包含生物信息分析中常用的Python和R包分析工具。 R/Bioconductor镜像中包含Python和R工具包之外还包含Bioconductor,Bioconductor是建立在R语言环境上的,用于生物信息数据的注释、处理、分析及可视化工具包的总集,由一系列R扩展包组成。
资源配置可以选择三挡资源类型,分别为最小资源、默认资源、以及较大资源。您可以按照需求选择所需要的资源启动Notebook。启动Notebook会在集群中申请对应的资源用量进行启动。
Notebooks中默认使用ebs弹性快存储,但是您也可以使用对象存储作为存储对象,当您想要在Notebook中直接读取在工作流的输出结果,可以打开存储配置,并完成密钥配置(密钥主要是为了允许Bio-OS访问您的对象存储桶)后,即可在Notebook中直接读取当前Notebook所在Workspace对应的对象存储桶。
注:目前仅有专属集群中的VKE集群支持Notebooks使用对象存储,共享集群暂不支持。
Notebook运行配置中打开【存储配置】,点击【更新环境】
编辑Notebook之后,在左侧文件列表中会出现 tos_data 文件夹,即为当前Workspace绑定的tos对象存储桶
选择单元格并按键盘上的 Shift + Enter (您的键盘可能会显示“return”而不是“enter”)。
Shift
Enter
单击菜单栏中的运行图标。
使用Cell 下拉菜单中的适当命令。
说明
单元格是Notebook的组成部分。每个单元格都有一个“类型”(Code/Markdown/Raw NBConvert/Heading),它决定了应用程序计算将如何解释单元格中的指令。
当您运行代码单元时,Jupyter计算内核将读取代码,并将这些指令传递到运行Jupyter的实际操作系统(例如 Python、R),并检索结果以在笔记本中显示它们。 当命令运行时,命令的输出日志出现在代码单元的正下方。 如果单元格中的代码与内核的语言不匹配,则应用程序计算将返回错误。如果未指定输出,则通过注意单元格左侧方括号 [ ] 中的数字,您将知道代码已成功执行。
首次启动笔记本时,每个代码单元左侧的方括号为空 [],表示这些单元在此会话期间尚未运行。括号 [*] 中的星号表示单元正在运行。一旦命令被执行,星号将被一个整数代替,该整数表示自内核启动以来执行的命令数。您可以多次执行同一个单元格,或在一个单元格中执行多条命令。 如果您通过转到下拉菜单单元格>所有输出并选择“清除”来清除输出,则整数括号将再次被空括号替换。但是,如果您重新启动内核,整数计数只会重置为零。
Notebook不仅能进行python或者R语言代码运行,单元格也支持编辑Markdown格式的内容,首先请将单元格类型切换到Markdown,如下图所示。然后请双击要编辑的单元格。
Markdown 是一种轻量级的纯文本格式化语言。它用简洁的语法代替排版,而不像一般我们用的文字处理软件 Word 或 Pages 有大量的排版、字体设置。以下为一些语法举例: 在 Markdown 中,如果一段文字被定义为标题,只要在这段文字前加 # 号即可。 如:# 一级标题 如果你需要引用一小段别处的句子,那么就要用引用的格式。只需要在文本前加入 > 这种尖括号(大于号)即可。 插入链接与插入图片的语法很像,区别在一个 !号 图片为:![](){ImgCap}{/ImgCap} 链接为:[]()