JupyterLab (Watson Studio)
利用 JupyterLab,您可以在选项卡式工作区中并排处理文档和活动,例如 Jupyter Notebook、Python 脚本、文本编辑器和终端。IBM Watson Studio 中包括的 JupyterLab IDE 提供有构建块,可以满足您以 Python 开发交互式的探索分析计算的所有需求。
访问 JupyterLab
IBM Watson Studio 中的 JupyterLab 随附用于访问 Git 存储库的扩展,该扩展允许您在存储库分支中工作。例如,要使用 JupyterLab 来处理 Notebook 或 Python 脚本,您必须创建一个与 GIT 集成并实现只能使用 JupyterLab IDE 来编辑 Notebook 的项目。
请观看以下视频,以了解如何启用 Git 集成以使用 Jupyter Lab IDE。
创建一个具有 Git 访问权并实现只能通过 JupyterLab 来编辑 Notebook 的项目。请参阅
创建与 GIT 集成的项目
。
在 JupyterLab 中启用项目协作。请参阅
在 JupyterLab 中协作
。
从项目操作栏上的
启动 IDE
菜单中,单击
JupyterLab
。
选择要在其中启动 JupyterLab 的环境,以及您的个人 Git 访问令牌。
Git 扩展会预先安装,以允许访问在启动时与项目建立关联的存储库,并将 Git 选项卡添加到 JupyterLab 中的左侧边栏。
Git 存储库会在启动时进行克隆,并显示在左侧边栏中
文件
选项卡上名为
project_git_repo/<your_git_repo>
的文件夹中。
重要说明
:该克隆是从创建项目时选择的 Git 存储库分支拉取而得。
在 IDE 的主工作区处理文件:
单击左侧边栏中的
文件浏览器
选项卡。
选择
project_git_repo
(克隆的 Git 文件夹),并浏览至
<your_git_repo>/assets/jupyterlab
。您在 JupyterLab 中针对文件所做的所有工作,都是在您自己的存储库克隆中执行的。
重要说明
:要将您对自己的克隆中的文件所做的更改提供给其他处理其各自 Git 存储库克隆的人员共享,您必须在
<your_git_repo>/assets/jupyterlab
文件夹(或
jupyterlab
内的任何子文件夹)中处理这些文件。只有在此文件夹中所做的文件更改可以推送到 Git 存储库,其他用户所做的更改会拉取到您的克隆中。
通过下列方式开始处理 Notebook:
在 JupyterLab 启动程序视图中,选择 Notebook 磁贴。启动程序视图在 JupyterLab 启动后显示,并且还可以通过从 JupyterLab 的“文件”菜单中单击
文件 > 新建启动程序
来打开。
选择
文件 > 新建 > Notebook
。
从本地计算机上载 Notebook 文件。
从文件创建 Notebook。
通过下列方式开始处理 Python 脚本:
从 JupyterLab 启动程序视图中,选择
Python 文件
。启动程序视图在 JupyterLab 启动后显示,并且还可以通过从 JupyterLab 的“文件”菜单中单击
文件 > 新建启动程序
来打开。
选择
文件 > 新建 > Python 文件
。
从本地计算机上载 Python 脚本。
从文件创建 Python 脚本。
注
:只能在常规
.py
Python 脚本上进行处理和协作。无法在 IPython 脚本(
.ipy
文件)上进行处理和协作。无法将这些文件推送到 Git 存储库,也无法从 Git 存储库拉取这些文件。
请先将文件更改保存到本地克隆,然后再落实到 Git 存储库。
使用左侧边栏中的
Git
选项卡,将文件更改推送到 Git 存储库:
跟踪文件的更改。
添加更改描述,并在 JupyterLab 会话中,将暂存的更改落实到存储库的本地克隆。
在 Git 选项卡上的工具栏中,单击
,以将更改推送到远程存储库,使其可供其他用户查看和访问。请解决协作处理的文件上的争用性更改所导致的任何合并冲突。
请注意,即使检查点文件在 JupyterLab UI 中不可见,在推送更改时,该文件也会推送到 Git 存储库。但是,该文件不能用于恢复 JupyterLab 中先前保存的文件更改。
从 Git 选项卡上的工具栏中,还可以将合作者所做的文件更改拉取到您的存储库克隆中。
在 JupyterLab 中协作
利用通过 JupyterLab 中的 Git 扩展来添加的 Git 版本控制系统,用户可以在 JupyterLab 中共享他们对文件所做的处理。要在处理文件时启用共享,用户必须作为合作者添加到项目中,并且必须具有关联项目 Git 存储库的访问令牌,他们需要在打开 JupyterLab 时选择该存储库。
要允许项目中的用户在 JupyterLab 中跟踪和共享文件更改,请完成下列步骤:
将用户作为合作者添加到项目中,并向其分配
管理员
或
编辑者
角色。您只能邀请目前已拥有 IBM Cloud Pak for Data 帐户的用户。请参阅
添加合作者
。
将项目 Git 存储库的相应访问许可权授予所有合作者。
指示所有合作者针对关联的项目存储库创建其自己的个人访问令牌。请参阅
针对 Git 存储库创建个人访问令牌
。
当合作者打开 JupyterLab 时,他们会在可用令牌列表中看到其个人 Git 访问令牌。
Notebook 文件和 Python 脚本
Notebook 文件和 Python 脚本位于
project_git_repo/<name_of_your_repo>
下名为
/assets/jupyterlab
的文件夹中。打开 JupyterLab 时,与项目关联的 Git 存储库就会克隆到该文件夹中。仅当您要将落实的内容发布到 Git 存储库并拉取更改时,才必须在该文件夹中创建、编辑或删除文件。只有对存储库中
jupyterlab
文件夹或任何子文件夹所做的 Git 更改才能与项目中的 Notebook 资产同步。
项目数据资产
项目数据资产列示在
project_git_repo/<name_of_your_repo>
下名为
assets/data_asset
的文件夹中。您可以在 JupyterLab 中打开、查看和处理这些资产。请注意,将常规文件添加至该文件夹时,该文件不会自动作为数据资产添加到项目中。要添加文件来作为项目数据资产,请参阅
添加项目资产
。
文件夹中的文档
您在 JupyterLab 会话的本地文件系统中创建的文件会持久存储。例如,如果停止 JupyterLab,然后改天重新启动,您会看到先前会话中的所有文件。
截至目前,JupyterLab 是 Watson Studio 中唯一适用于 Python 脚本的编辑工具。用户可以使用终端来访问运行时(仅限本地内核)或调试。这可能有助于检查日志文件、容器的内存或者运行进程所花费的 CPU,以及安装其他 Conda 软件包。为确保安全,禁用通过终端访问 Spark 内核。
Python 脚本的支持和限制
请参阅“Python 脚本所支持的配置”表。
装入和访问数据
通过单击 JupyterLab 操作栏上的
查找并添加数据
图标 (
),可以按照在 Notebook 编辑器中处理 JupyterLab Notebook 的方式,在 JupyterLab 中的 Notebook 内装入和访问数据。上载的任何文件,或者配置的任何连接,都会作为资产添加到项目中。从 JupyterLab Notebook 中,还可以使用
插入到代码中
功能来添加自动生成的代码,以访问数据。请参阅
在 Notebook 中装入和访问数据
。
添加或删除项目数据资产
您应该从“查找并添加数据”Notebook 侧边栏上载要在 Notebook 中使用的数据文件,因为这些文件会自动作为数据资产添加到项目中。您在 JupyterLab 操作栏上单击
查找并添加数据
图标 (
) 时,就会打开数据侧边栏。
如果您已在 JupyterLab 中创建数据文件,并且要将这些文件添加到项目来作为数据资产,您可以这样做。但是,请注意,这些文件必须位于存储库克隆的
project_data_assets
文件夹中。要将这些文件作为数据资产来添加到项目中,请完成下列步骤:
在项目的“资产”页面上,单击
查找并添加数据
图标 (
),然后选择
文件
选项卡。
选中要作为资产添加到项目中的文件。
从“操作”列表中,选择
添加为数据资产
并应用更改。
如果从 JupyterLab 中的
project_data_assets
文件夹中删除数据资产,那么必须通过下列方式,在项目的“资产”页面上予以指出:
在“查找并添加数据”侧边栏中的
文件
选项卡上,选中该数据资产。
从“操作”列表中,选择
删除
并应用更改。
在 JupyterLab 外部使用 Notebook
在 JupyterLab 中创建并推送到存储库,然后与项目同步的 Notebook 只能在 JupyterLab 中编辑。在 JupyterLab 外部,只能从项目的“资产”页面以查看(只读)方式打开这些 Notebook。
在 Notebook 查看器中打开 Notebook 后,可以执行下列操作:
将指向该 Notebook 的链接分享给其他用户。
下载该 Notebook。
创建作业,以便在其中运行该 Notebook。请参阅
调度 Notebook 作业
。
在 JupyterLab 外部使用 Python 脚本
在 JupyterLab 中创建并推送到存储库,然后与项目同步的 Python 脚本会作为脚本添加到项目的
资产
页面中。
您可以执行下列操作:
创建作业,以便在其中运行脚本。可以从项目的“资产”或“作业”页面执行此操作。
将该脚本提升到部署空间。请参阅
部署 Python 脚本
。
支持的扩展
目前,支持下列 JupyterLab 扩展:
JupyterLab git 扩展
Jupyter nbdime 扩展
存在下列限制:
无法从 JupyterLab 将 Notebook 文件导出为 PDF。但是,可以从列表中选择其他导出文件格式。
列示在
project_git_repo/<name_of_your_repo>
下
assets/data_asset
文件夹中的项目数据资产是只读的。
了解更多信息
使用提供的 JupyterLab 环境
创建您自己的 JupyterLab 环境
创建用于运行 Notebook 或 Python 脚本的作业
在 Carolina by Dulles Research 中执行 SAS 代码
了解可以在 JupyterLab 中执行的操作:
Jupyter Lab: Evolution of the Jupyter Notebook