相关文章推荐

JupyterLab (Watson Studio)

利用 JupyterLab,您可以在选项卡式工作区中并排处理文档和活动,例如 Jupyter Notebook、Python 脚本、文本编辑器和终端。IBM Watson Studio 中包括的 JupyterLab IDE 提供有构建块,可以满足您以 Python 开发交互式的探索分析计算的所有需求。

访问 JupyterLab

IBM Watson Studio 中的 JupyterLab 随附用于访问 Git 存储库的扩展,该扩展允许您在存储库分支中工作。例如,要使用 JupyterLab 来处理 Notebook 或 Python 脚本,您必须创建一个与 GIT 集成并实现只能使用 JupyterLab IDE 来编辑 Notebook 的项目。

请观看以下视频,以了解如何启用 Git 集成以使用 Jupyter Lab IDE。

  • 创建一个具有 Git 访问权并实现只能通过 JupyterLab 来编辑 Notebook 的项目。请参阅 创建与 GIT 集成的项目
  • 在 JupyterLab 中启用项目协作。请参阅 在 JupyterLab 中协作
  • 从项目操作栏上的 启动 IDE 菜单中,单击 JupyterLab
  • 选择要在其中启动 JupyterLab 的环境,以及您的个人 Git 访问令牌。

    Git 扩展会预先安装,以允许访问在启动时与项目建立关联的存储库,并将 Git 选项卡添加到 JupyterLab 中的左侧边栏。

    Git 存储库会在启动时进行克隆,并显示在左侧边栏中 文件 选项卡上名为 project_git_repo/<your_git_repo> 的文件夹中。

    重要说明 :该克隆是从创建项目时选择的 Git 存储库分支拉取而得。

    在 IDE 的主工作区处理文件:

  • 单击左侧边栏中的 文件浏览器 选项卡。
  • 选择 project_git_repo (克隆的 Git 文件夹),并浏览至 <your_git_repo>/assets/jupyterlab 。您在 JupyterLab 中针对文件所做的所有工作,都是在您自己的存储库克隆中执行的。

    重要说明 :要将您对自己的克隆中的文件所做的更改提供给其他处理其各自 Git 存储库克隆的人员共享,您必须在 <your_git_repo>/assets/jupyterlab 文件夹(或 jupyterlab 内的任何子文件夹)中处理这些文件。只有在此文件夹中所做的文件更改可以推送到 Git 存储库,其他用户所做的更改会拉取到您的克隆中。

    通过下列方式开始处理 Notebook:

  • 在 JupyterLab 启动程序视图中,选择 Notebook 磁贴。启动程序视图在 JupyterLab 启动后显示,并且还可以通过从 JupyterLab 的“文件”菜单中单击 文件 > 新建启动程序 来打开。
  • 选择 文件 > 新建 > Notebook
  • 从本地计算机上载 Notebook 文件。
  • 从文件创建 Notebook。
  • 通过下列方式开始处理 Python 脚本:

  • 从 JupyterLab 启动程序视图中,选择 Python 文件 。启动程序视图在 JupyterLab 启动后显示,并且还可以通过从 JupyterLab 的“文件”菜单中单击 文件 > 新建启动程序 来打开。
  • 选择 文件 > 新建 > Python 文件
  • 从本地计算机上载 Python 脚本。
  • 从文件创建 Python 脚本。
  • :只能在常规 .py Python 脚本上进行处理和协作。无法在 IPython 脚本( .ipy 文件)上进行处理和协作。无法将这些文件推送到 Git 存储库,也无法从 Git 存储库拉取这些文件。

  • 请先将文件更改保存到本地克隆,然后再落实到 Git 存储库。
  • 使用左侧边栏中的 Git 选项卡,将文件更改推送到 Git 存储库:
  • 跟踪文件的更改。
  • 添加更改描述,并在 JupyterLab 会话中,将暂存的更改落实到存储库的本地克隆。
  • 在 Git 选项卡上的工具栏中,单击 “推送”图标 ,以将更改推送到远程存储库,使其可供其他用户查看和访问。请解决协作处理的文件上的争用性更改所导致的任何合并冲突。

    请注意,即使检查点文件在 JupyterLab UI 中不可见,在推送更改时,该文件也会推送到 Git 存储库。但是,该文件不能用于恢复 JupyterLab 中先前保存的文件更改。

    从 Git 选项卡上的工具栏中,还可以将合作者所做的文件更改拉取到您的存储库克隆中。

    在 JupyterLab 中协作

    利用通过 JupyterLab 中的 Git 扩展来添加的 Git 版本控制系统,用户可以在 JupyterLab 中共享他们对文件所做的处理。要在处理文件时启用共享,用户必须作为合作者添加到项目中,并且必须具有关联项目 Git 存储库的访问令牌,他们需要在打开 JupyterLab 时选择该存储库。

    要允许项目中的用户在 JupyterLab 中跟踪和共享文件更改,请完成下列步骤:

  • 将用户作为合作者添加到项目中,并向其分配 管理员 编辑者 角色。您只能邀请目前已拥有 IBM Cloud Pak for Data 帐户的用户。请参阅 添加合作者
  • 将项目 Git 存储库的相应访问许可权授予所有合作者。
  • 指示所有合作者针对关联的项目存储库创建其自己的个人访问令牌。请参阅 针对 Git 存储库创建个人访问令牌

    当合作者打开 JupyterLab 时,他们会在可用令牌列表中看到其个人 Git 访问令牌。

    Notebook 文件和 Python 脚本

    Notebook 文件和 Python 脚本位于 project_git_repo/<name_of_your_repo> 下名为 /assets/jupyterlab 的文件夹中。打开 JupyterLab 时,与项目关联的 Git 存储库就会克隆到该文件夹中。仅当您要将落实的内容发布到 Git 存储库并拉取更改时,才必须在该文件夹中创建、编辑或删除文件。只有对存储库中 jupyterlab 文件夹或任何子文件夹所做的 Git 更改才能与项目中的 Notebook 资产同步。

    项目数据资产

    项目数据资产列示在 project_git_repo/<name_of_your_repo> 下名为 assets/data_asset 的文件夹中。您可以在 JupyterLab 中打开、查看和处理这些资产。请注意,将常规文件添加至该文件夹时,该文件不会自动作为数据资产添加到项目中。要添加文件来作为项目数据资产,请参阅 添加项目资产

    文件夹中的文档

    您在 JupyterLab 会话的本地文件系统中创建的文件会持久存储。例如,如果停止 JupyterLab,然后改天重新启动,您会看到先前会话中的所有文件。

    截至目前,JupyterLab 是 Watson Studio 中唯一适用于 Python 脚本的编辑工具。用户可以使用终端来访问运行时(仅限本地内核)或调试。这可能有助于检查日志文件、容器的内存或者运行进程所花费的 CPU,以及安装其他 Conda 软件包。为确保安全,禁用通过终端访问 Spark 内核。

    Python 脚本的支持和限制

    请参阅“Python 脚本所支持的配置”表。

    装入和访问数据

    通过单击 JupyterLab 操作栏上的 查找并添加数据 图标 ( 显示“查找数据”图标 ),可以按照在 Notebook 编辑器中处理 JupyterLab Notebook 的方式,在 JupyterLab 中的 Notebook 内装入和访问数据。上载的任何文件,或者配置的任何连接,都会作为资产添加到项目中。从 JupyterLab Notebook 中,还可以使用 插入到代码中 功能来添加自动生成的代码,以访问数据。请参阅 在 Notebook 中装入和访问数据

    添加或删除项目数据资产

    您应该从“查找并添加数据”Notebook 侧边栏上载要在 Notebook 中使用的数据文件,因为这些文件会自动作为数据资产添加到项目中。您在 JupyterLab 操作栏上单击 查找并添加数据 图标 ( 显示“查找数据”图标 ) 时,就会打开数据侧边栏。

    如果您已在 JupyterLab 中创建数据文件,并且要将这些文件添加到项目来作为数据资产,您可以这样做。但是,请注意,这些文件必须位于存储库克隆的 project_data_assets 文件夹中。要将这些文件作为数据资产来添加到项目中,请完成下列步骤:

  • 在项目的“资产”页面上,单击 查找并添加数据 图标 ( 显示“查找数据”图标 ),然后选择 文件 选项卡。
  • 选中要作为资产添加到项目中的文件。
  • 从“操作”列表中,选择 添加为数据资产 并应用更改。
  • 如果从 JupyterLab 中的 project_data_assets 文件夹中删除数据资产,那么必须通过下列方式,在项目的“资产”页面上予以指出:

  • 在“查找并添加数据”侧边栏中的 文件 选项卡上,选中该数据资产。
  • 从“操作”列表中,选择 删除 并应用更改。
  • 在 JupyterLab 外部使用 Notebook

    在 JupyterLab 中创建并推送到存储库,然后与项目同步的 Notebook 只能在 JupyterLab 中编辑。在 JupyterLab 外部,只能从项目的“资产”页面以查看(只读)方式打开这些 Notebook。

    在 Notebook 查看器中打开 Notebook 后,可以执行下列操作:

  • 将指向该 Notebook 的链接分享给其他用户。
  • 下载该 Notebook。
  • 创建作业,以便在其中运行该 Notebook。请参阅 调度 Notebook 作业
  • 在 JupyterLab 外部使用 Python 脚本

    在 JupyterLab 中创建并推送到存储库,然后与项目同步的 Python 脚本会作为脚本添加到项目的 资产 页面中。

    您可以执行下列操作:

  • 创建作业,以便在其中运行脚本。可以从项目的“资产”或“作业”页面执行此操作。
  • 将该脚本提升到部署空间。请参阅 部署 Python 脚本
  • 支持的扩展

    目前,支持下列 JupyterLab 扩展:

  • JupyterLab git 扩展
  • Jupyter nbdime 扩展
  • 存在下列限制:

  • 无法从 JupyterLab 将 Notebook 文件导出为 PDF。但是,可以从列表中选择其他导出文件格式。
  • 列示在 project_git_repo/<name_of_your_repo> assets/data_asset 文件夹中的项目数据资产是只读的。
  • 了解更多信息

  • 使用提供的 JupyterLab 环境
  • 创建您自己的 JupyterLab 环境
  • 创建用于运行 Notebook 或 Python 脚本的作业
  • 在 Carolina by Dulles Research 中执行 SAS 代码
  • 了解可以在 JupyterLab 中执行的操作: Jupyter Lab: Evolution of the Jupyter Notebook
  •