本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《 阿里云开发者社区用户服务协议 》和 《 阿里云开发者社区知识产权保护指引 》。如果您发现本社区中有涉嫌抄袭的内容,填写 侵权投诉表单 进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

正文


Streamlit 的核心原则如下:


1. 拥抱 Python


Streamlit app 是完全自上而下运行的脚本,没有隐藏状态。你可以利用函数调用来处理代码。只要你会写 Python 脚本,你就可以写 Streamlit app。例如,你可以按照以下代码对屏幕执行写入操作:


import streamlit as stst.write('Hello, world!')


44443.jpg


2. 把 widget 视作变量


Streamlit 中没有 callback!每一次交互都只是自上而下重新运行脚本。该方法使得代码非常干净:



import streamlit as stx = st.slider('x')
st.write(x, 'squared is', x * x)


image.jpeg

3 行代码写成的 Streamlit 交互 app。


3. 重用数据和计算


如果要下载大量数据或执行复杂计算,怎么办?关键在于在多次运行中安全地重用信息。Streamlit 引入了 cache primitive,它像一个持续的默认不可更改的数据存储器,保障 Streamlit app 轻松安全地重用信息。例如,以下代码只从 Udacity 自动驾驶项目( https://github.com/udacity/self-driving-car )中下载一次数据,就可得到一个简单快速的 app:


5543.jpg

使用 st.cache,在 Streamlit 多次运行中保存数据。代码运行说明,参见: https://gist.github.com/treuille/c633dc8bc86efaa98eb8abe76478aa81#gistcomment-3041475

7765.jpg

运行以上 st.cache 示例的输出。


简而言之,Streamlit 的工作流程如下:


  1. 每次用户交互均需要从头运行全部脚本。
  2. Streamlit 根据 widget 状态为每个变量分配最新值。
  3. 缓存保证 Streamlit 重用数据和计算。


如下图所示:


7777.jpg

用户事件触发 Streamlit 从头开始重新运行脚本。不同运行中仅保留缓存。


感兴趣的话,你可以立刻尝试!只需运行以下行:


网页浏览器将自动打开,并转向本地 Streamlit app。如果没有出现浏览器窗口,只需点击链接。


7778.jpg


这些想法很简洁,但有效,使用 Streamlit 不会妨碍你创建丰富有用的 app。我在 Zoox 和 Google X 工作时,看着自动驾驶汽车项目发展成为数 G 的视觉数据,这些数据需要搜索和理解,包括在图像数据上运行模型进而对比性能。我看到的每一个自动驾驶汽车项目都有整支团队在做这方面的工具。


在 Streamlit 中构建此类工具非常简单。以下 Streamlit demo 可以对整个 Udacity 自动驾驶汽车照片数据集执行语义搜索,对人类标注的真值标签进行可视化,并在 app 内实时运行完整的神经网络(YOLO)。

这个 300 行代码写成的 Streamlit demo 结合了语义视觉搜索和交互式神经网络推断。


整个 app 只有 300 行 Python 代码,其中大部分是机器学习代码。事实上,整个 app 里只有 23 次 Streamlit 调用。你可以试试看:


3456.png


我们与机器学习团队合作,为他们的项目而努力时,逐渐意识到这些简单的想法会带来大量重要的收益:


Streamlit app 是纯 Python 文件。你可以使用自己喜欢的编辑器和 debugger。

image.jpeg

我用 Streamlit 构建 app 时喜欢用 VSCode 编辑器(左)和 Chrome(右)。


纯 Python 代码可与 Git 等源码控制软件无缝对接,包括 commits、pull requests、issues 和 comment。由于 Streamlit 的底层语言是 Python,因此你可以免费利用这些协作工具的好处。


image.jpeg


Streamlit app 是 Python 脚本,因此你可以使用 Git 轻松执行版本控制。


Streamlit 提供即时模式的编程环境。当 Streamlit 检测出源文件变更时,只需点击 Always rerun 即可。


99988.jpg


点击「Always rerun」,保证实时编程。


缓存简化计算流程。一连串缓存函数自动创建出高效的计算流程!你可以尝试以下代码:

32145.jpg

Streamlit 中的简单计算流程。运行以上代码,参见说明: https://gist.github.com/treuille/ac7755eb37c63a78fac7dfef89f3517e#gistcomment-3041436


基本上,该流程涉及加载元数据到创建摘要等步骤(load_metadata → create_summary)。该脚本每次运行时,Streamlit 仅需重新计算该流程的子集即可。

99999.jpg


为了保证 app 的可执行性,Streamlit 仅计算更新 UI 所必需的部分。


Streamlit 适用于 GPU。Streamlit 可以直接访问机器级原语(如 TensorFlow、PyTorch),并对这些库进行补充。例如,以下 demo 中,Streamlit 的缓存存储了整个英伟达 PGGAN。该方法可使用户在更新左侧滑块时,app 执行近乎即时的推断。


image.gif


该 Streamlit app 使用 TL-GAN 展示了英伟达 PGGAN 的效果。


Streamlit 是免费开源库,而非私有 web app。你可以本地部署 Streamlit app,不用提前联系我们。你甚至可以在不联网的情况下在笔记本电脑上本地运行 Streamlit。此外,现有项目也可以渐进地使用 Streamlit。


00098.jpg

渐进地使用 Streamlit 的几种方式。


以上只是 Streamlit 功能的冰山一角而已。它最令人兴奋的一点是,这些原语可以轻松组成复杂 app,但看起来却只是简单脚本。这就要涉及架构运作原理和功能了,本文暂不谈及。


23456.jpg


Streamlit 组件图示。


我们很高兴与社区分享 Streamlit,希望它能够帮助大家轻松将 Python 脚本转化为美观实用的机器学习 app。