1.
TensorFlow
TensorFlow™
是一个开源软件库,最初由
Google Brain Team
的研究人员和工程师开发。
TensorFlow
使用数据流图进行数值计算。图中的节点表示数学运算,边表示它们之间通信的多维数据数组(张量)。其架构灵活,你可以使用单个
API
将计算部署到桌面、服务器或移动设备中的一个或多个
CPU
或
GPU
。
TensorFlow
提供了多种
API
。最低级别的
API——TensorFlow Core——
提供了完整的编程控制。高级
API
则建立在
TensorFlow Core
的顶部。这些更高级别的
API
通常比
TensorFlow Core
更容易学习和使用。此外,更高级别的
API
使得重复性的任务在不同的用户之间变得更容易、更一致。一个高级
API
就像
tf.estimator
,可以
帮助您管理数据集
、
评估器
、
训练和推理。
TensorFlow
中的数据中心单位是张量。一个张量由一组形成任意数量维数组的原始值组成。张量的阶就是它的维数。
一些使用
Tensorflow
的
Google
应用有:
1.
RankBrain
:
在
www.google.com
上大规模部署用于搜索排名的深度神经网络。
2.
Inception
图像分类模型:
基准模型和对高度精确的计算机视觉模型的后续研究,
它是
在获得
2014
年
Imagenet
图像分类挑战赛的模型基础之上进行构建的。
3.
SmartReply:
可自动生成电子邮件响应的
Deep LSTM
模型
。
4.
Massively Multitask Networks for Drug Discovery
:
Google
与斯坦福大学合作的识别有效候选药的的
深度
神经网络模型。
5.
用于
OCR
的设备级计算机视觉:
基于设备级的计算机视觉模型实现光学字符识别,
进行
实时翻译
。
Tensorflow
网
站
GitHub
2.
Apache SystemML
利用大数据进行机器学习的最佳开源工具。
SystemML
是由
IBM
创建的机器学习技术,是
Apache
中的顶级项目之一,它是一个灵活、可扩展的机器学习系统。
SystemML
的重要特点如下:
1.
使用类
R
和类
Python
语言定制算法。
2.
有多种执行模式,包括
Spark MLContext
、
Spark Batch
、
Hadoop Batch
、
Standalone
和
JMLC(Java
机器学习连接器
)
。
3.
基于数据和聚类特性的自动优化,保证了算法的
高
效率和可扩展性。
4.
将
SystemML
视为机器学习的结构化查询语言
SQL
。
SystemML
的最新版本(
1.0.0
)支持:
Java 8+
、
Scala 2.11+
、
Python 2.7/3.5+
、
Hadoop 2.6+
以及
Spark 2.1+
。
5.
可在
Apache Spark
上运行,在
Apache Spark
上,
SystemML
通过逐行查看代码,确保代码是否能够在
Apache Spark
聚类上运行。
未来对
SystemML
的开发
将
包括:使用
GPU
进行额外的深度学习,例如导入和运行神经网络架构以及用于训练的预训练模型。
SystemML
的
Java
机器学习连接器
(JMLC)
Java
机器学习连接器(
JMLC
)
API
是一种编程接口,它在嵌入式时与
SystemML
进行交互。
JMLC
的主要目的是作为一个评分
API
,其中,评分函数是用
SystemML
的
DML
语言表示的。除了评分外,嵌入式
SystemML
还可在一台机器上运行的更大的应用程序的上下文中
,
执行聚类等无监督学习任务。
SystemML
网
站
GitHub
3.
Caffe
Caffe
是一种清晰而高效的深度学习框架
。
Caffe
最初由杨庆佳在加州大学伯克利分校读博期间发起,后来由伯克利
AI
研究公司(
BAIR
)和社区贡献者联合开发。它主要专注于用于计算机视觉应用的卷积神经网络。对于计算机视觉相关的任务来说,
Caffe
是一个不错且较为流行的选择,您可以在
Caffe Model Zoo
上注册,下载很多已经成功建模的模型,直接用于开发。
1.
Expressive
架构鼓励实用和创新。用配置定义的模型和优化
,而
不需要硬编码。通过设置单个标志在
GPU
机器上进行训练,然后部署聚类或移动设备,实现
CPU
和
GPU
之间的切换。
2.
可扩展代码
更有助于开发
。在
Caffe
开发好的
的第一年,就有
1,000
多个开发者分享
了
出去,对其做了重大贡献
。
3.
Caffe
的高速使理论实验和实际应用得到了完美的结合。
Caffe
使用单个
NVIDIA K40 GPU
每天可处理超过
6000
万张图像。
4.
社区:
Caffe
已经为视觉、语音和多媒体领域的学术研究项目,启动原型,甚至大规模工业应用提供支持。
Caffe
网站
GitHub
Caffe
用户群
框架应用之速成课程
Caffe Model Zoo
4.
Apache Mahout
Apache Mahout
是一个
分布式线性代数框架,提供了一些经典的机器学习算法。
Mahout
旨在帮助开发人员方便快捷的实现自己的算法。
Apache Spark
是一种即拿即用的分布式后台,或者也可以将其扩展到其他分布式后台。
其特点如下:
1.
数学表达
Scala DSL
。
2.
支持多种分布式后端(包括
Apache Spark
)
。
3.
包含
用于
CPU / GPU / CUDA
加速的模块化本地求解器
。
4.
Apache Mahout
应用的领域包括:协作过滤(
CF
),聚类和分类
。
1.
Taste CF.Taste
是
Sean Owen
在
SourceForge
上发起的一个针对协同过滤(
CF
)的开源项目,并在
2008
年被赠予
Mahout
。
2.
支持
Map-Reduce
的集群实现包括 :
k-Means
、模糊
k-Means
、
Canopy
、
Dirichlet
和
Mean-Shift
算法等。
3.
分布式朴素贝叶斯和互补朴素贝叶斯的分类实现。
4.
用于进化编程的分布式适应度函数。
5.
矩阵和矢量库。
Mahout
主页
GitHub
Mahout
介绍-
Grant Ingersoll
5.
OpenNN
OpenNN
是一个用
c++
编写的开源类库,它实现了神经网络
建模
。
Opennn (
开放神经网络图书馆
)
以前被称为
Flood
,它
是
以
R. Lopez
在
2008
年泰罗尼亚技术大学的博士论文《在工程变分问题的神经网络》为基础
开发的
。
Opennn
使用一组函数实现了数据挖掘,并且,可以使用一个
API
将这些函数嵌入到其他软件工具中,使软件工具和预测分析任务之间进行交互。
Opennn
的主要优点就是它的高性能。由于采用
c++
开发,因此它有更好的内存管理和更高的处理速度,并利用
OpenMP
和
GPU
加速度(
CUDA
)实现
CPU
并行化。
Opennn
包中含有单元测试、许多示例和大量文档。为神经网络算法和应用的研究开发提供了一个有效的框架。神经网络设计是一个基于
OpenNN
的专业预测分析工具,这就意味着神经网络设计的神经引擎是基于
OpenNN
建立的。
OpenNN
旨在从数据集和数学模型中进行学习。
时间序列预测
最佳形状设计
数据集和数学模型
OpenNN
网站
OpenNN Artelnics GitHub
神经网络设计(
Neural Designer
)
6.
Torch
Torch
是一个开源机器学习库、科学计算框架和基于
Lua
编程语言的脚本语言。
1.
一个强大的
n
维数组
2.
有很多索引、切片、转换的程序。
3.
可
使用
LuaJIT
编写简单的
C
扩展。
4.
线性代数程序
5.
神经网络和基于能量的模型
6.
数字优化程序
7.
GPU
支持,更加快速和高效
8.
可嵌入,带有
iOS
和
Android
的后台端口
Torch
供
Facebook
人工智能研究小组、
IBM
、
Yandex
和
Idiap
研究所使用。现在,它已经扩展到
Android
和
iOS
系统上,研究人员
也
使用
Torch
来构建硬件实现数据流。
Pytorch
是一个
Python
的开源机器学习库,用于自然语言处理等应用,主要由
Facebook
的人工智能研究小组开发,
Uber
的概率编程软件
"Pyro"
就是在
Pytorch
上创建的。
Torch
网
站
GitHub
7.
Neuroph
Neuroph
是一
种
用
Java
编写的面向对象的神经网络框架。
Neuroph
可用于在
Java
程序中创建和训练神经网络
,它
提供了
Java
类库以及用于创建和训练神经网络的
GUI
工具
easyNeurons
。
Neuroph
是一个轻量级的
Java
神经网络框架,
可
用于开发常见的神经网络架构。它包含一个设计良好的开源
Java
库,其中包含少量与基本神经网络概念对应的基础类。它还有一个很好的
GUI
神经网络编辑器来快速创建
Java
神经网络组件。目前,已经在
Apache 2.0
许可下作为开源发布出来。
Neuroph
的核心类与人工神经元、神经元层、神经元连接、权重、传递函数、输入函数和学习规则等基本神经网络概念对应。
Neuroph
支持常见的神经网络体系结构,例如具有反向传播,
Kohonen
和
Hopfield
网络的多层感知器。所有的这些类都可以进行扩展和定制,以自定义创建神经网络和学习规则。
Neuroph
同时也支持图像识别。
Neuroph
网
站
GitHub
8.
Deeplearning4j
Deeplearning4j
是第一个为
Java
和
Scala
编写的商业级开源分布式深度学习库。
Deeplearning4j
旨在成为顶尖的即拿即用设备,而不是只是做一些配置,这使得非专业人员也能够快速的构建模型。
DL4J
可以通过
Keras
(包括
TensorFlow
,
Caffe
和
Theano
)从大多数主要框架中导入神经网络模型,它为数据科学家、数据工程师和
DevOps
提供了跨团队工具包,弥合了
Python
生态系统和
JVM
之间的障碍。现在,
Keras
是
Deeplearning4j
的
Python API
。
1.
分布式
cpu
和
gpu
2.
Java, Scala and Python APIs
3.
适用于微服务体系结构
4.
通过降低迭代次数进行并行训练
5.
在
Hadoop
上可伸缩
6.
在
AWS
扩展上提供
Gpu
支持
1.
Deeplearning4J:
神经网络平台
2.
ND4J: Numpy for the JVM
3.
DataVec
:机器学习
ETL
操作的工具
4.
JavaCPP
:
Java
和
C ++
之间的桥梁
5.
Arbiter
:机器学习算法的评估工具
6.
RL4J
:
JVM
的深度增强学习
9.
Mycroft
Mycroft
声称是世界上第一个开源助手,适用于从科学项目到企业软件应用程序的任何事情。
Mycroft
可以在任何地方运行
——
台式计算机上、在汽车内或在树莓派上运行。这是可以自由混合、自由扩展和改进的开源软件。
10.
OpenCog
OpenCog
是一个旨在构建开源人工智能框架的项目。
OpenCog
是认知算法的多元化组合,每种组合都体现了它们的创新之处。但是,认真遵守认知协同原则才是
OpenCog
整体架构强大的原因。
OpenCog
最初是基于
2008
年
“Novamente Cognition Engine”
(
NCE
)发布的源代码。
1.
一个图表数据库,它包含术语、原子公式、句子和关系作为超图。
2.
一个模理论解算器,作为通用图形查询引擎的一部分,用于执行图和超图模式匹配。
3.
一种称为元优化语义进化搜索的概率遗传程序(
MOSES
),最初由在
Google
工作的
Moshe Looks
开发。
4.
有一个
基于
OpenPsi
和
Unity
的虚拟世界中的交互学习应用体系。
5.
有一个由
Link Grammar
和
RelEx
组成的自然语言输入系统,它们都采用类
AtomSpace
来表示语义和句法的关系。
6.
有一个称为
SegSim
的自然语言生成系统,它实现
NLGen
和
NLGen2
。
7.
Psi
理论的实现,用于处理情绪状态、驱动和冲动,称为
OpenPsi
。
OpenCog
网
站
GitHub
OpenCog Wiki
数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!
以上为译文。
本文由北邮
@爱可可-爱生活
老师推荐,
阿里云云栖社区
组织翻译。
文章原标题《
10-opensource-toolsframeworks-for-artificial-intel
》,译者:
Mags,审校:袁虎。
文章为简译,更为详细的内容,请查看
原文
。
无代码人工智能平台:成功的基石(Noogata)
随着公司寻求加速数字化转型,人工智能和机器学习自然而然地在其技术优先事项中排名靠前。 AI 和 ML 为处理“大数据”提供了重要工具。因此,随着组织继续收集更多种类的数据,以更高的速度生成并以更大的容量存储,他们自然会转向人工智能来扩展对这些信息的分析。
然而,一个主要障碍阻碍了大多数组织部署人工智能:开发模型和解决方案所需的技能很难获得。这使得专有开发不仅成本高昂,而且耗时。即使对于那些能够负担得起内部开发人员团队的人来说,要确保业务主管(他们了解他们希望从分析中获得什么)和数据科学家(他们知道如何开发和操作 AI 模型)保持一致也不是一件容易的事。沟通不畅增加了进一步的拖延和复杂性。
百度马艳军:深度学习开源框架建设前沿
深度学习框架被称为“智能时代的操作系统”,是推动人工智能应用大规模落地的核心动力引擎。国家“十四五”规划将深度学习框架列入“新一代人工智能”领域,作为前沿创新技术重点支持。近年来,国产深度学习开源框架迎来集中爆发,一众优秀项目在产业实践中站稳了脚跟。
人工智能和机器学习操作 (MLOps) 软件
本文研究全球及中国市场人工智能和机器学习操作 (MLOps) 软件现状及未来发展趋势,侧重分析全球及中国市场的主要企业,同时对比北美、欧洲、中国、日本、东南亚和印度等地区的现状及未来发展趋势
进击的 AI 框架,MindSpore 开源一周年
开源一年以来,累计发布 8 个新版本,汇聚超过 3000 名社区开发者的代码贡献,社区访问量超千万;现拥有超过 100 个大的基础模型,涵盖计算机视觉、NLP 等主流的 AI 和深度学习框架;累计 PR 数 超过 2 万个,下载量高达 22 万次,下载用户遍布全球;超过 100 所高校参与了社区活动,超过 40 家科研机构利用它去发表原创论文。这就是全场景 AI 计算框架 MindSpore 开源一年来取得的成绩!
带你读《深入理解AutoML和AutoDL:构建自动化机器 学习与深度学习平台》之二:自动化人工智能
本书从理论与实践的双重维度,对AutoML和AutoDL的入门知识和进阶知识做了全面介绍。
阿里开源新一代 AI 算法模型,由达摩院90后科学家研发 | 开发者必读(015期)
最炫的技术新知、最热门的大咖公开课、最有趣的开发者活动、最实用的工具干货,就在《开发者必读》!