1. TensorFlow

TensorFlow™ 是一个开源软件库,最初由 Google Brain Team 的研究人员和工程师开发。 TensorFlow 使用数据流图进行数值计算。图中的节点表示数学运算,边表示它们之间通信的多维数据数组(张量)。其架构灵活,你可以使用单个 API 将计算部署到桌面、服务器或移动设备中的一个或多个 CPU GPU

TensorFlow 提供了多种 API 。最低级别的 API——TensorFlow Core—— 提供了完整的编程控制。高级 API 则建立在 TensorFlow Core 的顶部。这些更高级别的 API 通常比 TensorFlow Core 更容易学习和使用。此外,更高级别的 API 使得重复性的任务在不同的用户之间变得更容易、更一致。一个高级 API 就像 tf.estimator ,可以 帮助您管理数据集 评估器 训练和推理。

TensorFlow 中的数据中心单位是张量。一个张量由一组形成任意数量维数组的原始值组成。张量的阶就是它的维数。

一些使用 Tensorflow Google 应用有:

1. RankBrain www.google.com 上大规模部署用于搜索排名的深度神经网络。

2. Inception 图像分类模型: 基准模型和对高度精确的计算机视觉模型的后续研究, 它是 在获得 2014 Imagenet 图像分类挑战赛的模型基础之上进行构建的。

3. SmartReply: 可自动生成电子邮件响应的 Deep LSTM 模型

4. Massively Multitask Networks for Drug Discovery Google 与斯坦福大学合作的识别有效候选药的的 深度 神经网络模型。

5. 用于 OCR 的设备级计算机视觉: 基于设备级的计算机视觉模型实现光学字符识别, 进行 实时翻译

Tensorflow

GitHub

2. Apache SystemML

利用大数据进行机器学习的最佳开源工具。

SystemML 是由 IBM 创建的机器学习技术,是 Apache 中的顶级项目之一,它是一个灵活、可扩展的机器学习系统。 SystemML 的重要特点如下:

1. 使用类 R 和类 Python 语言定制算法。

2. 有多种执行模式,包括 Spark MLContext Spark Batch Hadoop Batch Standalone JMLC(Java 机器学习连接器 )

3. 基于数据和聚类特性的自动优化,保证了算法的 效率和可扩展性。

4. SystemML 视为机器学习的结构化查询语言 SQL SystemML 的最新版本( 1.0.0 )支持: Java 8+ Scala 2.11+ Python 2.7/3.5+ Hadoop 2.6+ 以及 Spark 2.1+

5. 可在 Apache Spark 上运行,在 Apache Spark 上, SystemML 通过逐行查看代码,确保代码是否能够在 Apache Spark 聚类上运行。

未来对 SystemML 的开发 包括:使用 GPU 进行额外的深度学习,例如导入和运行神经网络架构以及用于训练的预训练模型。

SystemML Java 机器学习连接器 (JMLC)

Java 机器学习连接器( JMLC API 是一种编程接口,它在嵌入式时与 SystemML 进行交互。 JMLC 的主要目的是作为一个评分 API ,其中,评分函数是用 SystemML DML 语言表示的。除了评分外,嵌入式 SystemML 还可在一台机器上运行的更大的应用程序的上下文中 执行聚类等无监督学习任务。

SystemML

GitHub

3. Caffe

Caffe 是一种清晰而高效的深度学习框架

Caffe 最初由杨庆佳在加州大学伯克利分校读博期间发起,后来由伯克利 AI 研究公司( BAIR )和社区贡献者联合开发。它主要专注于用于计算机视觉应用的卷积神经网络。对于计算机视觉相关的任务来说, Caffe 是一个不错且较为流行的选择,您可以在 Caffe Model Zoo 上注册,下载很多已经成功建模的模型,直接用于开发。

1. Expressive 架构鼓励实用和创新。用配置定义的模型和优化 ,而 不需要硬编码。通过设置单个标志在 GPU 机器上进行训练,然后部署聚类或移动设备,实现 CPU GPU 之间的切换。

2. 可扩展代码 更有助于开发 。在 Caffe 开发好的 的第一年,就有 1,000 多个开发者分享 出去,对其做了重大贡献

3. Caffe 的高速使理论实验和实际应用得到了完美的结合。 Caffe 使用单个 NVIDIA K40 GPU 每天可处理超过 6000 万张图像。

4. 社区: Caffe 已经为视觉、语音和多媒体领域的学术研究项目,启动原型,甚至大规模工业应用提供支持。

Caffe 网站

GitHub

Caffe 用户群

框架应用之速成课程

Caffe Model Zoo

4. Apache Mahout

Apache Mahout 是一个 分布式线性代数框架,提供了一些经典的机器学习算法。

Mahout 旨在帮助开发人员方便快捷的实现自己的算法。 Apache Spark 是一种即拿即用的分布式后台,或者也可以将其扩展到其他分布式后台。 其特点如下:

1. 数学表达 Scala DSL

2. 支持多种分布式后端(包括 Apache Spark

3. 包含 用于 CPU / GPU / CUDA 加速的模块化本地求解器

4. Apache Mahout 应用的领域包括:协作过滤( CF ),聚类和分类

1. Taste CF.Taste Sean Owen SourceForge 上发起的一个针对协同过滤( CF )的开源项目,并在 2008 年被赠予 Mahout

2. 支持 Map-Reduce 的集群实现包括 : k-Means 、模糊 k-Means Canopy Dirichlet Mean-Shift 算法等。

3. 分布式朴素贝叶斯和互补朴素贝叶斯的分类实现。

4. 用于进化编程的分布式适应度函数。

5. 矩阵和矢量库。

Mahout 主页

GitHub

Mahout 介绍- Grant Ingersoll

5. OpenNN

OpenNN 是一个用 c++ 编写的开源类库,它实现了神经网络 建模

Opennn ( 开放神经网络图书馆 ) 以前被称为 Flood ,它 R. Lopez 2008 年泰罗尼亚技术大学的博士论文《在工程变分问题的神经网络》为基础 开发的

Opennn 使用一组函数实现了数据挖掘,并且,可以使用一个 API 将这些函数嵌入到其他软件工具中,使软件工具和预测分析任务之间进行交互。 Opennn 的主要优点就是它的高性能。由于采用 c++ 开发,因此它有更好的内存管理和更高的处理速度,并利用 OpenMP GPU 加速度( CUDA )实现 CPU 并行化。

Opennn 包中含有单元测试、许多示例和大量文档。为神经网络算法和应用的研究开发提供了一个有效的框架。神经网络设计是一个基于 OpenNN 的专业预测分析工具,这就意味着神经网络设计的神经引擎是基于 OpenNN 建立的。

OpenNN 旨在从数据集和数学模型中进行学习。

时间序列预测

最佳形状设计

数据集和数学模型

OpenNN 网站

OpenNN Artelnics GitHub

神经网络设计( Neural Designer

6. Torch

Torch 是一个开源机器学习库、科学计算框架和基于 Lua 编程语言的脚本语言。

1. 一个强大的 n 维数组

2. 有很多索引、切片、转换的程序。

3. 使用 LuaJIT 编写简单的 C 扩展。

4. 线性代数程序

5. 神经网络和基于能量的模型

6. 数字优化程序

7. GPU 支持,更加快速和高效

8. 可嵌入,带有 iOS Android 的后台端口

Torch Facebook 人工智能研究小组、 IBM Yandex Idiap 研究所使用。现在,它已经扩展到 Android iOS 系统上,研究人员 使用 Torch 来构建硬件实现数据流。

Pytorch 是一个 Python 的开源机器学习库,用于自然语言处理等应用,主要由 Facebook 的人工智能研究小组开发, Uber 的概率编程软件 "Pyro" 就是在 Pytorch 上创建的。

Torch

GitHub

7. Neuroph

Neuroph 是一 Java 编写的面向对象的神经网络框架。

Neuroph 可用于在 Java 程序中创建和训练神经网络 ,它 提供了 Java 类库以及用于创建和训练神经网络的 GUI 工具 easyNeurons Neuroph 是一个轻量级的 Java 神经网络框架, 用于开发常见的神经网络架构。它包含一个设计良好的开源 Java 库,其中包含少量与基本神经网络概念对应的基础类。它还有一个很好的 GUI 神经网络编辑器来快速创建 Java 神经网络组件。目前,已经在 Apache 2.0 许可下作为开源发布出来。

Neuroph 的核心类与人工神经元、神经元层、神经元连接、权重、传递函数、输入函数和学习规则等基本神经网络概念对应。 Neuroph 支持常见的神经网络体系结构,例如具有反向传播, Kohonen Hopfield 网络的多层感知器。所有的这些类都可以进行扩展和定制,以自定义创建神经网络和学习规则。 Neuroph 同时也支持图像识别。

Neuroph

GitHub

8. Deeplearning4j

Deeplearning4j 是第一个为 Java Scala 编写的商业级开源分布式深度学习库。

Deeplearning4j 旨在成为顶尖的即拿即用设备,而不是只是做一些配置,这使得非专业人员也能够快速的构建模型。

DL4J 可以通过 Keras (包括 TensorFlow Caffe Theano )从大多数主要框架中导入神经网络模型,它为数据科学家、数据工程师和 DevOps 提供了跨团队工具包,弥合了 Python 生态系统和 JVM 之间的障碍。现在, Keras Deeplearning4j Python API

1. 分布式 cpu gpu

2. Java, Scala and Python APIs

3. 适用于微服务体系结构

4. 通过降低迭代次数进行并行训练

5. Hadoop 上可伸缩

6. AWS 扩展上提供 Gpu 支持

1. Deeplearning4J: 神经网络平台

2. ND4J: Numpy for the JVM

3. DataVec :机器学习 ETL 操作的工具

4. JavaCPP Java C ++ 之间的桥梁

5. Arbiter :机器学习算法的评估工具

6. RL4J JVM 的深度增强学习

9. Mycroft

Mycroft 声称是世界上第一个开源助手,适用于从科学项目到企业软件应用程序的任何事情。

Mycroft 可以在任何地方运行 —— 台式计算机上、在汽车内或在树莓派上运行。这是可以自由混合、自由扩展和改进的开源软件。

10. OpenCog

OpenCog 是一个旨在构建开源人工智能框架的项目。

OpenCog 是认知算法的多元化组合,每种组合都体现了它们的创新之处。但是,认真遵守认知协同原则才是 OpenCog 整体架构强大的原因。 OpenCog 最初是基于 2008 “Novamente Cognition Engine” NCE )发布的源代码。

1. 一个图表数据库,它包含术语、原子公式、句子和关系作为超图。

2. 一个模理论解算器,作为通用图形查询引擎的一部分,用于执行图和超图模式匹配。

3. 一种称为元优化语义进化搜索的概率遗传程序( MOSES ),最初由在 Google 工作的 Moshe Looks 开发。

4. 有一个 基于 OpenPsi Unity 的虚拟世界中的交互学习应用体系。

5. 有一个由 Link Grammar RelEx 组成的自然语言输入系统,它们都采用类 AtomSpace 来表示语义和句法的关系。

6. 有一个称为 SegSim 的自然语言生成系统,它实现 NLGen NLGen2

7. Psi 理论的实现,用于处理情绪状态、驱动和冲动,称为 OpenPsi

OpenCog

GitHub

OpenCog Wiki

数十款阿里云产品限时折扣中,赶紧点击领劵开始云上实践吧!

以上为译文。

本文由北邮 @爱可可-爱生活 老师推荐, 阿里云云栖社区 组织翻译。

文章原标题《 10-opensource-toolsframeworks-for-artificial-intel 》,译者: Mags,审校:袁虎。

文章为简译,更为详细的内容,请查看 原文

无代码人工智能平台:成功的基石(Noogata)
随着公司寻求加速数字化转型,人工智能和机器学习自然而然地在其技术优先事项中排名靠前。 AI 和 ML 为处理“大数据”提供了重要工具。因此,随着组织继续收集更多种类的数据,以更高的速度生成并以更大的容量存储,他们自然会转向人工智能来扩展对这些信息的分析。 然而,一个主要障碍阻碍了大多数组织部署人工智能:开发模型和解决方案所需的技能很难获得。这使得专有开发不仅成本高昂,而且耗时。即使对于那些能够负担得起内部开发人员团队的人来说,要确保业务主管(他们了解他们希望从分析中获得什么)和数据科学家(他们知道如何开发和操作 AI 模型)保持一致也不是一件容易的事。沟通不畅增加了进一步的拖延和复杂性。 百度马艳军:深度学习开源框架建设前沿
深度学习框架被称为“智能时代的操作系统”,是推动人工智能应用大规模落地的核心动力引擎。国家“十四五”规划将深度学习框架列入“新一代人工智能”领域,作为前沿创新技术重点支持。近年来,国产深度学习开源框架迎来集中爆发,一众优秀项目在产业实践中站稳了脚跟。
人工智能和机器学习操作 (MLOps) 软件
本文研究全球及中国市场人工智能和机器学习操作 (MLOps) 软件现状及未来发展趋势,侧重分析全球及中国市场的主要企业,同时对比北美、欧洲、中国、日本、东南亚和印度等地区的现状及未来发展趋势
进击的 AI 框架,MindSpore 开源一周年
开源一年以来,累计发布 8 个新版本,汇聚超过 3000 名社区开发者的代码贡献,社区访问量超千万;现拥有超过 100 个大的基础模型,涵盖计算机视觉、NLP 等主流的 AI 和深度学习框架;累计 PR 数 超过 2 万个,下载量高达 22 万次,下载用户遍布全球;超过 100 所高校参与了社区活动,超过 40 家科研机构利用它去发表原创论文。这就是全场景 AI 计算框架 MindSpore 开源一年来取得的成绩!
带你读《深入理解AutoML和AutoDL:构建自动化机器 学习与深度学习平台》之二:自动化人工智能
本书从理论与实践的双重维度,对AutoML和AutoDL的入门知识和进阶知识做了全面介绍。
阿里开源新一代 AI 算法模型,由达摩院90后科学家研发 | 开发者必读(015期)
最炫的技术新知、最热门的大咖公开课、最有趣的开发者活动、最实用的工具干货,就在《开发者必读》!