相关文章推荐
强健的蛋挞  ·  结合使用 Oracle IRM Web ...·  8 月前    · 
博学的豌豆  ·  陕西话,嫽扎咧!快来挑战陕西话版绕口令→ ...·  9 月前    · 
重情义的八宝粥  ·  selenium 循环判断 - CSDN文库·  1 年前    · 
失落的炒粉  ·  2023年度上海市白玉兰人才计划浦江A类、B ...·  1 年前    · 
聪明的大脸猫  ·  python手势识别项目案例 - CSDN文库·  1 年前    · 
Code  ›  语音识别的一些开源项目整理开发者社区
云计算 kaldi语音识别 语音识别 自然语言处理
https://cloud.tencent.com/developer/article/2058220
博学的烤土司
2 年前
作者头像
用户9925864
0 篇文章

语音识别的一些开源项目整理

前往专栏
腾讯云
开发者社区
文档 意见反馈 控制台
首页
学习
活动
专区
工具
TVP
文章/答案/技术大牛
发布
首页
学习
活动
专区
工具
TVP
返回腾讯云官网
社区首页 > 专栏 > 算法工程师的学习日志 > 语音识别的一些开源项目整理

语音识别的一些开源项目整理

作者头像
用户9925864
发布 于 2022-07-27 09:30:42
1.7K 0
发布 于 2022-07-27 09:30:42
举报

1、语音识别主流工具包

(1)ESPNET

推荐指数:★★★★★

star数量:4.4k

工具特点:支持多个语音任务,支持多个ASR端到端系统,当前最活跃的语音开源社区,是第三代端到端ASR系统的典型代表。

链接:https://github.com/espnet/espnet

(2)kaldi

推荐指数:★★★★☆

start数量:11k

工具特点:基于C++开发,工具丰富,2012-2018年最活跃的开源社区,是第二代神经网络ASR系统的典型代表。

链接:https://github.com/kaldi-asr/kaldi

(3)wenet

推荐指数:★★★★☆

start数量:1.5k

工具特点:基于pytorch,代码较为简洁,并有多个平台的runtime支持。

链接:https://github.com/wenet-e2e/wenet

(4)speechbrain

推荐指数:★★★★☆

star数量:3.3k

工具特点:该工具纯python化,易用性的设计较好。

链接:https://github.com/speechbrain/speechbrain

(5)ASRT

推荐指数:★★★★☆

star数量:4.9k

工具特点:端到端训练。

链接:https://github.com/nl8590687/ASRT_SpeechRecognition

(6)openasr

推荐指数:★★☆☆☆

start数量:100-

链接:https://github.com/by2101/OpenASR

(7)openspeech

推荐指数:★★☆☆☆

star数量:300+

链接:https://github.com/openspeech-team/openspeech

(8)lingvo

推荐指数: ★★★☆☆

star数量:2.3k

工具特点:是google基于tensorflow开发的神经网络工具包,包含了asr在内的多个任务。

链接:https://github.com/tensorflow/lingvo

(9)fairseq

推荐指数: ★★★☆☆

start数量:14.4k

工具特点:是meta基于pytorch开发的序列到序列建模的工具,包含了ASR在内的多个任务。

链接:https://github.com/pytorch/fairseq

(10)athena

star数量:700+

工具特点:端到端语音处理工具包,同样包含asr在内的多个任务。

链接:https://github.com/athena-team/athena

(11)deepspeechstar

star数量:18.5k

链接:https://github.com/mozilla/DeepSpeech

(12)wav2letter

star数量:5.9k

链接:https://github.com/flashlight/wav2letter

(13)CAT

star数量:100+

工具特点:基于CTC-CRF的ASR系统

链接:https://github.com/thu-spmi/CAT

(14)torchaudio

star数量:1.5k

工具特点:pytorch的audio库

链接:https://github.com/pytorch/audio

(15)htk

推荐指数:★★☆☆☆

工具特点:基于C开发,是第一代HMM的ASR系统的典型代表。

链接:https://htk.eng.cam.ac.uk/2、其他工具包

2、其他功能型工具包/库

(1)kaldiio

链接:https://github.com/nttcslab-sp/kaldiio

(2)librosa

链接:https://github.com/librosa/librosa

(3)warp-ctc

链接:https://github.com/baidu-research/warp-ctc

(4)warp-transducer

链接:https://github.com/HawkAaron/warp-transducer

(5)k2

链接:https://github.com/k2-fsa/k2

(6)sctk

链接:GitHub - usnistgov/SCTK

本文参与 腾讯云自媒体分享计划 ,分享自微信公众号。
原始发表:2021-11-26 ,如有侵权请联系 cloudcommunity@tencent.com 删除
https
网络安全
github
git
开源

本文分享自 算法工程师的学习日志 微信公众号, 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!

https
网络安全
github
git
开源
评论
登录 后参与评论
0 条评论
热度
最新
登录 后参与评论
关于作者
用户9925864
0
文章
0
累计阅读量
0
获赞
前往专栏
领券
  • 社区

    • 专栏文章
    • 阅读清单
    • 互动问答
    • 技术沙龙
    • 技术视频
    • 团队主页
    • 腾讯云TI平台
  • 活动

    • 自媒体分享计划
    • 邀请作者入驻
    • 自荐上首页
    • 技术竞赛
  • 资源

    • 技术周刊
    • 社区标签
    • 开发者手册
    • 开发者实验室
  • 关于

    • 社区规范
    • 免责声明
    • 联系我们
    • 友情链接

腾讯云开发者

扫码关注腾讯云开发者

扫码关注腾讯云开发者

领取腾讯云代金券

热门产品

  • 域名注册
  • 云服务器
  • 区块链服务
  • 消息队列
  • 网络加速
  • 云数据库
  • 域名解析
  • 云存储
  • 视频直播

热门推荐

  • 人脸识别
  • 腾讯会议
  • 企业云
  • CDN加速
  • 视频通话
  • 图像分析
  • MySQL 数据库
  • SSL 证书
  • 语音识别

更多推荐

  • 数据安全
  • 负载均衡
  • 短信
  • 文字识别
  • 云点播
  • 商标注册
  • 小程序开发
  • 网站监控
  • 数据迁移

Copyright © 2013 - 2023 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有

深圳市腾讯计算机系统有限公司 ICP备案/许可证号: 粤B2-20090059 深公网安备号 44030502008569

腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287

问题归档 专栏文章 快讯文章归档 关键词归档 开发者手册归档 开发者手册 Section 归档

Copyright © 2013 - 2023 Tencent Cloud.

All Rights Reserved. 腾讯云 版权所有

登录 后参与评论
 
推荐文章
强健的蛋挞  ·  结合使用 Oracle IRM Web 服务与 Eclipse WTP 1.5.4
8 月前
博学的豌豆  ·  陕西话,嫽扎咧!快来挑战陕西话版绕口令→ - 中国 - 南方财经网
9 月前
重情义的八宝粥  ·  selenium 循环判断 - CSDN文库
1 年前
失落的炒粉  ·  2023年度上海市白玉兰人才计划浦江A类、B类项目通讯评审专家名单公布_评审专家公布_上海市科学技术委员会
1 年前
聪明的大脸猫  ·  python手势识别项目案例 - CSDN文库
1 年前
今天看啥   ·   Py中国   ·   codingpro   ·   小百科   ·   link之家   ·   卧龙AI搜索
删除内容请联系邮箱 2879853325@qq.com
Code - 代码工具平台
© 2024 ~ 沪ICP备11025650号