Python pydub实现语音停顿切分_split_on_silence

相关文章推荐

耍酷的枕头 · Python txt 特定位置写入内容· 1 月前 ·

英勇无比的领带 · python ...· 1 月前 ·

痛苦的双杠 · python读取和保存json文件_pyth ...· 1 月前 ·

讲道义的闹钟 · 如何释放Python占用的内存？开发者社区· 3 天前 ·

聪明的橙子 · python内存机制与垃圾回收、调优手段 ...· 3 天前 ·

眼睛小的香瓜 · 如何删除kafka主题数据_kafka删除主 ...· 2 年前 ·

呐喊的石榴 · C#如何解决项目打开问题 error : ...· 2 年前 ·

耍酷的便当 · QT ...· 2 年前 ·

火星上的楼梯 · java - Getting error ...· 2 年前 ·

温文尔雅的茴香 · Python中字符串学习里怎样删除字符串里的 ...· 2 年前 ·

filepath = "data/" # 添加路径 filename = os.listdir(filepath) # 得到文件夹下的所有文件名称 #f = wave.open(filepath + filename[1], 'rb') #print(filename) for i in range(len(filename)): with open("data/"+failename[i], 'rb') as pcmfile: pcmdata = pcmfile.read() with wave.open("data/"+filename[i][:-3] + '.wav', 'wb') as wavfile: wavfile.setparams((1, 2, 16000, 0, 'NONE', 'NONE')) wavfile.writeframes(pcmdata)

利用语音停顿切分

利用 split_on_silence（sound，min_silence_len, silence_thresh, keep_silence=400）函数

第一个参数为待分割音频，第二个为多少秒“没声”代表沉默，第三个为分贝小于多少dBFS时代表沉默，第四个为为截出的每个音频添加多少ms无声

from pydub import AudioSegment
from pydub.silence import split_on_silence
sound = AudioSegment.from_mp3("movie300.wav")
loudness = sound.dBFS
#print(loudness)
chunks = split_on_silence(sound,
    # must be silent for at least half a second,沉默半秒
    min_silence_len=430,
    # consider it silent if quieter than -16 dBFS
    silence_thresh=-45,
    keep_silence=400
print('总分段：', len(chunks))
# 放弃长度小于2秒的录音片段
for i in list(range(len(chunks)))[::-1]:
    if len(chunks[i]) <= 2000 or len(chunks[i]) >= 10000:
        chunks.pop(i)
print('取有效分段(大于2s小于10s)：', len(chunks))
for x in range(0,int(len(sound)/1000)):
    print(x,sound[x*1000:(x+1)*1000].max_dBFS)
for i, chunk in enumerate(chunks):
    chunk.export("cutFilter300/chunk{0}.wav".format(i), format="wav")
    #print(i)

将pcm文件批量处理成wav文件import waveimport osfilepath = "data/" # 添加路径filename = os.listdir(filepath) # 得到文件夹下的所有文件名称#f = wave.open(filepath + filename[1], 'rb')#print(filename)for i in range(len(fi...

电脑面前的你，是否也希望能让电脑听命于你？当你累的时候，只需说一声“我累了”，电脑就会放着优雅的轻音乐来让你放松。或许你希望你在百忙之中，能让电脑郎读最新的NBA比分赛况….一切都是那么惬意。在此告诉你，不要灰心，我们真的可以做一个。做一个语音识别？我相信很多人到这里会有两个心态，一是好奇，二是避之千里。其实不然，你可以不用懂太多的编程技能，你甚至也可以不用懂自然语言处理技术，这篇文章虽然实现了语音操控但是绝没有你们想象的那么复杂。如果仅仅把语音识别作为一个实现了的接口的话，剩下的逻辑就仅仅是IF-ELSE这些简单的元素了。实现语音操控的原理语音操控分为语音识别和语音朗读

本文实例为大家分享了 python 实现百度语音识别的具体代码，供大家参考，具体内容如下详细百度语音识别api文档先下载 python 用SDK，可以用 python setup.py install安装 # 引入Speech SDK from aip import AipSpeech # 定义常量 APP_ID = '你的 App ID' API_KEY = '你的 API Key' SECRET_KEY = '你的 Secret Key' # 初始化AipSpeech对象 aipSpeech = AipSpeech(APP_ID, API_KEY, SECRET_KEY) 在上面代码中，常量

给儿子听的英文音频中有大量的静音段，效率很低。刚开始找个剪辑软件goldwave一个一个剪，后来发现太费劲，就想用程序实现。 python 的优势是有大量的开源库可用，于是用了两三天时间，了解了一下音频处理库，利用了成熟的库 pydub 中的函数，基本实现了想要的功能。 1.环境准备主要需要一个函数库 pydub ，这个比较好安装，用代码： pip install pydub 就可以安装。另一个是需要安装ffmpeg，具体如下链接。 ffmpeg的安装安装完成后需要配置ffmpeg的环境变量，上面

我敢保证，用过微软的语音合成后，你就会发现这是世界上最好的语音合成软件。99.99%接近人声自然流程。语调也非常自然，结合其独特的sml标记语言，合成过程中可控制主播声色和音调，以及停顿等各种的内容。再多的介绍，自己可以百度去了解，本文讲解如何使用免费的方法合成语言输出成MP3格式的音频文件。本文最后会贴出源代码，代码需要使用 Python 环境，这里会详细介绍。源码在最后，使用方法见最后。源码是 Python 脚本，不需要去微软官方注册id 不用绑定卡，微软官方的演示：https://azure.mi

一、腾讯语音合成介绍腾讯云语音合成技术（TTS）可以将任意文本转化为语音，实现让机器和应用张口说话。腾讯TTS技术可以应用到很多场景，比如，移动APP 语音播报新闻；智能设备语音提醒；依靠网上现有节目或少量录音，快速合成明星语音，降低邀约成本；支持车载导航语音合成的个性化语音播报。（废话一大堆）。。。二、腾讯语音合成 python SDK文档安装 Python SDK 前，先获取安全凭证。在第一次使用云 API 之前，用户首先需要在腾讯云控制台上申请安全凭证，安全凭证包括 SecretID 和 SecretKey, SecretID 是用于标识 API 调用者的身份，SecretKey