librosa.load - CSDN文库

相关文章推荐

有胆有识的斑马 · Python ...· 1 月前 ·

腹黑的鸵鸟 · 处理 JSON 数据 - Azure ...· 2 年前 ·

另类的饼干 · PPOCRLabel标注的txt格式如何转换 ...· 2 年前 ·

开朗的键盘 · java子线程调用jni-掘金· 2 年前 ·

体贴的柿子 · docker php-fpm ...· 2 年前 ·

librosa.load()是一个用于从[音频](https://geek.csdn.net/educolumn/137d6288ee64fa29a4a76a9adf01580c?spm=1055.2569.3001.10083)文件中加载[音频](https://geek.csdn.net/educolumn/137d6288ee64fa29a4a76a9adf01580c?spm=1055.2569.3001.10083)数据的[函数](https://geek.csdn.net/educolumn/ba94496e6cfa8630df5d047358ad9719?dp_token=eyJ0eXAiOiJKV1QiLCJhbGciOiJIUzI1NiJ9.eyJpZCI6NDQ0MDg2MiwiZXhwIjoxNzA3MzcxOTM4LCJpYXQiOjE3MDY3NjcxMzgsInVzZXJuYW1lIjoid2VpeGluXzY4NjQ1NjQ1In0.RrTYEnMNYPC7AQdoij4SBb0kKEgHoyvF-bZOG2eGQvc&spm=1055.2569.3001.10083)，它返回两个值：[音频](https://geek.csdn.net/educolumn/137d6288ee64fa29a4a76a9adf01580c?spm=1055.2569.3001.10083)数据和采样率。它可以加载多种类型的音频文件，包括WAV、MP3、OGG等等。该[函数](https://geek.csdn.net/educolumn/ba94496e6cfa8630df5d047358ad9719?dp_token=eyJ0eXAiOiJKV1QiLCJhbGciOiJIUzI1NiJ9.eyJpZCI6NDQ0MDg2MiwiZXhwIjoxNzA3MzcxOTM4LCJpYXQiOjE3MDY3NjcxMzgsInVzZXJuYW1lIjoid2VpeGluXzY4NjQ1NjQ1In0.RrTYEnMNYPC7AQdoij4SBb0kKEgHoyvF-bZOG2eGQvc&spm=1055.2569.3001.10083)的基本语法如下： librosa.load(path, sr=None, mono=True, offset=0.0, duration=None, dtype=<class 'numpy.float32'>, res_type='kaiser_best') 其中，参数path是要加载的音频文件的路径；参数sr是采样率，如果不指定则会自动从文件中获取；参数mono表示是否将音频转换为单声道，默认为True；参数offset表示读取音频文件的起始位置，默认为0.0；参数duration表示要读取的音频文件的长度，默认为None，表示读取整个文件；参数dtype表示返回的音频数据类型，默认为numpy.float32；参数res_type表示所使用的重采样方法，默认为'kaiser_best'。

librosa.load()返回值

librosa.load()函数返回一个包含音频数据和采样率的元组。具体来说，元组的第一个元素是numpy数组，包含音频信号的采样数据，第二个元素是整数，表示音频数据的采样率（每秒采样点数）。如果指定了mono=True，则返回的numpy数组将是单声道音频数据；否则，返回的numpy数组将是多声道音频数据。

y,sr=librosa.load(wav_fill_name)

这段代码使用了librosa.load函数来加载一个音频文件。其中，`wav_file_name`是音频文件的路径。 `librosa.load(wav_file_name)`会返回一个包含音频数据