根据我在网上看到的信息,女声的正常基频范围是165到255Hz。 我正在使用Praat和名为Parselmouth的python库来获取音频文件(.wav)中女声的基频值。然而,我得到了一些超过255Hz的值(例如:400+Hz,500Hz)。 得到这样的大数值是正常的吗?
憨厚的饭盒 · 【846】自定义cmap,用于GeoPand ...· 2 天前 · |
忧郁的海龟 · WordPress ...· 7 月前 · |
强悍的小刀 · 将pandas下的数据转为str_df ...· 1 年前 · |
很酷的莴苣 · win7设置系统字体大小,加粗,TXT字体大 ...· 1 年前 · |
孤独的咖啡 · 天天写SQL,这些神奇的特性你知道吗? - 知乎· 1 年前 · |
孤独的咖啡 · 天天写SQL,这些神奇的特性你知道吗? - 知乎 1 年前 |
如果你试图捕捉说话声音的基本频率(F0),这是有可能的,但不太可能。听起来很可能是你在捕捉一个更容易产生共鸣的泛音(如F1或F2),而不是。
我对Praat的实验给我的印象是,只要有好的参数,它就能可靠地提取F0。
你要做的是通过比较音高曲线和频谱图来验证这一点。这里有一个由Praat(女性发言人)做的拟合的例子。
你可以从图片上看到,