開始使用自訂文字到語音虛擬人偶是一個直接的程式。 只需要一些影片檔案。 如果您想要為同一個演員訓練相同 自訂神經語音 ,您可以個別執行此動作。

虛擬人偶人才是個人或目標演員,其說話影片會錄製並用來建立神經虛擬人偶模型。 您必須根據虛擬人偶配音員的所有相關法律法規取得足夠的同意,才能使用其影片建立自訂文字轉換語音虛擬人偶。

您必須提供影片檔案,其中包含來自虛擬人偶人才的錄製語句,並確認其影片和語音的使用。 Microsoft 會確認錄製中的內容符合 Microsoft 所提供的預先定義指令碼。 Microsoft 會比較錄製影片語句檔案中虛擬人偶人才的臉部與訓練資料集中的隨機影片,以確保影片錄製中的虛擬人偶人才和語句影片檔案中的虛擬人偶人才來自同一個人。

您可以在 GitHub (英文) 找到多種語言的口頭同意聲明。 口頭語句的語言必須與您的錄製相同。 另請參閱語音配音員的公開。

準備自訂文字轉換語音虛擬人偶的訓練資料

您必須以您選擇的語言提供虛擬人偶人才的影片錄製。 影片錄製應包含高信噪比語音。 影片錄製中的語音不會做為自訂神經語音的訓練資料;其用途是將自訂文字訓練為語音虛擬人偶模型。

如需準備訓練資料的詳細資訊,請參閱 如何錄製影片範例

  • 什麼是文字轉換語音虛擬人偶
  • 如何錄製影片樣本
  •