精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:統一通信/協作企業動態 → 正文

Facebook開源VoiceLoop 用語音文字合成新語音

責任編輯:editor007 |來源:企業網D1Net  2017-09-05 19:49:44 本文摘自:雷鋒網

Facebook研究員近日開源了他們在今年七月發表的一篇論文(Voice Synthesis for in-the-Wild Speakers via a Phonological Loop)中的語音合成方法。

在論文中,他們提出了一種新的文字轉語音的神經網絡方法,可以將從開放場景下采樣到的聲音中提取的文字轉化為語音。不同于其他的文字轉語音系統,這種方法能夠處理從公開演講中提取出來的非約束性的樣本,而且網絡架構比現存的解決同樣問題的架構要簡單。它基于新的移位緩沖內存儲器區(shifting buffer working memory),這個緩沖區也可以用于評估注意力,計算輸出音頻,以及自身的更新。

通過使用與上下文無關( context-free)的查找表對輸入語句進行編碼,該表的每個條目包含一個字符或音素。同樣,能通過一個短向量來表示說話者,這個短向量也適用于新說話者。而且在生成音頻之前,優先準備好緩沖區可以使生成的語音具有可變性。

上圖為實驗樣例中生成的注意力圖,X 軸是輸出時間(聲學樣本),Y 軸是輸入(文本/音素)。

代碼地址:https://github.com/facebookresearch/loop

論文地址:https://arxiv.org/abs/1707.06588

關鍵字:Facebook開源

本文摘自:雷鋒網

x Facebook開源VoiceLoop 用語音文字合成新語音 掃一掃
分享本文到朋友圈
當前位置:統一通信/協作企業動態 → 正文

Facebook開源VoiceLoop 用語音文字合成新語音

責任編輯:editor007 |來源:企業網D1Net  2017-09-05 19:49:44 本文摘自:雷鋒網

Facebook研究員近日開源了他們在今年七月發表的一篇論文(Voice Synthesis for in-the-Wild Speakers via a Phonological Loop)中的語音合成方法。

在論文中,他們提出了一種新的文字轉語音的神經網絡方法,可以將從開放場景下采樣到的聲音中提取的文字轉化為語音。不同于其他的文字轉語音系統,這種方法能夠處理從公開演講中提取出來的非約束性的樣本,而且網絡架構比現存的解決同樣問題的架構要簡單。它基于新的移位緩沖內存儲器區(shifting buffer working memory),這個緩沖區也可以用于評估注意力,計算輸出音頻,以及自身的更新。

通過使用與上下文無關( context-free)的查找表對輸入語句進行編碼,該表的每個條目包含一個字符或音素。同樣,能通過一個短向量來表示說話者,這個短向量也適用于新說話者。而且在生成音頻之前,優先準備好緩沖區可以使生成的語音具有可變性。

上圖為實驗樣例中生成的注意力圖,X 軸是輸出時間(聲學樣本),Y 軸是輸入(文本/音素)。

代碼地址:https://github.com/facebookresearch/loop

論文地址:https://arxiv.org/abs/1707.06588

關鍵字:Facebook開源

本文摘自:雷鋒網

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 习水县| 金塔县| 准格尔旗| 犍为县| 进贤县| 抚顺县| 茶陵县| 仙桃市| 台州市| 曲阳县| 富平县| 逊克县| 盐池县| 铜陵市| 玛曲县| 福安市| 荥阳市| 建水县| 泾源县| 鄂尔多斯市| 靖西县| 石棉县| 天柱县| 峨山| 通辽市| 苏尼特左旗| 偃师市| 高青县| 辽宁省| 遵义县| 莱州市| 平泉县| 工布江达县| 德格县| 万全县| 章丘市| 双桥区| 大城县| 敖汉旗| 庆元县| 泰兴市|