精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

Google發布語音指令數據集

責任編輯:editor004

作者:Beining

2017-08-29 11:35:21

摘自:INFOQ

Google認識到,互聯網上沒有可供入門者快速入門深度學習的語言數據集,所以他們開源了語音指令數據集。TensorFlow和AIY團隊開源的數據集包含65000個錄音,每個錄音時長幾秒鐘,包含30個左右的單詞。

深度學習在語音識別方面的使用方興未艾,但是可用的訓練數據集卻不多見。雖然Kaldi這種軟件可以使用神經網絡進行訓練,但是復雜的操作嚇退了很多小白。Google認識到,互聯網上沒有可供入門者快速入門深度學習的語言數據集,所以他們開源了語音指令數據集。

TensorFlow和AIY團隊開源的數據集包含65000個錄音,每個錄音時長幾秒鐘,包含30個左右的單詞。它們是通過網站采集而來的,參與人數達到了數千人。團隊貼心地附上了訓練和預測的TensorFlow示例代碼。數據集基于署名4.0 國際(CC By 4.0)許可發布,Google表示將繼續擴充這個數據集。Google還指出,這個數據集特別適合新手入門。此外,他們也開源了收集錄音的工具。

對于想嘗鮮的人,Google制作了一個基于TensorFlow的Android程序。程序會詢問獲取麥克風權限,隨后會給出10個單詞,程序將高亮顯示已經被你讀過的單詞。

這個例子的效果和數據集有很大的關系,有可能不盡如人意,畢竟商業語言識別系統比這個復雜的多。Google希望隨著更多的數據加入,模型的識別效果會日趨完善。

使用TensorFlow進行語言識別的教程可以在這里找到。使用最新版本的TensorFlow和主流配置,模型訓練只需要幾個小時。對神經網絡進行微調可以解決不同的問題,例如不同的響應時間、大小,以及在不同平臺上的準確度取舍問題。

查看英文原文:Launching the Speech Commands Dataset

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 吕梁市| 榆社县| 闽侯县| 成都市| 吉林省| 邵武市| 黎平县| 博湖县| 巴南区| 敦煌市| 垫江县| 揭西县| 仙居县| 安西县| 大田县| 新龙县| 嫩江县| 湖南省| 承德县| 太仓市| 禹州市| 安丘市| 甘洛县| 织金县| 红桥区| 怀远县| 通河县| 晋州市| 镇沅| 资兴市| 含山县| 行唐县| 当雄县| 睢宁县| 临漳县| 长汀县| 平阳县| 金华市| 驻马店市| 龙胜| 玉屏|