資料介紹
描述
2020 年 6 月更新:DeepSpeech 0.7.* .Screenshots 的更新命令,除了 Raspberry Pi 4 保持不變。直到最近的問題是缺乏用于該任務的簡單、快速和準確的引擎。大約一年前,當我研究這個主題時,當你必須在樹莓派 3 上運行 ASR(不僅僅是熱詞檢測,還有大詞匯量轉錄)時,有幾個選擇是:
- CMUS獅身人面像
- 卡爾迪
- 碧玉
鏈接:
還有其他幾個。它們都不容易設置,也不特別適合在資源受限的環境中運行。因此,幾周前,我再次開始研究這個領域,并在一些搜索中偶然發現了 Mozilla 的 DeepSpeech 引擎。它已經存在了一段時間,但直到最近(2019 年 12 月)他們才發布了 0.6.0 版本的 ASR 引擎,其中包含 .tflite 模型以及其他重大改進。它已將英文模型的大小從 188 MB 減少到 47 MB??。“帶有 TensorFlow Lite 的 DeepSpeech v0.6 在 Raspberry Pi 4 的單核上運行速度比實時速度更快。”Mozilla 的 Reuben Morais 在新聞公告中聲稱. 所以我決定親自驗證這一說法,在不同的硬件上運行一些基準測試,并制作我自己的帶有熱詞檢測的音頻轉錄應用程序。讓我們看看結果如何。
提示:我沒有失望。
。
?
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.tflite
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.pbmm
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.scorer
下載示例音頻文件
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/audio-0.7.1.tar.gz
tar xvf audio-0.7.1.tar.gz
樹莓派 4 運行:
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
如果成功,您應該看到以下輸出
不錯!1.975 秒的聲音文件為 1.529 秒。它比實時更快。
Nvidia Jetson Nano 運行:
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
嗯..比樹莓派慢一點。這是意料之中的,因為 Nvidia Jetson CPU 不如 Raspberry Pi 4 強大。到目前為止,還沒有用于 arm64 架構的預構建二進制文件支持 GPU,因此我們無法利用 Nvidia Jetson Nano 的 GPU 進行推理加速。我認為這個任務不在 DeepSpeech 團隊的路線圖上,所以在不久的將來我會在這里自己做一些研究,并嘗試編譯該二進制文件,看看使用 GPU 可以實現哪些速度提升。但幾秒鐘的速度仍然相當不錯,根據您的項目,您可能希望選擇在 CPU 上運行 DeepSpeech 并讓 GPU 用于其他深度學習任務。
視窗 10/Linux
deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
或者如果使用啟用 GPU 的版本:
deepspeech --model deepspeech-0.7.*-models.pbmm --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
如您所見,.tflite 模型在現代 CPU 系統上實現了亞實時,這對于創建離線 ASR 應用程序的人們來說是個好消息。
以下是對比結果表:
好吧,我們對預先錄制的聲音樣本進行了基準測試,但我們真的想做一些實時轉錄。讓我們這樣做吧!
從https://github.com/mozilla/DeepSpeech-examples下載 DeepSpeech 示例
導航到 mic_vad_streaming 并安裝依賴項
pip3 install -r requirements.txt
sudo apt install portaudio19-dev
將麥克風連接到您的系統(我使用的是 Raspberry Pi 4 1 GB)。對于麥克風,盡管您可以使用任何麥克風,包括筆記本電腦的內置麥克風,但聲音的質量確實對結果有很大影響。對于這個演示,我使用的是 Seeed Studio 的ReSpeaker USB 麥克風陣列。它支持 5m 遠場拾音和 360° 拾音模式,并實現以下聲學算法:DOA(到達方向)、AEC(自動回聲消除)、AGC(自動增益控制)、NS (噪音抑制)。
python3 ../DeepSpeech-examples/mic_vad_streaming/mic_vad_streaming.py --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer
從包含模型的文件夾中執行此命令。-v 參數允許您調整 VAD(語音活動檢測)的閾值。這是演示的結果。
好,太棒了!我們可以改進嗎?是的。我們真的不希望我們的設備一直在轉錄對話。談論隱私噩夢和浪費電力。
。
- Raspberry Pi支持電視上的視頻通話
- 使用Google Coral和Raspberry Pi進行ML鳥類識別
- Raspberry Pi 4B+ IoT板上的并行計算變得簡單
- Raspberry Pi Pico上的ADC采樣和FFT
- 使用Bittle和Raspberry Pi 4的ROS SLAM
- 用Raspberry Pi的視覺識別事物
- 帶Raspberry PI的紅外遙控器
- 使用Raspberry Pi 4和RFID模塊的考勤系統
- Raspberry Pi 0 W帶溫度傳感器和LCD
- Raspberry Pi和Arduino上的手寫數字識別
- 適用于Raspberry Pi 4的Raspberry Pi Pico開發板
- NRK330X語音識別芯片離線語音喚醒模塊資料說明書!
- 樹莓派Raspberry Pi 4 Model B的電路原理圖免費下載 409次下載
- 《愛上Raspberry Pi》中譯版-電子書籍.pdf 0次下載
- raspberry_pi各版本差別 0次下載
- 離線語音控制技術特點 230次閱讀
- 基于Raspberry Pi 5的蜂窩物聯網項目 1027次閱讀
- 使用Raspberry Pi Pico W和MicroPython開發物聯網應用 1673次閱讀
- 用于測試項目的4個最佳樹莓派Raspberry Pi模擬器 5985次閱讀
- 基于樹莓派產品 Raspberry Pi微控制器板的優缺點 2710次閱讀
- 如何從Raspberry Pi Pico的模數轉換器捕獲數據計算? 2580次閱讀
- 基于Raspberry Pi Pico開發先進的家庭自動化系統 2850次閱讀
- 基于FONA通過UART與Raspberry Pi進行通訊的方案介紹 2122次閱讀
- 基于在Raspberry Pi Zero W的基礎上實現設計微型機器人 2106次閱讀
- 微雪電子ZeroW| Raspberry Pi ZeroW主板簡介 2429次閱讀
- 微雪電子Raspberry Pi 3 Model主板簡介 2873次閱讀
- 微雪電子Raspberry Pi 3 Model擴展板簡介 1512次閱讀
- 微雪電子樹莓派4代B|Raspberry Pi主板介紹 6116次閱讀
- 利用Raspberry Pi構建存儲和虛擬化時間序列數據 884次閱讀
- 一文了解Raspberry Pi 4各項性能跑分 2.9w次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數據手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關電源設計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動電路設計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多