百度大腦遠場語音開發(fā)套件評測—快速上手,超贊語音交互體驗
二、開發(fā)測試
本次測試環(huán)境為Ubuntu 16.04 64ibt 虛擬機,開發(fā)平臺是RK3308。
登陸開發(fā)板后,可以進入/oem 目錄,里面有開發(fā)相關說明以及一些測試示例。
(一)連接設備
1、安置在 adb 環(huán)境:sudo apt install adb
snow@snow-machine:~$ sudo apt install adb
正在讀取軟件包列表... 完成
正在分析軟件包的依賴關系樹
正在讀取狀態(tài)信息... 完成
下列軟件包是自動安裝的并且現(xiàn)在不需要了:
snapd-login-service xdg-desktop-portal xdg-desktop-portal-gtk
使用'sudo apt autoremove'來卸載它(它們)。
將會同時安裝下列軟件:
android-libadb android-libbase android-libcutils android-liblog
下列【新】軟件包將被安裝:
adb android-libadb android-libbase android-libcutils android-liblog
升級了 0 個軟件包,新安裝了 5 個軟件包,要卸載 0 個軟件包,有 6 個軟件包未被升級。
需要下載 141 kB 的歸檔。
解壓縮后會消耗 428 kB 的額外空間。
您希望繼續(xù)執(zhí)行嗎? [Y/n] y
已下載 141 kB,耗時 2秒 (48.3 kB/s)
正在選中未選擇的軟件包 android-liblog。
(正在讀取數(shù)據(jù)庫 ... 系統(tǒng)當前共安裝有 215288 個文件和目錄。)
正準備解包 .../android-liblog_1%3a6.0.1+r16-3_amd64.deb ...
正在解包 android-liblog (1:6.0.1+r16-3) ...
正在選中未選擇的軟件包 android-libbase。
正準備解包 .../android-libbase_1%3a6.0.1+r16-3_amd64.deb ...
正在解包 android-libbase (1:6.0.1+r16-3) ...
正在選中未選擇的軟件包 android-libcutils。
正準備解包 .../android-libcutils_1%3a6.0.1+r16-3_amd64.deb ...
正在解包 android-libcutils (1:6.0.1+r16-3) ...
正在選中未選擇的軟件包 android-libadb。
正準備解包 .../android-libadb_1%3a6.0.1+r16-3_amd64.deb ...
正在解包 android-libadb (1:6.0.1+r16-3) ...
正在選中未選擇的軟件包 adb。
正準備解包 .../adb_1%3a6.0.1+r16-3_amd64.deb ...
正在解包 adb (1:6.0.1+r16-3) ...
正在處理用于 libc-bin (2.23-0ubuntu11) 的觸發(fā)器 ...
正在處理用于 man-db (2.7.5-1) 的觸發(fā)器 ...
正在設置 android-liblog (1:6.0.1+r16-3) ...
正在設置 android-libbase (1:6.0.1+r16-3) ...
正在設置 android-libcutils (1:6.0.1+r16-3) ...
正在設置 android-libadb (1:6.0.1+r16-3) ...
正在設置 adb (1:6.0.1+r16-3) ...
正在處理用于 libc-bin (2.23-0ubuntu11) 的觸發(fā)器 ...
2、查看安裝結(jié)果:adb version
3、查看硬件是否連接:adb devices
4、連接硬件:adb shell
(二)WIFI連接
1、進入/data/cfg 進行wifi配置:cd /data/cfg
使用 vi 編輯 wpa_supplicant.conf:vi wpa_supplicant.conf
在設置好 wpa_supplicant.conf 后,可以通過如下命令來重新聯(lián)網(wǎng)
注意:第一次操作,調(diào)用 wpa_cli reconfigure 命令出錯
切換聯(lián)網(wǎng)命令:wpa_supplicant -B -i wlan0 -c
雖然顯示操作成功,但是查看網(wǎng)絡連接,發(fā)現(xiàn)還是未成功連接(可以看到wlan0并未顯示IP地址):
重啟系統(tǒng)(如果一次不行,可以進行多次重啟),最后成功了(可以看到wlan0顯示了分配的IP地址-192.168.1.110)
(三)運行語音識別示例
進入/oem目錄,查看語音能力相關文件: cd oem
查看文檔說明:cat readme.txt
根據(jù)文檔,相關文件應該在data目錄下,但是實際操作發(fā)現(xiàn),相關文件在oem目錄下,故進入oem目錄,執(zhí)行操作:
主要是運行以下四個命令(該命令是修改權(quán)限,啟動 alsa_audio_main_service服務,根據(jù)說明書,使用語音識別功能需要先啟動alsa服務):
執(zhí)行上述命令后,可使用ps命令檢測alsa服務是否正確啟動:ps –A|grep alsa
根據(jù)說明書,BDSpeechSDK 目錄下的sample目錄中包含語音識別示例,由于語音識別運行時依賴lib、resources、extern目錄中的庫及資源文件,所以我們需要在啟動時共享庫。
進入目錄,運行語音識別示例:
喊“小度小度,今天天氣怎么樣”的識別結(jié)果:
可以發(fā)現(xiàn),本開發(fā)套件采用了流式識別,附帶中間結(jié)果!
(四)語音識別效果測試
通過距離遠近,語速快慢,中間是否有隔離物(隔離物為電腦桌,顯示屏)等方式,對本開發(fā)套件進行了一次粗略的測試:
一米處:
有隔離:“一米一次喚醒測試”
有隔離,語速較快:“一米二次喚醒測試”
有隔離,語速較快:“今天天氣怎么樣”
無隔離,正常語速:“一米三次喚醒測試”
無隔離,語速較快:“今天天氣怎么樣”
2米處:(無隔離,正常語速)
“兩米一次喚醒測試"
“兩米二次喚醒測試”
“天天氣比較涼爽”
3米處:(無隔離,正常語速)
“三米一次喚醒測試”
“三米二次喚醒測試”
“聽說明天有臺風”
5米處:(無隔離,正常語速)
“五米一次喚醒”
“五米二次喚醒”
“臺風來了怎么辦”
6米處:(無隔離,正常語速)
注:首先需要較大聲喚醒小度,喚醒后,可識別正常音量的聲音:
“六米一次喚醒”
“六米二次喚醒”
“今天天氣好晴朗”
測試結(jié)果:
經(jīng)過上述的語音識別測試,可以發(fā)現(xiàn),本套件在5米內(nèi)可以達到比較良好的喚醒、識別效果,超過5米后,喚醒、識別效果下降比較明顯。
另外,對于一般性的用語,識別相當準確(即使達到6米,也能比較準確的識別),但是對于讀音相近的詞語(“一米”-“玉米”,“兩米”-“楊冪”等),識別準確性就有點差了(也可能跟發(fā)音有關)。
發(fā)音源跟套件之間是否有隔離物(非完全隔離),對識別的影響不是很大(沒有讀音的影響大)。
語速不是很快的情況下,一般也能正常識別。
總體而言,對識別結(jié)果影響較大的,除了距離外,就是讀音相近的詞語(發(fā)音)了。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
-
10 月之暗面,絕地反擊
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?