Mozilla開源語音募集計(jì)劃Common Voice擴(kuò)大支援簡體中文
Mozilla 開始收集大陸地區(qū)漢語語音資料,更進(jìn)一步充實(shí)其公開語音資料集,現(xiàn)已收集27種不同語言的錄音音檔,并將再擴(kuò)大支援72種語言。
Common Voice (“同聲計(jì)劃”)是史上最大的開源語音轉(zhuǎn)錄文字資料集,其最新釋出的資料庫囊括來自逾4.2萬貢獻(xiàn)者以18種語言錄制的音檔,總長近1,400小時。
開發(fā)開源 Firefox 瀏覽器的非營利組織 Mozilla 宣布,其所推動之最大語音資料募集計(jì)劃 -- Common Voice 平臺已正式支援簡體中文。在廣大的 Mozilla 社群及語言專家伙伴的辛勤努力下,從現(xiàn)在開始,網(wǎng)友可到 Common Voice 的簡中網(wǎng)站錄制音檔。
語音介面是網(wǎng)際網(wǎng)路未來大勢之所趨。車用語音助理、智慧手表、智慧燈泡等,內(nèi)建語音辨識技術(shù)的裝置可謂與日俱增。然而,相關(guān)技術(shù)的創(chuàng)新仍面臨重大阻礙 -- 有意打造語音輔助方案的新創(chuàng)公司、研究人員或各種開發(fā)者都需取得大量、轉(zhuǎn)錄為文字的語音數(shù)據(jù),才能訓(xùn)練機(jī)器學(xué)習(xí)的演算法。但現(xiàn)有公開語音資料集的語音資料量與支援語種數(shù)都極其有限,而私有的語音資料不但僅掌握在少數(shù)幾家公司手中,而且費(fèi)用高昂。
有鑒于此,Mozilla 自2017年6月起展開 Common Voice 計(jì)劃,希望建立全球化的開源語音語料庫,以因應(yīng)語音介面的發(fā)展需求并突破現(xiàn)階段的市場局限。Mozilla 認(rèn)為,此類介面不該只把持在少數(shù)幾家握有語音服務(wù)技術(shù)的廠商手中,而且,Mozilla 希望能讓使用者以自己的語言和熟悉的腔調(diào)來吸收和了解資訊。
已收集包括漢語(簡中)在內(nèi)的27種語音資料
Common Voice 在2018年6月開始收集多語語音資料。從那時起,此專案便不斷壯大,變得更全球化、更具包容性。在過去10個月間,大批的熱血貢獻(xiàn)者踴躍響應(yīng),已在 Common Voice 網(wǎng)站上發(fā)起27種語言音檔的收集計(jì)劃,另外還有高達(dá)72種語言的錄音計(jì)劃正在進(jìn)行中。
最新加入的語言是漢語(簡體中文),F(xiàn)在,世界各地的網(wǎng)友都可到網(wǎng)站捐聲音,或驗(yàn)證其他人錄音的音檔。
Mozilla 開源語音募集計(jì)劃 Common Voice 擴(kuò)大支援簡體中文。
語音貢獻(xiàn)者還可選擇保留專案紀(jì)錄,以掌握自己的錄音紀(jì)錄。此外,他們也可選擇提供人口特征資訊,以協(xié)助 Mozilla 改善用以訓(xùn)練語音識別引擎的語音資料。
一如 Common Voice 收集的其他語言資料,Mozilla 對于漢語(簡中)的目標(biāo)是要累積約1萬小時之通過驗(yàn)證的音檔,因?yàn)?萬小時的音檔量才足以訓(xùn)練出完備的語音辨識系統(tǒng)。除此以外,這還附帶另一個好處:所有人都可“同聲”一氣,共同推動語音辨識技術(shù)的進(jìn)展。無論在上班途中、在公車上、午休時間、在家里,或與親朋好友齊聚一堂時,不管是透過 voice.mozilla.org 網(wǎng)站或 iOS 應(yīng)用,只要有手機(jī)或電腦,就能捐聲音或驗(yàn)證其他人的音檔。
Mozilla 開源創(chuàng)新計(jì)劃總監(jiān) George Roter 表示:“就算一個人只錄或聽幾秒鐘的音檔,但若貢獻(xiàn)者多達(dá)數(shù)十萬,加起來的資料量就非常驚人!當(dāng)更多人都愿意出一份力時,這套語音資料集的價值就能更快提升!
釋出多語語音資料集
Mozilla 將一本初衷、繼續(xù)充實(shí)語音資料集的內(nèi)涵,使其成為人人可用的公有資源。Mozilla 已于今年二月釋出第一批的多語語音資料集,其中共涵蓋18種語言的錄音音檔,包括:英文、法文、德文和華語(正體中文)等廣泛通行的語言,以及威爾斯語及卡拜爾語等較為冷門的語言。Common Voice 至今已收集逾4.2萬人貢獻(xiàn)的錄音,總長度約1,400小時,且語音資料量仍持續(xù)成長中。
在此資料集釋出后,Common Voice 的規(guī)模已超越其他同類型的語音資料集,并已將數(shù)萬人的錄音音檔及對應(yīng)文字開放給公眾使用(采 CC0 授權(quán))。任何人都可到 Common Voice 網(wǎng)站下載完整的語音資料集。
Mozilla 開源語音募集計(jì)劃 Common Voice 擴(kuò)大支援簡體中文。
George Roter 進(jìn)一步表示:“Mozilla 致力于促進(jìn)更多元創(chuàng)新之語音科技生態(tài)系的發(fā)展。我們不但希望能自行推出語音技術(shù)的產(chǎn)品,也立志傾力支援研究人員及小公司的發(fā)展,在建立全球最大公共的多語語音資料集的過程中,我們很榮幸得到越來越多人的幫助,也很感謝志愿者的熱情相挺,讓我們成功展開對于簡體中文的支持!

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動力電池技術(shù)應(yīng)用大會
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報(bào)告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機(jī)器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局