特朗普來給科大訊飛做推廣?說好的5G高科技封鎖清單呢?
算力探園記
合肥,這座位于江淮之間的文化老城“廬州”,從上世紀90年代“呼應(yīng)浦東開發(fā),建設(shè)新合肥”,到“長三角副中心”,再到如今的城市地位上升至國家戰(zhàn)略,合肥“發(fā)展坐標”的每一次調(diào)整,都伴隨這座城市“能級”的不斷增強。
依托中科大等知名高校的人才資源,在科大訊飛領(lǐng)銜的中國聲谷,扎堆高新區(qū) “量子企業(yè)一條街”,實現(xiàn)一億度運行的人造太陽“東方超環(huán)”等一批企業(yè)帶動下,合肥在為下一波產(chǎn)業(yè)革命中的競爭與合作積攢能量。以“技術(shù)驅(qū)動+應(yīng)用引領(lǐng)”為方向,推動合肥在中國人工智能城市排名第五。現(xiàn)在的合肥,基本上每天誕生1戶國家高新技術(shù)企業(yè);每天申請發(fā)明專利近90個、獲得授權(quán)13個以上;每天技術(shù)合同交易額近4000萬元。
繼武漢東湖高新之后的第二站,算力智庫前往安徽合肥的中國聲谷調(diào)研,首先探訪了其中人工智能的代表企業(yè)科大訊飛,以及人工智能數(shù)據(jù)服務(wù)公司數(shù)據(jù)堂(安徽)。了解到Ai語音的應(yīng)用程度早已超出我們的想象,最新的小數(shù)據(jù)快速定制技術(shù)只需采集用戶短短幾句話就能用機器學習復刻你的聲音。另一方面,行業(yè)內(nèi)也活躍著大量數(shù)據(jù)服務(wù)公司,通過最基礎(chǔ)的數(shù)據(jù)標注及整合服務(wù),為人工智能產(chǎn)業(yè)所需的數(shù)據(jù)質(zhì)量保駕護航。
你能想象讓特朗普說流利的中文嗎?Ai可以,甚至讓特朗普說一口地道川普也不是問題。Ai模擬人聲的技術(shù)現(xiàn)階段已經(jīng)可以通過短短十句話,就能以假亂真地模擬你的聲音說出各種話,包括中英文乃至方言。
在算力智庫探訪科大訊飛(展廳)時,上來就被來自美國總統(tǒng)特朗普一口標準普通話來歡迎大家參觀科大訊飛給吸引住了。
其實,語音合成技術(shù)的應(yīng)用可能早于你的認知,應(yīng)用范圍也比你想象的更廣!
早被大規(guī)模商用的Ai語音合成已侵入你的日常生活
語音合成技術(shù)應(yīng)用其實比語音識別更早,思必馳CMO龍夢竹告訴算力智庫(ID:suanlicaijing),這項技術(shù)早已在我們身邊大規(guī)模應(yīng)用。
如Iphone的智能語音助手Siri,就是在真人語音的基礎(chǔ)上進行語音合成。如今語音合成的聲音愈發(fā)接近真人,才讓我們突然發(fā)現(xiàn)原來語音合成技術(shù)已經(jīng)可以以假亂真。
Siri美式語音的聲音提供者Susan Bennett
“其實所有涉及到機器語音反饋的背后都需要以真人語音為基礎(chǔ),只是以前的合成效果比較明顯,我們可以明顯判斷出是電腦合成而已!饼垑糁裾f。
很多人以為地圖軟件中的林志玲、岳云鵬導航是把明星請來一句一句錄下來的,其實背后是語音合成技術(shù)。2018年很火的紀錄片《創(chuàng)新中國》的配音也是合成已去世的配音家李易的聲音,其背后,就是語音合成技術(shù)實現(xiàn)的聲音復刻。
龍夢竹表示,目前語音合成在娛樂方面的應(yīng)用比較多,比如歌曲合成、明星語音復刻等。即便是去世的明星,也可以通過語音合成和Ai換臉的方式再現(xiàn)熒幕。2017年電影《星球大戰(zhàn)前傳·俠盜一號》中,已去世的女星凱麗·費雪再次以萊婭公主的形象出現(xiàn)在大銀幕上,感動了一眾影迷,這種模式以后還將更加常見,哪怕是再聽單田芳出新的評書,也不再是夢想。
《俠盜一號》中還原的萊婭公主
除了商用娛樂方面,云知聲高級研發(fā)經(jīng)理王鳴對算力智庫表示,語音合成未來在大眾日常生活中的應(yīng)用也可以很多可暢想的地方。
比如視覺障礙人士的閱讀幫助以及需求陪伴,不在父母身邊的孩子可以聽著父母聲音的故事入睡、工作忙碌的子女可以讓父母聽到自己的聲音、戀人可以隨時聽到彼此的聲音用來閱讀新聞、小說等讀物。
再比如語音的個性化定制,讓我們的智能音箱、手機助手、甚至游戲內(nèi)的語音都可以自行定制!熬秃孟裎覀兺娴挠螒蛑械钠つw一樣,可以任意更換,甚至變成我們身邊朋友的聲音!蓖貘Q說。
人工智能語音可以模擬你自己的聲音,也可以替你犯罪
Ai語音合成的技術(shù)發(fā)展早已達到無需大量的數(shù)據(jù)進行學習。思必馳CMO龍夢竹向算力智庫介紹,目前業(yè)內(nèi)主流的技術(shù)方向是小數(shù)據(jù)快速定制。
以前構(gòu)建合成系統(tǒng)需要至少上千句的音庫數(shù)據(jù)作為支撐,制作音庫費時費力。現(xiàn)在我們僅僅使用很少的數(shù)據(jù)就可以構(gòu)建出具有對應(yīng)音色的合成系統(tǒng)。
在探訪中,算力智庫也體驗了科大訊飛此前推出的聲音復刻相關(guān)應(yīng)用,用戶只需要輸入10句話,就可以復刻出自己的聲音,播報新聞、說段子、送祝福惟妙惟肖。
不過這項體驗僅限于讓機器朗讀既定的文本,每個用戶的音庫都要經(jīng)過實名認證,對此,科大訊飛有自己的考量。工作人員向算力智庫表示,目前推出的語音復刻應(yīng)用只是一種宣傳娛樂手段,但是一旦開放用戶權(quán)限,可能會被不法分子利用。
“當你接到一個電話,傳來你親人的聲音,向你借錢或者讓你轉(zhuǎn)賬,你信不信?”
記者拍攝的科大訊飛展廳
人工智能語音可以模擬你的聲音,也可以替你犯罪。尤其在大數(shù)據(jù)時代下,個人信息非常容易泄露,近兩年如Facebook、華住酒店集團等多起個人信息泄露事件讓我們愈發(fā)重視個人信息的保護,但是聲音信息的保密意識可能是我們此前從未想到過的。
前段時間剛結(jié)束的2019中國互聯(lián)網(wǎng)大會的防范治理電信網(wǎng)絡(luò)詐騙論壇上,中國傳媒大學政法學院法律系副主任鄭寧表示,技術(shù)一直以來都是雙刃劍,我們在享受技術(shù)帶來便利、新奇的同時,也會面臨技術(shù)被濫用帶來的風險。
鄭寧在論壇上總結(jié)了四種新技術(shù)結(jié)合詐騙手段的形式,其中就提到了語音合成詐騙。騙子通過騷擾電話等錄音來提取某人聲音,獲取素材后進行聲音合成,從而可以用偽造的聲音騙過對方。
另外三種詐騙方式分別為:微信語音轉(zhuǎn)發(fā)詐騙、AI換臉詐騙以及AI篩選詐騙人員系統(tǒng)。
通過少量數(shù)據(jù),將合成痕跡明顯的機器語音,轉(zhuǎn)換成更加流暢自然的語音,也正是目前Ai語音合成的主攻方向,據(jù)龍夢竹介紹,現(xiàn)有技術(shù)不僅可以讓語音流暢自然,甚至可以通過定制加入情緒,真正達到自然模擬的狀態(tài)。
就像前段時間Ai換臉技術(shù)在網(wǎng)上火了之后引發(fā)的大規(guī)模討論一樣,一旦語音合成技術(shù)被大規(guī)模應(yīng)用,是否會產(chǎn)生恐慌呢?
人工智能技術(shù)來詐騙,誰來解決?
從技術(shù)應(yīng)用方角度來說,云知聲高級研發(fā)經(jīng)理王鳴認為,我們在積極推進這項技術(shù)發(fā)展的同時,也需要考慮結(jié)合更多的技術(shù)手段來降低在應(yīng)用層面帶來的一些技術(shù)倫理問題。
“云知聲對用戶上傳的錄音數(shù)據(jù)及用這些數(shù)據(jù)訓練的模型都加入了嚴格的使用權(quán)限管理。從技術(shù)角度來說,雖然當前語音合成算法在主觀聽感上已經(jīng)可以以假亂真,但是從聲學特征上依然是有一些差異的。另外,也可以通過加入一些人耳不可感知的聲學特征‘防偽’標志,保證不影響正常用戶體驗的情況下,使合成語音可以被特定工具檢測出來,防止被惡意使用!蓖貘Q對算力智庫說道。
科大訊飛也表示,其企業(yè)級合作則需要經(jīng)過授權(quán),特定在媒體行業(yè)、客服行業(yè)等使用,確保這項技術(shù)不會被誤用、濫用。除了這些問題,社會上主要擔心的問題在于用戶的信息泄露。
本周末蘋果公司被爆出Siri監(jiān)聽用戶語音的事件,雖然蘋果公司稱每天發(fā)送的錄音請求不到1%,而且通常只有幾秒鐘,這是為了更好的提高siri的精準性,同時為了給用戶提供更好的服務(wù),仍然引起了大量的恐慌。
對此,安徽省大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟副秘書長、數(shù)據(jù)堂副總經(jīng)理張子斌從產(chǎn)業(yè)上下游的角度,解釋了目前人工智能和大數(shù)據(jù)產(chǎn)業(yè)所面臨的隱私保護問題。
張子斌表示,人工智能產(chǎn)業(yè)鏈的上游并非AI技術(shù)公司,而是人工智能數(shù)據(jù)服務(wù)公司。人工智能企業(yè)在訓練自己的AI模型時所需要的數(shù)據(jù)可以不需要他們?nèi)プ孕惺占蜆俗,而是通過人工智能數(shù)據(jù)服務(wù)公司定制相關(guān)數(shù)據(jù),這樣大大降低了人工智能企業(yè)成本及數(shù)據(jù)安全風險,這也是數(shù)據(jù)堂的主營業(yè)務(wù)。
“從產(chǎn)業(yè)鏈上下游的角度來說,我們提供的所有訓練數(shù)據(jù)都是和個人信息分離的,以語音數(shù)據(jù)為例,我們提供的都是獨立語音段落的集合,背后具體的提供者信息是完全不會出現(xiàn)的,因此,即便在上下游環(huán)節(jié)中出現(xiàn)了訓練數(shù)據(jù)的泄露情況,對于語音提供者來說,不會出現(xiàn)任何影響!
算力智庫記者探訪數(shù)據(jù)堂(左一左二為數(shù)據(jù)堂副總經(jīng)理張子斌、數(shù)據(jù)堂董事吳鑫坤)
近年來,政府也一直在聯(lián)合相關(guān)企業(yè)一起尋找新技術(shù)的管理之道。2019年6月17日,國家新一代人工智能治理專業(yè)委員會發(fā)布《新一代人工智能治理原則——發(fā)展負責任的人工智能》,提出了人工智能治理的框架和行動指南!吨卫碓瓌t》突出了發(fā)展負責任的人工智能這一主題,強調(diào)了和諧友好、公平公正、包容共享、尊重隱私、安全可控、共擔責任、開放協(xié)作、敏捷治理等八條原則。
在中國傳媒大學鄭寧看來,正如AI技術(shù)可以被用于詐騙,也可以被用于反詐騙。利用技術(shù)的方式不同,帶來的影響也不同。因此,在面對一項技術(shù)時,不僅要關(guān)注技術(shù)本身,更要關(guān)注技術(shù)的用途,將技術(shù)用于提高生活質(zhì)量。
鄭寧表示,科技發(fā)展與人民生活是相輔相成的,科技發(fā)展使得人民生活質(zhì)量有了極大的提高,因此應(yīng)當大力促進科技發(fā)展。但也要認識到科技的兩面性,科技發(fā)展的同時也會產(chǎn)生一些負面影響,應(yīng)當清楚認識并接受這一點,從而更加理性地看待科技發(fā)展,也有助于采取積極措施應(yīng)對科技發(fā)展的負面影響。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?