是時候談“獸工智能”了
電影《怪醫(yī)杜立德》里的杜立德博士有一項神奇的本領——無需借助任何科學儀器的輔助便可與動物交流,起因是他聽懂了鳥語,給一只受傷的貓頭鷹拔掉了刺,后來被各種動物知道了,隨即他的診所便給動物們看起了病。
隨著劇情的發(fā)展,一只猴子告訴他馬戲團的獅子要跳樓自殺,于是杜立德博士趕緊跑去馬戲團。
救下了馬戲團想要跳樓的老虎。
拋開電影本身的喜劇色彩,這個設定也是很正確的,因為貓頭鷹和猴子是電影傳話的關鍵人物,而現(xiàn)階段人類對一些鳥類和一些靈長類的行為與語言理解是最透徹的。
電影照進現(xiàn)實,可能沒那么容易
隨著科技發(fā)展,像杜立德博士一樣的與動物溝通交流變得越來越趨近現(xiàn)實。最近,來自華盛頓大學和艾倫人工智能研究所的團隊就合力開發(fā)了新的神經(jīng)網(wǎng)絡模型,可以來理解和預測狗的行為。研究人員在狗身上安裝了 GoPro 相機用于記錄狗的行為,并且通過在四條腿和尾巴上安裝的傳感器來傳遞運動數(shù)據(jù)。
通過對狗的肢體動作內容和在 GoPro 上記錄的內容進行比對分析,由此可以知曉狗在什么樣的動作下看到了什么,并對其行為進行預測。
而在預測狗的行為之前,人們在狗的語言識別上已經(jīng)進行了不少研究,甚至可以聽懂它們講話。
生物學家 Slobodchikoff 創(chuàng)辦了一家名為 Zoolingua 的公司, 該公司開發(fā)了一種算法,可以將土撥鼠的聲音轉為英語。他認為對土撥鼠叫聲的研究同樣可以用到貓狗身上,原理很簡單,即收集大量的狗狗視頻,然后用這些素材來訓練人工智能算法,用人工來標記每一種叫聲和搖尾巴的動作表達什么意思,最終將其翻譯出來。
這是典型的有監(jiān)督學習方式,需要的大數(shù)據(jù)首先要通過人工標注,但是由于采樣的范圍和機器內存等的局限性,這種方式在翻譯的準確度和豐富性方面尚有待提高。相較之下,為實現(xiàn)人狗溝通而設計的No More Woof耳機要更勝一籌。
No More Woof是由北歐發(fā)明與發(fā)現(xiàn)協(xié)會( NCID )開發(fā)的,應用的是三個不同技術領域的最新技術的組合,即腦電圖傳感、微運算和特殊腦機接口軟件。這些傳感器是腦電圖錄音機,先錄下狗大腦內流動的離子電流造成的電壓波動,再將其傳到一部微型電腦上,把它們進行解釋。
但這里依然有幾個問題尚未解決。首先是腦機接口至今尚未取得突破性進展,而使用在狗身上顯然是外置的,在識別精度上可能依然達不到預期。其次,以上兩種翻譯機均只能識別一些簡單的表達(后者強一些),比如“我餓了”、“我很累”、“我想出去散步”等。最重要的是,就現(xiàn)階段的技術,還不能像電影里的交互,你能聽懂狗,但狗卻不能聽懂你。
從技術上說,識別動物的表情、動作、叫聲并不難,現(xiàn)在的 AI 算法可以快速對這些信息進行識別并分類,但更難的是正確解讀這些信息表達的含義。人類對于動物行為和語言的認知程度并不相同,短時間內難以全部理解,甚至一度遭遇瓶頸,那么對動物的語音乃至行為的研究又該向何處發(fā)展呢?

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 一文看懂視覺語言動作模型(VLA)及其應用