當(dāng)人工智能遇上MATLAB,模型訓(xùn)練簡單化
人工智能在過去兩年被谷歌引爆,于是該領(lǐng)域的創(chuàng)業(yè)公司如雨后春筍般生長起來,有的做專用芯片,有的做算法,有的做機器人…人工智能到底是什么?是讓機器代替人類完成重復(fù)的生產(chǎn)線勞動嗎?這樣理解為免太簡單。人工智能絕對不只是讓機器完成模仿,從而替代重復(fù)性工作,真正的人工智能需要機器經(jīng)過訓(xùn)練和學(xué)習(xí),接近或者超越人類的智能行為。
人工智能訓(xùn)練模型的時候,數(shù)據(jù)是最重要的因素,只有通過大數(shù)據(jù)訓(xùn)練,才能讓訓(xùn)練的模型更接近于實際需求。比如,自動駕駛的模型訓(xùn)練,現(xiàn)在基本是靠自動駕駛汽車上路測試收集數(shù)據(jù)訓(xùn)練模型,路上的汽車只有采集到更多可能的場景,才能確保訓(xùn)練出的模型更接近實際路況。在人工智能訓(xùn)練中一般會遇到兩個問題:第一,數(shù)據(jù)量不夠如何訓(xùn)練模型?第二,數(shù)據(jù)量太大如何快速進行標(biāo)注?
MathWorks產(chǎn)品市場經(jīng)理趙志宏
遷移學(xué)習(xí):通過模型產(chǎn)生數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)
如果沒有數(shù)據(jù)能做人工智能嗎?這是很多初創(chuàng)公司的困惑。在筆者的概念里,正常的AI開發(fā)流程是,先采集數(shù)據(jù),再訓(xùn)練模型。在最近的Matlab大會上,MathWorks產(chǎn)品市場經(jīng)理趙志宏先生給出了一個不一樣的答案,他表示,“數(shù)據(jù)、輸出和模型是整個AI開發(fā)流程的一個步驟。如果開發(fā)者想做人工智能,又沒有太多的數(shù)據(jù),可以采用遷移學(xué)習(xí)的方法!边w移學(xué)習(xí)又是什么概念?不防從實際例子來理解。比如:通過人工智能的方式來預(yù)測風(fēng)力發(fā)電機的故障,用戶不能等到采集到大量故障數(shù)據(jù)以后再預(yù)測,這樣不符合設(shè)備維護的目標(biāo),而是先用Simulink模型建立一個風(fēng)里發(fā)電機的模型,通過校正讓這個模型非常接近風(fēng)力發(fā)電機,然后通過該模型產(chǎn)生故障數(shù)據(jù),進而訓(xùn)練機器學(xué)習(xí)或者深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)。
趙志宏先生表示,“基于模型設(shè)計的優(yōu)勢是,它是在真正做出產(chǎn)品之前建好一個模型,這個模型與實際產(chǎn)品非常的接近,不管是從數(shù)字計算、行為計算產(chǎn)生的結(jié)果與真正的結(jié)果都非常接近。很多工程師在設(shè)計產(chǎn)品的時候已經(jīng)把這個模型建好了,在這個模型上加入故障情況就很容易產(chǎn)生故障數(shù)據(jù),這比在實際設(shè)備上產(chǎn)生的故障要容易很多。因此,可以進行故障預(yù)測和維護!
通過深度學(xué)習(xí)對大數(shù)據(jù)進行標(biāo)注
隨著傳感器的大量采用,數(shù)據(jù)量進入洪荒時代,給人工智能進行特征標(biāo)記帶來困難,這時候可以采用深度學(xué)習(xí)進行標(biāo)記。趙志宏先生解釋,“深度學(xué)習(xí)的特點是不需要人工手動找出特征值,系統(tǒng)可以自動從數(shù)據(jù)里提取特征值。MATLAB里面有很多自動標(biāo)記的工具和功能。LiDAR三維點云技術(shù)可以對每一點進行標(biāo)注,把這個點聚類在一起聚成一個目標(biāo)模型,然后再把目標(biāo)具體代表的實物辨別出來。有些用戶已經(jīng)采用MATLAB的工具進行了開發(fā),著名的汽車配件公司AUTOLIV就在用這種方式進行自動數(shù)據(jù)標(biāo)注!
以膨化食品智能檢測為例,研究人員可以在用戶咬食品的時候提取特征,用咬合聲音和咬合力度衡量食品的松脆度,有了這兩個特征,還需要開發(fā)一個機器學(xué)習(xí)的分類器,而MATLAB提供了分類學(xué)習(xí)器。開發(fā)者通過這個工具不需要一個一個去試各種分類器的算法,使用MATLAB提供的APP去一次性嘗試所有算法。開始運行APP后,用戶選好數(shù)據(jù)和需要訓(xùn)練的分類器,然后進行訓(xùn)練。在訓(xùn)練過程中,用戶可以看到每個分類器的整體結(jié)果,選擇精確度最高的一個,然后進行更多的調(diào)查和研究。如果用戶沒有研究過AI,可以用MATLAB提供的APP進行學(xué)習(xí),去嘗試所有機器學(xué)習(xí)的算法。
在MATLAB里面做深度學(xué)習(xí)難嗎?用趙志宏先生的話說,只需要寫5行的MATLAB代碼,用戶就可以建出一個能夠識別食品的網(wǎng)絡(luò)。筆者已經(jīng)多年沒接觸過MATLAB了,所以無從考證,工程師朋友們?nèi)绻枰梢赃M行嘗試。
和開源代碼如何協(xié)作?
現(xiàn)在市面上的開源非常熱,工程師們可以在開源社區(qū)快速獲得需要的代碼,在人工智能領(lǐng)域也有很多開源資源,作為封閉資源的MATLAB和開源代碼相比更新速度可能會較慢,而且加上是收費模式,工程師們也擔(dān)心兩者的融合問題。當(dāng)筆者問到這個問題的時候,趙志宏先生解釋,“開源代碼背后有很多的開發(fā)團隊,他們自愿進行開發(fā),我們也有自己的開發(fā)團隊。我們并不把開源代碼和MATLAB定義為競爭關(guān)系,實際上我們各有特點和長處,有時候我們是可以與開源代碼共用。有一些開源代碼可以在MATLAB里面運行或者直接調(diào)用,我們在共同為科技進步做貢獻。我們雖然是付費軟件,但是提供的不僅是工具,還有很多的服務(wù)。”
“當(dāng)用戶使用MATLAB時遇到問題,我們后面有很強的技術(shù)支持團隊幫用戶解決這些問題。另外,我們的工具不僅是針對某一功能產(chǎn)生正確的結(jié)果,我們還考慮把這個功能做得非常的容易使用。比如針對AI應(yīng)用,我們把界面做得非常適合該專業(yè)領(lǐng)域,而且兼顧讓用戶感覺在使用熟悉的MATLAB或者Simulink的界面。這是我們的優(yōu)勢,如果用戶在MATLAB或者Simulink中增加新功能,學(xué)習(xí)門檻不會很高,容易上手設(shè)計。除了提供工具,我們還給用戶提供了很多便利,這是從開源工具中所得不到的東西!壁w志宏先生補充。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?