相機(jī)的時(shí)代:Google Lens一年蛻變錄
人工智能時(shí)代,沒(méi)有人會(huì)覺(jué)得相機(jī)的功能只是單純的拍照。
隨著智能手機(jī)的普及,存儲(chǔ)變得更加便宜和便利,我們可以隨時(shí)拍攝各種類型的照片,從日出到日落,從他拍到自拍。旅行、學(xué)習(xí)、工作,相機(jī)滲透到我們生活的方方面面。
據(jù)估計(jì),我們的大腦皮層中有30%的神經(jīng)元是用于視覺(jué)的。每一個(gè)清醒的時(shí)刻,我們都依靠我們的視覺(jué)來(lái)感知我們周圍的環(huán)境,記住各種各樣的信息,并探索我們周圍的世界。
我們使用相機(jī)的方式并不是唯一改變的事情,相機(jī)背后的技術(shù)也在不斷發(fā)展。
隨著硬件、軟件和人工智能的不斷發(fā)展,相機(jī)將遠(yuǎn)遠(yuǎn)超越攝影,它將幫助我們搜索所看到的事物,提供更多的信息。
Google Lens就是在這樣的背景下誕生的。
Google Lens是谷歌在2017年推出的一項(xiàng)技術(shù),簡(jiǎn)單來(lái)說(shuō)就是利用手機(jī)上的攝像頭,能夠掃描產(chǎn)品、動(dòng)物、文本或者其它存在于環(huán)境當(dāng)中的事物,并成功將其識(shí)別出來(lái)。
這項(xiàng)服務(wù)依賴于由谷歌及其它來(lái)源提供的信息,借此為用戶提供與目標(biāo)相關(guān)的準(zhǔn)確資料。
谷歌在一篇新的博客文章中寫(xiě)道,Google Lens現(xiàn)在可以識(shí)別超過(guò)10億件物品。
當(dāng)然,這10億件商品來(lái)自Google購(gòu)物中提供的產(chǎn)品,因此,那些模糊不清的東西就不會(huì)包含在內(nèi)了,例如我們小時(shí)候玩的游戲機(jī)或某個(gè)稀有書(shū)籍的第一版。
除了購(gòu)物項(xiàng)目之外,谷歌鏡頭現(xiàn)在還可以識(shí)別人員、Wi-Fi網(wǎng)絡(luò)名稱和幾何形狀。
這也算谷歌鏡頭一項(xiàng)重大的進(jìn)步了。
一、Google Lens:搜索你看到了什么
當(dāng)我們看到一只可愛(ài)的秋田犬,想知道它的品種是什么?我們會(huì)怎么向別人形容它呢?黃色的、毛茸茸、愛(ài)笑,這應(yīng)該算是很多品種的狗狗共有特征。
但是,如果你用谷歌鏡頭對(duì)準(zhǔn)狗狗,那么,關(guān)于狗狗的品種和其它信息就會(huì)立馬呈現(xiàn)在你的手機(jī)上。
也就是說(shuō),Google Lens把你看到的內(nèi)容轉(zhuǎn)換為搜索查詢。
除了搜索你看到的物體,Google Lens還可以找到你的興趣點(diǎn),比如,當(dāng)我們把鏡頭對(duì)準(zhǔn)一個(gè)建筑物,就會(huì)自動(dòng)顯示相關(guān)的信息和網(wǎng)上評(píng)論,或者,我們把鏡頭對(duì)準(zhǔn)一個(gè)音樂(lè)專輯,谷歌鏡頭會(huì)自動(dòng)識(shí)別其標(biāo)題并為你提供源自網(wǎng)絡(luò)的評(píng)論內(nèi)容。
當(dāng)然,谷歌識(shí)別也不是每次都是正確的,一些特性不是那么明顯的物體,它就很有可能識(shí)別錯(cuò)誤。
Google Lens是在去年谷歌I/O開(kāi)發(fā)者大會(huì)推出的,主要運(yùn)用機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)技術(shù),當(dāng)時(shí),Google Lens還僅面向谷歌公司的Pixel系列手機(jī)產(chǎn)品,且首先登陸Pixel 2設(shè)備之上(隨后也可在初代Pixels上運(yùn)行)。
現(xiàn)在,Google Lens可以在其他安卓手機(jī)上運(yùn)行,也可在蘋(píng)果IOS系統(tǒng)運(yùn)行。
二、Google Lens:讀懂現(xiàn)實(shí)世界
在今年的I/O開(kāi)發(fā)者大會(huì)上,谷歌針對(duì)Google Lens進(jìn)行了三項(xiàng)更新。
1、智能文本選擇功能
這個(gè)功能可以將我們看到的單詞與需要的答案和操作連接起來(lái)。Google Lens可以閱讀現(xiàn)實(shí)世界的文本信息,并且可以復(fù)制并粘貼這些文本到手機(jī)上,比如食譜或Wi-Fi密碼。
為了教導(dǎo)鏡頭閱讀,谷歌開(kāi)發(fā)了一個(gè)光學(xué)字符識(shí)別(OCR)引擎,并將其與我們對(duì)搜索語(yǔ)言和知識(shí)圖的理解相結(jié)合。谷歌使用不同的字符、語(yǔ)言和字體訓(xùn)練機(jī)器學(xué)習(xí)算法,并使用Google Books掃描等資源。
有時(shí)候,Google Lens很難區(qū)分字母“o”和“0”之類的相似字符。對(duì)此,Google Lens使用谷歌搜索中的語(yǔ)言和拼寫(xiě)校正模型來(lái)更好地理解角色或單詞的可能性。比如,看到“c00kie”,Google Lens可以猜測(cè)單詞的意思是“餅干”。
2、風(fēng)格搜索
當(dāng)一件衣服或家居裝飾吸引了我們的眼球,我們可以打開(kāi)鏡頭,不僅可以得到關(guān)于那件特定物品的信息,而且還可以看到與你喜歡的款式相似的東西。
3、實(shí)時(shí)搜索
Google Lens現(xiàn)在能夠主動(dòng)地即時(shí)呈現(xiàn)信息,它將其鎖定在您用戶看到的事物上。用戶只需對(duì)準(zhǔn)相機(jī),Google Lens可以在瞬間識(shí)別出數(shù)十億個(gè)單詞、短語(yǔ)、位置和事物,用戶就可以更好地瀏覽周圍的世界。
結(jié)語(yǔ):
當(dāng)我們走在國(guó)外陌生的街道上,只需把手機(jī)鏡頭對(duì)準(zhǔn)不認(rèn)識(shí)的字,相機(jī)就可以自動(dòng)翻譯;當(dāng)我們站在某個(gè)建筑物面前,打開(kāi)相機(jī),就可以了解關(guān)于這個(gè)建筑物的一切信息。
我們現(xiàn)在正處在一個(gè)相機(jī)的時(shí)代,人工智能和機(jī)器學(xué)習(xí)的快速發(fā)展,可以使相機(jī)成為我們周圍世界的強(qiáng)大而直觀的界面。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?