訂閱
糾錯
加入自媒體

北京聲智科技有限公司參評“‘維科杯’·OFweek2020(第五屆)人工智能行業(yè)技術(shù)創(chuàng)新獎”

“‘維科杯’·OFweek 2020(第五屆)人工智能行業(yè)年度評選”活動由高科技行業(yè)門戶OFweek維科網(wǎng)主辦,OFweek人工智能網(wǎng)承辦,活動旨在表彰人工智能領(lǐng)域具有突出貢獻(xiàn)的優(yōu)秀產(chǎn)品、技術(shù)及企業(yè),鼓勵更多企業(yè)投入技術(shù)創(chuàng)新;同時為行業(yè)輸送更多創(chuàng)新產(chǎn)品、前沿技術(shù),一同暢享人工智能的未來。

2020人工智能行業(yè)年度評選“OFweek (5th.)  AI Awards 2020”將于2020年9月21日-10月10日進(jìn)入網(wǎng)絡(luò)投票階段,頒獎典禮將于10月28日在深圳舉辦。

目前,活動正處于火熱的報名評審階段,業(yè)內(nèi)企業(yè)積極響應(yīng)。北京聲智科技有限公司已正式參評“‘維科杯’·OFweek2020(第五屆)人工智能行業(yè)技術(shù)創(chuàng)新獎”。

聲智是全球自主遠(yuǎn)場語音技術(shù)和多模態(tài)人工智能交互領(lǐng)域的開拓者,擁有聲學(xué)與振動、語音與語義、圖像與視頻等全棧核心算法,以及開源開放的SoundAI Azero (“壹元”)人工智能操作系統(tǒng),具有多模態(tài)感知、人機(jī)智能交互、內(nèi)容服務(wù)聚合、數(shù)據(jù)智能分析、IoT控制和即時通訊等能力,致力于連接有價值的設(shè)備、信息與服務(wù),讓機(jī)器具有自主分析決策能力。

聲智主要提供AI數(shù)字人紅外測溫系統(tǒng)、智慧電梯和安全監(jiān)管平臺、大屏智能語音指揮系統(tǒng)、智能會議轉(zhuǎn)寫與同傳系統(tǒng)、跟隨式智能擴(kuò)聲機(jī)器人、AI外呼機(jī)器人、聲紋采集與識別系統(tǒng)、智能麥克風(fēng)、智能降噪耳機(jī)、智慧辦公/醫(yī)療屏、多形態(tài)虛擬數(shù)字人、物聯(lián)網(wǎng)中臺和數(shù)據(jù)服務(wù)、大數(shù)據(jù)分析和商業(yè)智能等產(chǎn)品和服務(wù),面向智慧家居、智慧園區(qū)、智慧酒店、智慧社區(qū)、智慧座艙等新應(yīng)用場景,提升行業(yè)的智慧化程度,釋放個性化體驗。聲智由中科院聲學(xué)所團(tuán)隊創(chuàng)立,由峰瑞、洪泰、百度、毅達(dá)和中信建投資本等10余家知名機(jī)構(gòu)投資,擁有與中科院合建的聲與人工智能聯(lián)合實驗室,發(fā)起參與10余項國家行業(yè)標(biāo)準(zhǔn),獲得100余項榮譽資質(zhì)與1000余項知識產(chǎn)權(quán),服務(wù)數(shù)百家知名客戶、聯(lián)接數(shù)千萬臺智能物聯(lián)網(wǎng)設(shè)備,致力于實現(xiàn)“讓機(jī)器更智能”的使命,達(dá)成“用科技改善生活”的愿景。

參評技術(shù):多模態(tài)人工智能交互系統(tǒng)SoundAI Azero

聲智自2016年成立始終專注于多模態(tài)人工智能交互系統(tǒng)的技術(shù)突破和應(yīng)用落地。目前,人工智能產(chǎn)業(yè)發(fā)展已經(jīng)上升到我國國家發(fā)展戰(zhàn)略。國務(wù)院印發(fā)的新一代人工智能發(fā)展規(guī)劃指出,到2020年我國人工智能總體技術(shù)和應(yīng)用與世界先進(jìn)水平同步;到2025年人工智能基礎(chǔ)理論實現(xiàn)重大突破,部分技術(shù)與應(yīng)用達(dá)到世界領(lǐng)先水平;到2030年人工智能理論、技術(shù)與應(yīng)用總體達(dá)到世界領(lǐng)先水平,成為世界主要人工智能創(chuàng)新中心。同時國家“新基建”政策出臺,以人工智能、數(shù)據(jù)中心等為代表的信息基礎(chǔ)設(shè)施的基礎(chǔ)技術(shù)日趨成熟,新基建對應(yīng)用技術(shù)的需求也逐漸增強(qiáng),將會進(jìn)一步向深度應(yīng)用人工智能、5G、大數(shù)據(jù)等新一代信息技術(shù)支撐傳統(tǒng)設(shè)施轉(zhuǎn)型升級發(fā)展,進(jìn)而形成智能家居、智能金融、智慧城市、智能交通等行業(yè)領(lǐng)域的融合基礎(chǔ)設(shè)施。自新冠疫情爆發(fā)以來,飛沫和接觸傳播的高傳染性,催生了對無接觸式智能人機(jī)交互的極大需求,目前主流的人工智能系統(tǒng)多采用單一的交互模式,如語音對話系統(tǒng)、圖像識別系統(tǒng),此類相對傳統(tǒng)的系統(tǒng)基本無法應(yīng)對復(fù)雜人機(jī)交互場景,比如紅外測溫場景、電梯外呼場景、智能電梯場景,類似這類場景通常需要融合視覺、聽覺、手勢等多種交互方式,提供多模態(tài)的智能交互,一個完備的多模態(tài)人工智能交互系統(tǒng)便至關(guān)重要。人工智能(AI)技術(shù)作為一種具有巨大社會和經(jīng)濟(jì)效益的革新性技術(shù),伴隨新型硬件產(chǎn)品所代表的新一代計算平臺不斷涌現(xiàn),作為人工智能產(chǎn)業(yè)鏈上不可或缺的關(guān)鍵一環(huán),多模態(tài)人工智能交互系統(tǒng)的核心技術(shù)突破與產(chǎn)業(yè)化,將改變我國一直以來存在“缺芯少魂(操作系統(tǒng))”的卡脖子現(xiàn)狀,并對于上游智能傳感、智能芯片、智能制造以及下游的內(nèi)容生產(chǎn)、智能服務(wù)等都具有技術(shù)迭代的需求和產(chǎn)業(yè)升級的拉動,有助于建立我國聲學(xué)和人工智能領(lǐng)域的產(chǎn)業(yè)化領(lǐng)先地位,成為新一代人工智能發(fā)展的重要推動力量。根據(jù)市場調(diào)研,聲學(xué)和人工智能的融合技術(shù)在消費電子、汽車行業(yè)、教育行業(yè)、金融行業(yè)、國防行業(yè)等累計過萬億市場,僅消費電子領(lǐng)域的智能音頻設(shè)備,國內(nèi)年市場規(guī)模就在3500億左右,市場規(guī)模和發(fā)展?jié)摿薮蟆?/p>

技術(shù)介紹:

SoundAI Azero是聲智面向個人、企業(yè)和第三方組織開放的融合多傳感感知、多模態(tài)交互和類腦知識計算的新一代人工智能操作系統(tǒng),致力于連接有價值的信息、服務(wù)與設(shè)備,讓智能服務(wù)隨處可享。Azero經(jīng)過了千億次人機(jī)交互真實場景的規(guī)模驗證,可為家居、辦公、車載、會議、可穿戴等20+場景和設(shè)備提供高效的人機(jī)交互和智能決策能力。Azero集成了信息查詢、內(nèi)容聚合、IOT控制、即時通訊等數(shù)百項常用技能與服務(wù),提供簡單易用的技能開發(fā)工具和Turnkey軟硬件解決方案,支持智能音箱、智能耳機(jī)、智能眼鏡、智能開關(guān)、智能屏、機(jī)器人、AI虛擬數(shù)字人、AI音視頻會議、AI語音助理等百余個場景實例,大幅降低AI技術(shù)的應(yīng)用門檻和開發(fā)難度,快速滿足各個行業(yè)的個性化定制需求,幫助各個行業(yè)持續(xù)提升整體效率和用戶體驗。

多模態(tài)人工智能交互系統(tǒng)SoundAI Azero,以遠(yuǎn)場語音交互和遠(yuǎn)場實時通話為技術(shù)內(nèi)核,以及包括信息查詢、設(shè)備控制、內(nèi)容推薦、資訊服務(wù)、股票資訊、理財推薦等服務(wù),具有精度高、速度快、兼容好、成本低的優(yōu)勢,在用戶大規(guī)模使用的真實場景下5米遠(yuǎn)場語音和聲紋的平均識別率超過95%,全鏈條語音對話響應(yīng)速度小于1.3秒。該系統(tǒng)成果融合了聲學(xué)感知技術(shù)、語音交互技術(shù)與人工智能技術(shù),包括聲波配網(wǎng)、波束形成、聲源測向、噪聲抑制、混響消除、回聲消除、語音喚醒、端點檢測、語音識別、聲紋識別、自然語言處理、語義理解、語音合成、雙工通話、VoIP等技術(shù),以及根據(jù)真實場景識別深度優(yōu)化的機(jī)器學(xué)習(xí)模型,搭建覆蓋智能家居、智能汽車、智能會議、智能安防、智能金融、智能教育、智能醫(yī)療、智能法院、智能交通和機(jī)器人等行業(yè)領(lǐng)域在內(nèi)的遠(yuǎn)場聲學(xué)感知系統(tǒng)與場景語音交互平臺。多傳感器融合陣列的AI融合交互系統(tǒng)核心突破在真實場景下因空間距離、背景噪音、其他人聲干擾、回聲、口音等問題導(dǎo)致的語音識別低、用戶體驗差、無法感知環(huán)境等問題。為用戶提供多種適應(yīng)應(yīng)用場景的多模態(tài)融合陣型方案,綜合利用可見光與紅外的人臉識別技術(shù),通過麥克風(fēng)陣列感知技術(shù)融合深度學(xué)習(xí)技術(shù)為用戶提供全鏈條的智能語音、機(jī)器視覺相融合的交互系統(tǒng),基于VoIP以及分布式處理技術(shù),實現(xiàn)一對一、一對多、多對多的實時同步音視頻交互通信,解決傳統(tǒng)應(yīng)用場景中存在操作不便或者繁重勞動等痛點問題,提供智能化的音視頻通信體驗。

該成果已成功在小米、百度、360、聯(lián)想、中國移動、阿里、騰訊、華為、中國移動、中國聯(lián)通、中央人民廣播電臺等多個爆款產(chǎn)品中成功落地,已得到量產(chǎn)驗證。

參選述說/理由:

多模態(tài)人工智能交互系統(tǒng)SoundAI Azero持續(xù)更新和迭代技術(shù),解決更復(fù)雜聲學(xué)場景下的遠(yuǎn)場語音喚醒和識別、遠(yuǎn)場聲紋識別、聲視頻融合交互、多人追蹤和識別等影響用戶體驗的關(guān)鍵問題,以及超遠(yuǎn)場拾音與識別、局部場識別與重放等行業(yè)關(guān)鍵技術(shù),不斷融合聲學(xué)感知技術(shù)與人工智能技術(shù),深度完成垂直領(lǐng)域聲學(xué)技術(shù)的優(yōu)化與更新,打造以用戶為中心、數(shù)據(jù)為驅(qū)動、平臺為服務(wù)的完整人工智能交互技術(shù)鏈條。

目前,Azero系統(tǒng)已廣泛應(yīng)用于智能家居、智能汽車、智能安防、智能金融、智能教育、智能醫(yī)療和機(jī)器人等應(yīng)用場景,已幫助小米、百度、阿里、華為、騰訊、中國移動、中央人民廣播電臺、中國移動、中國聯(lián)通等眾多客戶戶實現(xiàn)智能語音產(chǎn)品的快速開發(fā)和量產(chǎn)上市,占據(jù)70%以上的中國語音市場份額。StrategyAnalytics和Canalys統(tǒng)計數(shù)據(jù)顯示,2018年,全球智能音箱銷量達(dá)到8620萬,其中,中國智能音箱,在阿里巴巴、百度、小米等巨頭的推動下,實際出貨量超過2000萬。其中,小米AI音箱、小愛音箱mini、小愛音箱HD、阿里巴巴天貓精靈魔盒、百度智能音箱,都搭載了聲智科技的遠(yuǎn)場智能交互系統(tǒng)SoundAIAzero。

本屆“‘維科杯’·OFweek 2020(第五屆)人工智能行業(yè)年度評選”活動將于9月21日進(jìn)入網(wǎng)絡(luò)投票階段,歡迎各位踴躍投票!

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點?帽菊靖寮,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號