2021-02-05 分類: 網(wǎng)站建設(shè)
剛剛,百度一年AI成績單官宣。
作為中國AI頭雁,百度的成績單不止代表巨頭公司業(yè)績,也代表了技術(shù)前沿現(xiàn)狀和產(chǎn)業(yè)基本情況。
而且諸多進(jìn)展,也是全新起跑線上全球AI發(fā)展的側(cè)影,比如最明顯的4大趨勢特點(diǎn):
所以百度這份2019年度成績單,究竟說了啥?又體現(xiàn)了哪些行業(yè)共同趨勢?
我們提綱挈領(lǐng)、抓取歸納其中要點(diǎn),從點(diǎn)到面一文看懂。
整份成績單中,技術(shù)突破與生態(tài)建設(shè)是重中之重,占據(jù)了一半篇幅。
剩下的一半中,應(yīng)用落地與產(chǎn)業(yè)升級(jí)占據(jù)了很大篇幅。
這也體現(xiàn)出了AI當(dāng)前發(fā)展階段——技術(shù)仍舊占據(jù)核心,但落地以及產(chǎn)業(yè)應(yīng)用正在被放到更加重要的位置。
整體上來看,百度的成績單可以分為三大部分:
首先看基礎(chǔ)研究,一年包攬了23項(xiàng)國內(nèi)外競賽冠軍。
集中于百度大腦,語音、視覺、自然語言處理、知識(shí)圖譜等方面都有成果出現(xiàn)。
特別是語音語言,在2019年迎來階段性豐收時(shí)刻。
語音識(shí)別方面,百度提出了流式多級(jí)的截?cái)嘧⒁饬δP?SMLTA,這是全球范圍內(nèi)首次實(shí)現(xiàn)流式注意力建模,超越整句注意力模型的性能,大幅提升了語音識(shí)別準(zhǔn)確率和速度(15%-20%),也是國際上首次實(shí)現(xiàn)在線語音識(shí)別大規(guī)模使用注意力模型。
語音合成方面,針對(duì)風(fēng)格遷移、音色模擬和情感擬人的三大領(lǐng)域內(nèi)挑戰(zhàn),百度推出語音合成技術(shù) Meitron ,僅需20句話就可以制作一個(gè)人的專屬聲音。
此外,作為認(rèn)知智能的“奧林匹克”,自然語言處理技術(shù)(NLP)的進(jìn)展在今年最為奪目,全球亮點(diǎn)頻出。
代表中國“參賽”的百度,交出了可持續(xù)學(xué)習(xí)的知識(shí)增強(qiáng)語義理解框架ERNIE(艾尼),在16 個(gè)中英文任務(wù)上超越BERT、XLNET,取得SOTA 。
2019年12月,ERNIE在GLUE上登頂?shù)谝?,并?個(gè)任務(wù)平均得分首次突破90大關(guān),刷新榜單歷史,超越微軟、谷歌提出的一眾國際頂級(jí)預(yù)訓(xùn)練模型。
基于語音和語言方面的突破,百度還提出了基于深度注意網(wǎng)絡(luò)的多輪響應(yīng)選擇匹配模型——DAM,口語理解能力被大幅提升。
值得一提的是,雖然全球范圍內(nèi)視覺為核心的感知智能已經(jīng)邁步廣泛落地應(yīng)用期,但在2019年,百度還是秀出了“百尺竿頭更進(jìn)一步”的基礎(chǔ)研發(fā)實(shí)力。
除了形成包括圖像、視頻、AR/VR、重要垂類、軟硬一體化五大方向的特色視覺技術(shù)矩陣。
百度還在CVPR 2019豪奪10項(xiàng)冠軍,包括OCR、物體檢測、視頻理解、目標(biāo)跟蹤等圖像與視頻技術(shù)領(lǐng)域。
此次AI復(fù)興,除了算法,另一項(xiàng)重要基礎(chǔ)變革在于計(jì)算力。
百度也在成績單中詳細(xì)分享了突破:
2019年12月,基于百度自主研發(fā)的中國首款云端全功能AI芯片“昆侖”的云服務(wù)器正式上線,在150瓦功耗下能帶來260萬億次定數(shù)的AI運(yùn)算,提供512GB/s的內(nèi)存帶寬。
量產(chǎn)了專為遠(yuǎn)場語音交互打造的百度鴻鵠芯片,100mW 左右平均工作功耗,即可支持遠(yuǎn)場語音交互核心的陣列信號(hào)處理和語音喚醒能力等等。
而且,百度的算力發(fā)展并不僅僅只是單點(diǎn)發(fā)展,也已經(jīng)與算法、飛槳框架連點(diǎn)成線,并交織成了堅(jiān)實(shí)的基礎(chǔ)層,形成了協(xié)同效應(yīng)。
通過芯片、連接、系統(tǒng)和調(diào)度的協(xié)同設(shè)計(jì)和技術(shù)創(chuàng)新,對(duì)AI計(jì)算架構(gòu)進(jìn)行升級(jí),可以提供百萬TOPS的強(qiáng)大算力。
正在建造的計(jì)算集群,基于百度飛槳研發(fā)的AI控制系統(tǒng),設(shè)計(jì)年均PUE1.15,基礎(chǔ)設(shè)施能耗降低70%,每個(gè)可用區(qū)每年節(jié)電超過2億度,相當(dāng)于10萬戶居民一年的用電量。
下一代計(jì)算——量子計(jì)算方面也有新突破。
研發(fā)出國際、國內(nèi)第一的云上量子脈沖系統(tǒng)“量脈”,可將量子計(jì)算軟件指令(邏輯門)轉(zhuǎn)換成控制量子硬件的脈沖序列,算法性能較同類工具實(shí)現(xiàn)成倍的提升,是實(shí)現(xiàn)量子軟硬件連接的關(guān)鍵橋梁。
當(dāng)然,區(qū)別于科研機(jī)構(gòu),百度作為企業(yè)組織,基礎(chǔ)技術(shù)突破自然不會(huì)止步于理論本身。
在技術(shù)轉(zhuǎn)化成生產(chǎn)力方面,百度展示了一幅AI落地全景圖。
百度旗下的多款應(yīng)用與業(yè)務(wù)中已經(jīng)轉(zhuǎn)換成了AI引擎,而且其也正在開放能力,共享產(chǎn)業(yè)升級(jí)紅利。
在
小度助手5.0 援引第三方機(jī)構(gòu)數(shù)據(jù),第二季度小度系列智能音箱出貨量位居全球第二、國內(nèi)第一,同比增長率高達(dá)3700%。而且技術(shù)突破和落地,也進(jìn)一步打破產(chǎn)品舊邊界。作為“音箱”被歸類的AI交互硬件,在小度系狂飆突進(jìn)下,開始真正展現(xiàn)AI時(shí)代交互終端的樣子——AI音箱不再是音箱。
百度輸入法方面,剛才提到的重要基礎(chǔ)突破,流式截?cái)嗟亩嗉?jí)注意力模型(SMLTA)已經(jīng)上線,效果立竿見影,在線語音識(shí)別相對(duì)準(zhǔn)確率,比同領(lǐng)域最優(yōu)玩家還有高15%。
好消息是,離線語音識(shí)別準(zhǔn)確率已經(jīng)達(dá)到在線識(shí)別水平,且可以實(shí)現(xiàn)高精準(zhǔn)中英文混合語音輸入、方言免切換語音輸入,這也是業(yè)內(nèi)首次。
在機(jī)器翻譯方面,繼提出了多任務(wù)學(xué)習(xí)、多智能體聯(lián)合訓(xùn)練等前沿方法,在2019年WMT評(píng)測中取得中英翻譯第一,提出了首個(gè)具有預(yù)測和可控時(shí)延的同傳模型,也是首個(gè)語義單元驅(qū)動(dòng)的上下文同傳模型,并研發(fā)了語音到語音的同傳系統(tǒng),無需經(jīng)過語音識(shí)別轉(zhuǎn)錄,同樣是業(yè)內(nèi)首次。
而視覺為代表的感知智能落地,最具業(yè)內(nèi)反響的是自動(dòng)駕駛。
在業(yè)內(nèi)“華山論劍”頂會(huì)CVPR 2019,百度Apollo公開了國內(nèi)唯一的純視覺L4級(jí)自動(dòng)駕駛解決方案——Apollo Lite,能夠支持對(duì)10路攝像頭、200幀/秒數(shù)據(jù)量的并行處理,單視覺鏈路高丟幀率能夠控制在5‰以下,實(shí)現(xiàn)全方位360°實(shí)時(shí)環(huán)境感知,前向障礙物的穩(wěn)定檢測視距達(dá)到240米。
相比旋轉(zhuǎn)式激光雷達(dá)感知方案,視覺感知方案價(jià)格低廉且便于獲得。并以計(jì)算機(jī)視覺和AR技術(shù)研發(fā)了一種增強(qiáng)現(xiàn)實(shí)的自動(dòng)駕駛仿真系統(tǒng)(AADS),使用激光雷達(dá)(LiDAR)和相機(jī)掃描街景。
合成虛擬形象也是今年最“性感”的落地應(yīng)用之一,并且達(dá)到了量產(chǎn)的水平。
百度與央視合作打造AI虛擬主持人小靈,亮相央視2019五四晚會(huì);與澎湃新聞合作打造了第一個(gè)真人形象的虛擬主播早晚新聞欄目;與浦發(fā)銀行合作打造了業(yè)內(nèi)首個(gè)“金融數(shù)字人”。
基于知識(shí)圖譜的視頻語義理解,則已經(jīng)在百度視頻搜索、推薦、內(nèi)容生成等多個(gè)產(chǎn)品上線。
通過對(duì)視頻的視覺、語音、文本的多模態(tài)知識(shí)解析,在多元異構(gòu)知識(shí)圖譜上建立關(guān)聯(lián),并通過計(jì)算推理,建立對(duì)視頻的深度語義理解,大幅度提升視頻理解效果。
而且AI落地在今年也不再陽春白雪,更多接地氣、可以被尋常百姓家感知的科普式方案也引起反響。
比如百度AI開發(fā)者大會(huì)上,打造了能說會(huì)道的機(jī)器臂“茶博士”。
利用3D視覺技術(shù),可以對(duì)茶杯的位置進(jìn)行檢測和追蹤。通過機(jī)器人運(yùn)動(dòng)規(guī)劃和控制,可以對(duì)工作空間進(jìn)行碰撞檢測,避開障礙物。完成實(shí)時(shí)規(guī)劃運(yùn)動(dòng)后,可自動(dòng)生成倒茶軌跡。語音語義聯(lián)動(dòng)技術(shù)解析,更是讓機(jī)器人像“人”一般,聽得懂,說得好,做得準(zhǔn)。
最后,有技術(shù)、有落地應(yīng)用之外,百度更宏大的雄心也徐徐展露——基于技術(shù)與應(yīng)用優(yōu)勢,百度希望更進(jìn)一步:打造平臺(tái),打造生態(tài),成為AI世界的底座。
今年成績單中,開發(fā)生態(tài)方面的數(shù)據(jù)同樣非常醒目。
從百度當(dāng)前的業(yè)務(wù)布局來看,其已形成了4大底座平臺(tái):
并且在2019年都實(shí)現(xiàn)了爆發(fā)。
百度大腦開放平臺(tái)已經(jīng)在語音、視覺、語言等方面實(shí)現(xiàn)全面升級(jí),具備深度學(xué)習(xí)框架、場景化AI能力、定制化訓(xùn)練平臺(tái)到軟硬一體模組和解決方案等。
自2016年以來,百度已開放228項(xiàng)AI能力,開發(fā)者數(shù)量超過150萬,日均調(diào)用量突破1萬億次,語音、人臉、NLP、OCR調(diào)用量中國第一,是業(yè)內(nèi)最全面、最、服務(wù)規(guī)模大的AI開放平臺(tái)。
援引IDC最新報(bào)告,百度飛槳與谷歌、Facebook名列前三,領(lǐng)銜中國深度學(xué)習(xí)平臺(tái)市場,也是市場份額前五中唯一的國貨。
Apollo自動(dòng)駕駛開放平臺(tái)已經(jīng)匯聚了全球156家生態(tài)合作伙伴;在全球,有97個(gè)國家超過3.6萬名開發(fā)者使用Apollo開源代碼,開源代碼數(shù)量超過65萬,已成為全球最強(qiáng)大、最開放、最活躍的自動(dòng)駕駛平臺(tái)。
而且開放能力進(jìn)一步打破邊界,在剛召開的首屆Apollo生態(tài)大會(huì)上,百度Apollo拓展裂變成三大平臺(tái):自動(dòng)駕駛開放平臺(tái)、車路協(xié)同開放平臺(tái),智能車聯(lián)開放平臺(tái),成為中國自動(dòng)駕駛基建國家隊(duì)代表。
小度技能開放平臺(tái)上,技能開發(fā)者數(shù)量已經(jīng)超過3.7萬人,可提供包括游戲、效率工具、網(wǎng)絡(luò)電臺(tái)、直播、兒童教育、智能家居等3500多種技能支持。合作伙伴數(shù)量已經(jīng)超過500家,可以控制的IoT智能家居設(shè)備已經(jīng)超過了7000萬。
此外,百度還開源了中國首個(gè)邊緣計(jì)算框架BAETYL、自研底層區(qū)塊鏈技術(shù),并發(fā)布了多個(gè)工業(yè)級(jí)的領(lǐng)域數(shù)據(jù)集,如大規(guī)模自動(dòng)駕駛數(shù)據(jù)集、街景圖像數(shù)據(jù)和文字場景數(shù)據(jù)集、視頻精彩片段、場景解析、機(jī)器閱讀理解、中文句子及相應(yīng)的開放域信息提取事實(shí)數(shù)據(jù)集等等,來促進(jìn)算法研究,推動(dòng)AI發(fā)展。
比如下圖,就是ApolloScape數(shù)據(jù)集示例:上半截為彩色圖像,下半截是其二位語義標(biāo)簽:
正如百度董事長兼CEO李彥宏所說:“作為一家平臺(tái)級(jí)企業(yè),成就他人、造福社會(huì),這是百度創(chuàng)始初心與能力之所在,更是百度在行業(yè)發(fā)展關(guān)鍵時(shí)刻責(zé)無旁貸之所在!”
正是基于如此,百度才能夠通過百度智能云的“云+AI”能力,為各行各業(yè)大規(guī)模輸送百度的AI技術(shù)成果與平臺(tái)能力,成效也非常顯著。
根據(jù)IDC在11月底發(fā)布的中國AI云服務(wù)市場報(bào)告,百度智能云在AI技術(shù)、市場和商業(yè)上處于中國地位,超過了阿里云、AWS等一眾廠商。
百度CTO王海峰感慨,百度在2019年提出“人工智能進(jìn)入工業(yè)大生產(chǎn)階段”,如今他們已經(jīng)探索了AI進(jìn)入“工業(yè)大生產(chǎn)”的真實(shí)路徑,推動(dòng)AI邁入自動(dòng)化、標(biāo)準(zhǔn)化和模塊化的新階段,并與百度業(yè)務(wù)以及各行各業(yè)的生產(chǎn)實(shí)踐深入結(jié)合,加速產(chǎn)業(yè)智能化進(jìn)程。
在互聯(lián)網(wǎng)、金融、智能城市、工業(yè)制造等行業(yè)已經(jīng)擁有標(biāo)桿性落地案例。
比如,與中國聯(lián)通打造的智能客服已經(jīng)在中國聯(lián)通三省一基地上線;與央視網(wǎng)共建人工智能研發(fā)中心,打造媒體行業(yè)的AI軟硬件產(chǎn)品;與精研科技打造智能質(zhì)檢車間,提升制造業(yè)質(zhì)檢效率,降低用工成本等等。
但百度的技術(shù),并不僅僅希望體現(xiàn)在商業(yè)價(jià)值上,還希望通過社會(huì)價(jià)值,展現(xiàn)AI福祉。
成績單中披露,2019年“百度 AI 尋人”平臺(tái),用戶發(fā)起照片比對(duì)超過了36萬次,9000多個(gè)走失者與家庭重新團(tuán)聚。
百度還發(fā)布了聽障兒童無障礙閱讀計(jì)劃,推出了全球首款聽障兒童AI手語翻譯小程序,能將繪本文字翻譯為手語,幫助聽障兒童實(shí)現(xiàn)無障礙閱讀。
此外還將AI應(yīng)用在了臺(tái)風(fēng)路徑查詢、瀕危土家語保護(hù)、改造盲人按摩院等方面,進(jìn)一步發(fā)掘AI價(jià)值。
所以百度AI如何回答2019?上述種種業(yè)績就是關(guān)鍵要素。
而且巨頭玩家年度交卷,自然也是整個(gè)AI產(chǎn)業(yè)的共性、趨勢反映。
正所謂窺一斑見全豹,百度的成績單又反映出怎樣的AI 2019?
或許你會(huì)疑惑,百度上述新突破、新進(jìn)展,為何發(fā)生在2019?
背后有百度的技術(shù)積累開花結(jié)果,但也是AI發(fā)展進(jìn)程使然。
這也是為什么百度的2019更值得被復(fù)盤解讀,其中展示全球AI領(lǐng)域發(fā)展的六大趨勢。
趨勢一:CV之后,NLP領(lǐng)域成為下一個(gè)突破頻出的領(lǐng)域
在百度交出的AI成績單中,更多的AI突破與生產(chǎn)力轉(zhuǎn)換都集中在語音語言理解方面。
比如語音識(shí)別、語音合成、虛擬主播、機(jī)器翻譯、人機(jī)對(duì)話、知識(shí)圖譜等等,并落地到了小度助手、百度地圖、百度視頻等等產(chǎn)品與應(yīng)用之中。
這也體現(xiàn)出了整個(gè)人工智能當(dāng)前的技術(shù)突破集中點(diǎn):自然語言處理方向。
計(jì)算機(jī)視覺是人工智能產(chǎn)業(yè)中最為成熟的方向,人臉識(shí)別已經(jīng)進(jìn)入了尋常百姓家,整個(gè)方向徹底進(jìn)入落地期。
早年圍繞這一技術(shù)發(fā)展起來的第一波AI獨(dú)角獸,也已經(jīng)在想辦法向更多的方向拓展。曠視發(fā)力IoT供應(yīng)鏈,依圖做起了芯片,而商湯在教育、AR、自動(dòng)駕駛方向頻頻發(fā)力等等。
與此形成對(duì)應(yīng)的是,NLP方向突破頻頻。谷歌的BERT直接催生出了更多的變體,機(jī)器在自然語言處理與語義理解上更為突出,GPT-2的問世也進(jìn)一步彰顯出了整個(gè)方向的創(chuàng)造力與活力。
眾所周知,AI可以被劃分為“感知智能”和“認(rèn)知智能”兩大版塊。
但2012年ImageNet石破天驚開始,感知智能的進(jìn)展要好于認(rèn)知領(lǐng)域,直觀類比來說,感知就像一個(gè)人類能考到95分的試卷,而認(rèn)知領(lǐng)域,夠到及格還挑戰(zhàn)連連。
于是2019年,全新氣象和里程碑進(jìn)展頻頻,以語言語音為代表的認(rèn)知,進(jìn)入突破期。
趨勢二:落地為王,價(jià)值重估,AI發(fā)展回歸理性
2019年,整個(gè)人工智能產(chǎn)業(yè)變得更加務(wù)實(shí)。
絢麗的Demo少了,關(guān)于將AI應(yīng)用到產(chǎn)品、落地到場景中呼聲更多了。
這是對(duì)前些年人工智能領(lǐng)域“大躍進(jìn)”的最直接回應(yīng),AI發(fā)展理性回歸,從資本方到企業(yè),整個(gè)行業(yè)的參與者都在要求AI展示“降本增效”,來轉(zhuǎn)化成真實(shí)的生產(chǎn)力。
2019年的百度,在落地與AI生產(chǎn)力轉(zhuǎn)換方面再明顯不過。
最典型如自動(dòng)駕駛領(lǐng)域有L4級(jí)視覺感知解決方案Apollo Lite和增強(qiáng)現(xiàn)實(shí)的自動(dòng)駕駛仿真系統(tǒng),對(duì)于自動(dòng)駕駛落地,全球都在要求進(jìn)入“平民”時(shí)代,依靠堆高精尖傳感器的“貴族”玩法,市場空間越來越小。
這也是全球自動(dòng)駕駛經(jīng)受重估的一年。
國際上,Waymo模式遭遇質(zhì)疑和重估,摩根大通將其估值調(diào)低40%,而在貨運(yùn)領(lǐng)域自動(dòng)駕駛落地則熱火朝天,兩種不同形態(tài)一對(duì)比,才知道“看不見的手”想要的不再是遙遠(yuǎn)的迷人圖景,它想要的是——少廢話,證明價(jià)值吧。
趨勢三:人工智能進(jìn)入工業(yè)大生產(chǎn)階段,需要標(biāo)準(zhǔn)化、自動(dòng)化和模塊化
在談到人工智能的時(shí)候,很多人都會(huì)將其提為“新一輪的科技革命”,并將其比作蒸汽、電力等等。
但現(xiàn)實(shí)給出的種種反饋都頗為直接地展現(xiàn)出,在給出這一結(jié)論的時(shí)候,要用將來時(shí)態(tài)。從現(xiàn)在到將來缺了什么?
王海峰在2019年提出觀點(diǎn)稱,前三次工業(yè)革命的核心技術(shù)都具有很強(qiáng)的通用性,呈現(xiàn)出標(biāo)準(zhǔn)化、自動(dòng)化和模塊化的工業(yè)大生產(chǎn)特征。
而人工智能想要如此,自然也需要具備這些特征。這也是人工智能產(chǎn)業(yè)向前發(fā)展的根本所在。
前些年的人工智能落地,都體現(xiàn)在一個(gè)case接一個(gè)case的模式,現(xiàn)在進(jìn)入工業(yè)大生產(chǎn)階段,則要求人工智能體現(xiàn)出更加通用特征,一個(gè)產(chǎn)品能夠處理多個(gè)case,人工智能的能力要標(biāo)準(zhǔn)化、自動(dòng)化和模塊化。
百度的成績單中,百度大腦、飛槳、小度助手、Apollo等平臺(tái),都是百度對(duì)這一趨勢給出的回應(yīng)。
飛槳、Apollo等開放平臺(tái)被國際知名第三方機(jī)構(gòu)波士頓咨詢,作為中國AI發(fā)展的代表,并在全球范圍內(nèi)與谷歌相提并論,認(rèn)為開放平臺(tái)正是巨頭優(yōu)勢和推動(dòng)智能化變革的關(guān)鍵。
由此第四大趨勢
分享標(biāo)題:百度交出年度AI成績單:斬獲23項(xiàng)冠軍,國產(chǎn)自研成大趨勢
文章起源:http://m.rwnh.cn/news1/99201.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供全網(wǎng)營銷推廣、動(dòng)態(tài)網(wǎng)站、App開發(fā)、商城網(wǎng)站、面包屑導(dǎo)航、定制開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容