導(dǎo)讀:上周,2018年度的斯坦福AI報(bào)告發(fā)布,從學(xué)界、企業(yè)、政府和公眾等不同主體出發(fā),通過論文發(fā)布及引用、學(xué)術(shù)會(huì)議、初創(chuàng)公司、技術(shù)進(jìn)展等幾個(gè)主題對當(dāng)前全球人工智能格局進(jìn)行了全面的數(shù)據(jù)呈現(xiàn)和分析解讀。
上周,2018年度的斯坦福AI報(bào)告發(fā)布,從學(xué)界、企業(yè)、政府和公眾等不同主體出發(fā),對人工智能當(dāng)前的進(jìn)展進(jìn)行了數(shù)據(jù)呈現(xiàn)。經(jīng)過長期的跟蹤、整理和分析人工智能相關(guān)數(shù)據(jù),報(bào)告發(fā)現(xiàn),美國目前在人工智能的學(xué)術(shù)影響力專利產(chǎn)出、和商業(yè)活躍質(zhì)量具有明顯優(yōu)勢,中國則在學(xué)術(shù)論文發(fā)表方面相當(dāng)高產(chǎn),但就發(fā)展質(zhì)量而言仍有待提升。在人工智能內(nèi)部,機(jī)器學(xué)習(xí)和概率推理、神經(jīng)網(wǎng)絡(luò)、計(jì)算機(jī)視覺三個(gè)子領(lǐng)域備受學(xué)界關(guān)注,這也影響到了企業(yè)創(chuàng)業(yè)和人才需求。
以下,億歐智庫以論文發(fā)布、論文引用、學(xué)術(shù)會(huì)議、初創(chuàng)公司等幾個(gè)模塊,對報(bào)告的主要內(nèi)容進(jìn)行呈現(xiàn)整理:
從發(fā)布論文主題來看,AI相關(guān)的論文增速(8x)在2010年后已經(jīng)大幅超過計(jì)算機(jī)科學(xué)領(lǐng)域(6x),從一定程度表明人工智能領(lǐng)域的論文增長不僅僅是由人們對計(jì)算機(jī)科學(xué)興趣的提高所驅(qū)動(dòng)的。
從區(qū)域來看,歐洲一直是AI論文主要的發(fā)布來源地,占到整體的28%。中國(25%)自2006年后開始超越美國(17%),并在2008年實(shí)現(xiàn)出版數(shù)的高漲,報(bào)告推測是《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006-2020)》和其他政府項(xiàng)目為人工智能研究提供資金和一系列激勵(lì)政策的結(jié)果。
在AI領(lǐng)域的子類目中(類別間不互相排斥),機(jī)器學(xué)習(xí)和概率推理(Machine Learning and Probabilistic Reasoning)占到最高比例,為56%,而神經(jīng)網(wǎng)絡(luò)(Neural Networks)是2014年以來增速最快的研究領(lǐng)域,年復(fù)合增長率達(dá)到37%。計(jì)算機(jī)視覺也保持了較高的增速。搜索及優(yōu)化、自然語言處理及知識表示、模糊系統(tǒng)、規(guī)劃和決策類論文目前還未呈現(xiàn)大的增長。
ArXiv是收錄科學(xué)文獻(xiàn)預(yù)印本的在線數(shù)據(jù)庫(其中預(yù)印本是指學(xué)者的還未在正式出版物上發(fā)表,而出于和同行交流目的自愿發(fā)布的科研論文或報(bào)告),投稿量每月高達(dá)上萬篇。鑒于知識的更迭速度和研究主題的競爭性,學(xué)者往往會(huì)在漫長的期刊/學(xué)術(shù)會(huì)議審核期之前就投稿在ArXiv上。數(shù)據(jù)顯示投稿的AI相關(guān)論文整體呈現(xiàn)增長,其中計(jì)算機(jī)視覺和模式識別占最大比例,體現(xiàn)了學(xué)者較高的傳播意愿。
從關(guān)注領(lǐng)域來看,中國對AI的研究側(cè)重于工程技術(shù)和農(nóng)業(yè)科技,歐美則集中在人文和醫(yī)藥科學(xué)。
從論文發(fā)布的主體來看,學(xué)術(shù)論文仍占絕大部分,其次則來自政府、企業(yè)。以中國為例,92%的AI論文來自學(xué)術(shù)領(lǐng)域。此外,2017年中國政府主體發(fā)布的論文是企業(yè)的4倍。而美國的企業(yè)主體發(fā)布的論文不論從數(shù)量還是所占比例來講都高于中國。由此可見,美國在人工智能科研方面的商業(yè)化驅(qū)動(dòng)力相對更強(qiáng)。
FWCI(Field-Weighted Citation Impact,領(lǐng)域權(quán)重引用影響系數(shù))是指該區(qū)域AI學(xué)者收到的平均引用次數(shù)除以所有AI作者的平均引用次數(shù),能在一定程度反映論文質(zhì)量。從數(shù)據(jù)來看美國的FWCI指數(shù)達(dá)到1.83,盡管歐洲的AI論文發(fā)布量最高,但其FWCI指數(shù)略高于平均水平。中國的論文質(zhì)量則在持續(xù)穩(wěn)步的提高中。
考慮到AI學(xué)者的國際流動(dòng)性,報(bào)告也針對做出研究。數(shù)據(jù)顯示,中美歐三個(gè)區(qū)域的久居型學(xué)者(指從未遷移至外國發(fā)表論文)的產(chǎn)出率最低,而那些動(dòng)態(tài)遷出遷入的“候鳥型”作者的論文產(chǎn)出和被引用水平更高。其中中國的久居型學(xué)者所占比例最高(75%),相比歐美同類型學(xué)者更加高產(chǎn),但論文質(zhì)量仍有待提升。
在AI相關(guān)的老牌學(xué)術(shù)會(huì)議中,NeurIPS(神經(jīng)信息處理系統(tǒng)大會(huì))、CVPR(計(jì)算機(jī)視覺與模式識別會(huì)議)、ICML(國際機(jī)器學(xué)習(xí)大會(huì))人數(shù)增長較快。此外,學(xué)界對深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的關(guān)注,助推ICLR(國際學(xué)習(xí)表征會(huì)議)的新興小型學(xué)術(shù)會(huì)議規(guī)??焖僭鲩L。
AAAI(美國人工智能協(xié)會(huì))作為國際性的重要AI學(xué)術(shù)會(huì)議,具備較強(qiáng)的專業(yè)度和影響力。按所屬國家對會(huì)議提交和接受的論文歸類,70%均來自于中美兩國,兩國的論文通過率分別為29%、21%。
如今,超過50%的人工智能相關(guān)機(jī)構(gòu)是非營利組織,包括美國公民自由聯(lián)盟、牛津大學(xué)人類未來研究所和聯(lián)合國開發(fā)計(jì)劃署。同時(shí),人們更加認(rèn)識到性別和種族多樣性對AI進(jìn)步的重要性,AI4ALL和WiML等鼓勵(lì)多元群體參與到AI研究的組織成員數(shù)有所增加。
報(bào)告通過統(tǒng)計(jì)美國初創(chuàng)公司(接受過風(fēng)險(xiǎn)投資支持)每年的累計(jì)數(shù)量,發(fā)現(xiàn)在初創(chuàng)公司數(shù)量整體穩(wěn)步增長的同時(shí),AI領(lǐng)域初創(chuàng)公司則開始呈現(xiàn)指數(shù)級增長的趨勢,成為創(chuàng)業(yè)主旋律。
每年獨(dú)立的風(fēng)險(xiǎn)投資數(shù)額呈現(xiàn)波動(dòng)趨勢。自2015年以來,AI領(lǐng)域的投資金額迅速高漲,峰值比2014年來的風(fēng)投擴(kuò)張期來得更早。
在此背景下,企業(yè)對人工智能相關(guān)人才的需求也更加旺盛,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)尤為明顯,其中深度學(xué)習(xí)的職位需求在2015~2017年間有了35倍的增長。
針對紐交所上市公司,研究發(fā)現(xiàn),財(cái)報(bào)電話會(huì)議中提及人工智能和機(jī)器學(xué)習(xí)的頻次自2015年來大幅增長。而提及兩者最多的行業(yè)依次是IT、非必需消費(fèi)品、金融和醫(yī)療保健行業(yè),企業(yè)則分別是英偉達(dá)(AI提及93次)、Alphabet(機(jī)器學(xué)習(xí)提及57次)。在中國,大量的科技和互聯(lián)網(wǎng)公司也呈現(xiàn)言必提AI的程度。
麥肯錫在2018年對受訪者所在公司在某些業(yè)務(wù)中嵌入AI功能的情況進(jìn)行了調(diào)研,結(jié)果發(fā)現(xiàn)不同的人工智能技術(shù)在世界各地和不同行業(yè)中得到廣泛采用,大約一半的公司已經(jīng)將人工智能嵌入到公司的業(yè)務(wù)流程中。然而,AI應(yīng)用還處在早期,大多數(shù)公司還未采取措施從人工智能大規(guī)模獲取價(jià)值。
在2015年,ImageNet視覺識別挑戰(zhàn)賽中的算法模型識別精度已經(jīng)超過人類水平,2017年進(jìn)一步提升至了97%左右。盡管競賽在2017年已是最后一屆,ImageNet2012開放數(shù)據(jù)集仍在被引用,可以說,ImageNet所構(gòu)建的規(guī)則為研究者提供了標(biāo)準(zhǔn)的研究度量進(jìn)行比較競爭。
利用ImageNet數(shù)據(jù)集培訓(xùn)能夠進(jìn)行高精度圖像分類的大型網(wǎng)絡(luò)在以往需要耗費(fèi)不少時(shí)間。對于擁有足夠資源機(jī)進(jìn)行開發(fā)的參與者而言,培訓(xùn)網(wǎng)絡(luò)所需的時(shí)間已經(jīng)從一年半前的1小時(shí)降到了大約4分鐘,速度提升了16倍,算法創(chuàng)新和硬件進(jìn)步在其中發(fā)揮了重要作用。
其他如COCO(微軟發(fā)布的圖像數(shù)據(jù)庫,用于對象檢測、分割、人體關(guān)鍵點(diǎn)檢測、語義分割和字幕生成等)、Parsing(語法分析)、機(jī)器翻譯、機(jī)器問答等競賽或應(yīng)用領(lǐng)域在近年來的算法精度也均有不同程度的提高,此處不一一贅述。
專利:從區(qū)域來看,2014年,人工智能專利中有30%便來自美國,其次則是日、韓兩國,各占有16%的比例。
學(xué)校開設(shè)課程:AI的火熱也發(fā)生在高校中,學(xué)生報(bào)名注冊人工智能和機(jī)器學(xué)習(xí)的比例和數(shù)量也隨之增長。在報(bào)告的統(tǒng)計(jì)的幾所美國頂尖計(jì)算機(jī)科學(xué)高校中,2017年機(jī)器學(xué)習(xí)基礎(chǔ)課程的注冊人數(shù)是2012年水平的5倍,AI課程注冊人數(shù)是2012年的3.4倍。在中國,清華大學(xué)的AI及機(jī)器學(xué)習(xí)課程自2010年到2017年更是實(shí)現(xiàn)了16倍的增長。
Github星數(shù):GitHub(知名開源軟件網(wǎng)站)的星數(shù)類似于關(guān)注數(shù),基本能判定AI編程語言的流行程度。目前TensorFlow(Google)一騎絕塵,其后是Pytorch(Facebook)、mxnet(Amazon)。
ROS安裝:ROS(robot operating system,機(jī)器人操作系統(tǒng))是目前在人工智能領(lǐng)域被廣泛使用的機(jī)器人軟件平臺。自2014年, 來自唯一IP地址的ROS安裝包下載次數(shù)實(shí)現(xiàn)了567%的增長。從頁面瀏覽量來看,中國增長最為明顯,值得一提的是,百度的自動(dòng)駕駛平臺Apollo就是基于ROS開發(fā)的。
工業(yè)機(jī)器人安裝量:自2012年以來,中國每年的機(jī)器人安裝量增長了500%,而韓國和歐洲等其他地區(qū)分別增長了105%和122%。
媒體報(bào)道情緒:在包含人工智能一次的媒體文章中,情感表達(dá)正面的文章所占比例逐步增多,為30%,負(fù)面文章則一直保持低水平。
政府關(guān)注度:通過采集美國、加拿大、英國議會(huì)的記錄文本,報(bào)告發(fā)現(xiàn)自2016年來政府對人工智能和機(jī)器學(xué)習(xí)的提及次數(shù)大幅增加。
報(bào)告最后還列舉了歷年來重要的里程碑式事件、中國及歐美政府在人工智能領(lǐng)域的主要舉措、專家對人工智能目前缺陷所給的建議等內(nèi)容。以上僅對報(bào)告的主體部分進(jìn)行了闡述,如需了解報(bào)告完整內(nèi)容,官網(wǎng)鏈接如下:https://aiindex.org/