導讀: 人工智能的崛起,加速了大數據技術的應用落地。據中國大數據產業(yè)生態(tài)聯盟調查顯示,國內大數據企業(yè)年營業(yè)額4000萬人民幣以上的已經超過40%,這意味著,這些企業(yè)已經度過生存期,開始進入應用落地和品牌推廣階段。
人工智能的崛起,加速了大數據技術的應用落地。據中國大數據產業(yè)生態(tài)聯盟調查顯示,國內大數據企業(yè)年營業(yè)額4000萬人民幣以上的已經超過40%,這意味著,這些企業(yè)已經度過生存期,開始進入應用落地和品牌推廣階段。
近日,在工業(yè)和信息化部的指導和支持下,中國大數據產業(yè)生態(tài)聯盟發(fā)布《2018中國大數據產業(yè)發(fā)展白皮書》,對基礎支撐、數據服務、融合應用等三層生態(tài)進行了精準的層次化分析,通過深度調研梳理國內大數據產業(yè)發(fā)展現狀,形成產業(yè)生態(tài)圖譜及產業(yè)發(fā)展報告。
產業(yè)生態(tài)概覽
2016年以來,針對大數據產業(yè)發(fā)展的政策緊密出臺,涉及產業(yè)轉型、政府治理、科技攻關、產業(yè)扶持和安全保障等多個方面,產業(yè)發(fā)展環(huán)境持續(xù)優(yōu)化。
從這些意見和方案可以看出,大數據政策規(guī)劃正逐漸向各大行業(yè)和細分應用領域延伸,大數據產業(yè)大踏步進入應用時代。
中國大數據產業(yè)持續(xù)增長,國內業(yè)務占主導
隨著中國經濟進入新常態(tài),智慧城市、數字經濟、新舊動能轉換、轉型升級等概念持續(xù)引領大數據產業(yè)的發(fā)展,加速技術革新和應用拓展。
2017年中國大數據產業(yè)規(guī)模達3820.4億元,預計2020年產業(yè)規(guī)模將突破8000億元。
各地政府順應數字經濟發(fā)展趨勢,加快設立大數據產業(yè)園
聯盟年度的企業(yè)調研顯示,受訪企業(yè)的營收額多集中于1000-2000萬元和1-2億元這兩個量級。
進一步分析發(fā)現,1000-2000萬元這一區(qū)間的企業(yè)多為成立3-5年的小型企業(yè),這些企業(yè)的產品和服務很多尚處于持續(xù)開發(fā)迭代中,其在細分領域的目標非常專注;1-2億元這一區(qū)間的企業(yè)則大多成立了10年以上,他們的產品體系已經相對成熟,在細分領域也塑造了一定的品牌和影響力。
基于這一雙峰的分布形態(tài),可以將大數據企業(yè)的成長劃分為三個階段,其中營收額1000萬-2000萬元以下的大數據企業(yè)應該更關注生存和產品的迭代,2000萬-1億元這一區(qū)間的企業(yè)則更應該關注通過高度專注的產品來打造品牌,2億元營收以上的企業(yè)則應更多關注大規(guī)模的市場開拓。
此外,問卷調研顯示,大數據企業(yè)非常注重研發(fā),研發(fā)人員比例的均值不低于60%。此外,這些企業(yè)的市場多在國內,且集中于華北、華東和華南三大地區(qū)。
數據源、基礎設施、軟硬件產品和應用的熱點布局
基于問卷統計結果,與大數據相關的數據源、基礎設施、軟硬件產品和應用的熱點布局情況如上圖所示。其中紅色表示熱度高,綠色表示熱度低。
從數據源和基礎設施來看,企業(yè)的數據源多來自企業(yè)本身、互聯網和政府,數據流通的熱點集中在標準化和開放共享,基礎設施的熱點則在于云計算和數據中心建設。
從軟硬件產品來看,硬件產品的熱點集中在超融合一體機、存儲和網絡設備,基礎軟件的熱點集中于前端的采集、清洗和大數據平臺,應用軟件則集中于數據可視化及與其相關的商業(yè)智能。
從應用來看,企業(yè)端最主要的應用在于風險控制,行業(yè)端的應用則以服務業(yè)為主,熱點相對集中于互聯網、政務、金融和交通等領域。
中國大數據人才培養(yǎng)成為焦點
目前,中國大數據領域人才學歷層次主要以本科為主,本科及以上學歷從業(yè)人員占比合計89%,整個行業(yè)呈高學歷化。
從人才的主要學科來源看,計算機類、統計類和數學學科占比最大,顯示出大數據人才培養(yǎng)中對計算機相關知識、統計學和數學基礎的綜合性要求。這種相對綜合的要求,導致大數據人才培養(yǎng)的難度較大,對學生的學習能力和課程設置的要求也較高。
中國大數據人才儲備排前三位的城市依次為北京、上海和深圳。這些城市豐富的大數據人才儲備與其高等教育水平密切相關。
從2016年開始,國家為應對大數據人才市場缺口,創(chuàng)設了“數據科學與大數據”本科專業(yè)。截止2018年,審批通過設置該專業(yè)的學校數量從2016年的3所增長到248所,擴張了近83倍?!皵祿茖W與大數據技術”專業(yè)課程體系完整,涉及數學、統計和計算機等多個方面,滿足了市場對復合型人才的需求。
大數據產業(yè)鏈:數據服務、基礎支撐和融合應用相互交融,協力構建了完整的大數據產業(yè)鏈
基礎支撐層是整個大數據產業(yè)的引擎與核心,它涵蓋了網絡、存儲和計算等硬件基礎設施,資源管理平臺、以及各類與數據采集、預處理、分析和展示相關的方法和工具。
從數據流動的角度來看,除去硬件設施和資源管理平臺,大數據架構可以理解為:前端的數據采集、中端的流處理、批處理、即時查詢和數據挖掘等服務,以及末端的數據可視化服務。
在基礎支撐層之上,融合應用層包含了與政務、工業(yè)、農業(yè)、金融、交通和電信等行業(yè)緊密相關的應用軟件和整體解決方案。
數據服務層,則是圍繞各類應用和市場需求,提供輔助性的服務,包括數據交易、數據資產管理、數據采集加工分析、數據安全等。
大數據產業(yè)生態(tài)地圖
十大爆發(fā)點
1、工業(yè)企業(yè)上云引爆工業(yè)APP市場
2017年以來,伴隨著工業(yè)互聯網概念的提出,工業(yè)企業(yè)上云和工業(yè)APP開發(fā)成為熱點詞匯。我國工業(yè)領域的云化水平較低,在上云企業(yè)數量的廣度和企業(yè)在云端部署的深度兩個維度上都具有非常大的發(fā)展?jié)摿?,工業(yè)企業(yè)上云處于爆發(fā)前期。
未來,隨著國家上云政策的細化和分解(如目標分解、實施路徑、考核標準、應用場景和財政支持方式等),以及各地政府對工業(yè)企業(yè)上云策略(如企業(yè)上云評估、診斷和實施路徑等)的落地,對工業(yè)數據的分析需求會快速上升,引爆各類工業(yè)APP應用的開發(fā),諸如設備設施預測性維護、工業(yè)生產流程優(yōu)化、生產過程可視化和供應鏈優(yōu)化等工業(yè)應用。
2、前端智能將廣泛應用在城市安防和設備設施監(jiān)測維護領域
相比于云計算技術架構,應用前端智能技術(將經過數據分析驗證的算法和模型固化到前端高性能傳感器和數據采集設備),可以有效地削減數據傳輸過程中的網絡帶寬消耗,降低前端設備自身功耗,提升數據分析效率和系統整體的智能化水平。
現階段的前端智能面臨三大挑戰(zhàn):模型參數多、實時性要求高、運算能力弱。要解決這些問題,需要在軟件和硬件方面同時下功夫,對企業(yè)的綜合能力要求很高。
未來,隨著中國新一輪的智慧城市和工業(yè)互聯網建設的持續(xù)推進,市場對智能終端和傳感器的需求將會拉動前端智能市場的進一步增長,其中城市安防、交通和設備設施監(jiān)測維護將成為增長重點。
3、智能投顧開辟金融市場新藍海
新興的智能投顧公司在國外發(fā)展迅速,主流財富管理領域已經認可智能投顧并積極投入其中。目前,國內的一些公司也推出了類似的產品(如投米RA、積木盒子、嘉實基金和彌財等),但整體而言仍然處在非常早期的階段。
國內的智能投顧業(yè)務將推動投資理財走向普惠化,改變財富管理市場格局,開辟中國金融市場新藍海,未來市場發(fā)展?jié)摿薮蟆?/p>
4、網絡營銷向線下滲透,場景營銷成破局利器
營銷大數據的本質是,通過把握企業(yè)或個人的特征,挖掘識別其需求,并據此將正確的產品和服務推送給有需求的客戶,并從中收取費用,最終達成三贏的效果。
在用戶注意力資源開發(fā)已經飽和的現狀下,傳統網絡營銷業(yè)務增長乏力?;诰€下場景的營銷,提供了破局制勝的突破口。
線下場景數據由于自帶精準性的特征,當前已成為營銷大數據企業(yè)關注的重點。常用的線下場景則包括各大商場、汽車4S店、滑雪場、機場和高鐵站等。
5、“數據鐵籠”開啟政務監(jiān)管新市場
“數據鐵籠”通過應用大數據分析方法,對行政權力的運行開展全面而高效的監(jiān)督。
數據鐵籠的建設,首要的是樹立開放共享的思想理念,規(guī)范權力體系。在此基礎上,搭建融合跨界的大數據平臺,通過大數據融合分析,支撐權力運行流程的再造和優(yōu)化,實現精準有效的權利監(jiān)管。
典型的數據鐵籠細分應用場景包括:酒駕治理流程化、交通建設工程項目流程化、道路運輸管理流程化、紀委監(jiān)督數據化、公檢法案件審判精準化等。
6、BD+ABI引爆多元化健康醫(yī)療應用市場
人工智能+健康醫(yī)療大數據:健康語音交互、計算機視覺、認知計算等技術蓬勃發(fā)展,助推醫(yī)療領域的快速突破。
通過人工智能的手段,醫(yī)生診療、患者自診的效率可以大幅提升。具體的應用場景包括:語音錄入病歷、醫(yī)療影像智能識別、輔助診療/癌癥診斷、醫(yī)療機器人、個人健康大數據的智能分析等。
物聯網+健康醫(yī)療大數據:物聯網技術的出現,能夠幫助醫(yī)院實現對醫(yī)療對象(如醫(yī)生、護士、病人、設備、物資和藥物等)的智能化感知和處理,支持醫(yī)院內部醫(yī)療信息、設備信息、藥品信息、人員信息和管理信息的數字化采集、處理、存儲和傳輸等功能。
在醫(yī)療物聯網領域的兩個重點應用:醫(yī)療服務,主要是以患者服務為中心的護理、后勤服務和基礎設施建設;成本控制,以醫(yī)院人財物為中心的保障和行政業(yè)務管理。
區(qū)塊鏈+健康醫(yī)療大數據:區(qū)塊鏈技術是一種互聯網數據庫技術,其特點是去中心化、公開透明,讓每個人均可參與數據庫記錄,因此又稱為分布式賬本技術。
首先,各類互聯醫(yī)療設備和數據安全的需要,使得區(qū)塊鏈技術及相關安全基礎設施,成為實現數字醫(yī)療工作流程和高級醫(yī)療互操作性的基礎。其次,區(qū)塊鏈能夠統一不同的數據集,打破那些讓機器學習算法難以訪問的數據“豎井”,為機器學習提供執(zhí)行高級分析所需的標準化、全面化、高完整化的數據集。
7、大數據思維開啟態(tài)勢感知市場
當下,面對復雜多變的網絡安全威脅和安全風險,僅靠防火墻、入侵檢測、防病毒、訪問控制等單一技術已經不能滿足網絡安全需求,而“基于大數據的網絡安全態(tài)勢感知”由于可以綜合各方面因素,動態(tài)展示網絡安全現狀,并適時地給出預測和預警提示,得到了市場的廣泛關注。
大數據技術特有的海量存儲和并行計算等特點,為大規(guī)模網絡安全態(tài)勢感知技術的實現奠定了基礎。借助大數據技術,通過對海量數據的分析和挖掘,態(tài)勢感知可以對網絡安全狀態(tài)進行評估,感知網絡異常事件和漏洞,并進行整體安全態(tài)勢預測。
8、數據交易線上化開辟企業(yè)數據合作新渠道
當前,各地政府在大力發(fā)展大數據產業(yè)時,都格外重視“大數據交易中心“建設,加速推動數據資源開放共享。
考慮到中國80%以上的數據資源掌握在各級政府手里,政府數據的開放共享和開發(fā)應用已經成為建設重點。然而,由于數據商品價值的特殊性(易被復制、易被侵權、數據隱私和安全缺乏保障、數據價值具有不確定性),數據交易的建設和運營面臨一些現實困境。
未來,隨著線上交易機制的完善,確權、安全和定價等問題的解決,將促使線上的交易平臺成為數據需求方和供給方對接的新渠道,海量的線下數據合作將逐步向線上遷移,加速數據的流通和應用,拓展企業(yè)間數據合作的新渠道。
9、數據跨界集聚構筑寡頭生態(tài)新藍圖
數據開放推動社會治理的變革,實現了治理主體從一元化向多元化轉變,治理模式從政府管理走向市場化的多元合作模式。
共享經濟通過數據開放共享和平臺建設,推動了社會治理的變革,促成了治理系統向法治、協商和自治的轉變,有效彌補了政府監(jiān)管的短板,開放了數據紅利,激活了市場創(chuàng)新,提供了更加便捷的生活方式。
目前,我國共享經濟的主要應用領域包括交通出行、房屋住宿、知識技能、生活服務、醫(yī)療服務和二手交易等。雖然共享經濟發(fā)展迅速,滲透領域日漸拓展,但該體系下仍存在信用機制不健全、監(jiān)管缺失、嚴重依賴補貼等行業(yè)亂象。
2016年以來,共享經濟的市場競爭格局逐漸清晰,逐步由單個平臺走向寡頭競爭和生態(tài)化發(fā)展的趨勢明顯。一方面,共享企業(yè)持續(xù)洗牌,以共享單車市場為例,處于市場尾端、運營能力差的企業(yè)相繼倒閉,而巨頭的加入使得共享單車行業(yè)梯形分隊明顯;另一方面,共享經濟正逐步走向生態(tài)化,諸多細分市場都傳來單個共享平臺被互聯網巨頭投資或收購的消息,加速了跨界的數據集聚。
10、在線職業(yè)培訓彌合復合型大數據人才缺口
大數據人才需要具有跨領域的知識架構,既需要懂IT技術和統計知識,又要懂實際的應用場景業(yè)務。賽迪顧問預計,2018年中國大數據領域的復合型人才缺口約為160萬。面對復合型人才的這種巨大缺口,僅靠傳統的高校教育難以快速滿足市場需求。
在此背景下,在線職業(yè)培訓成為填補大數據領域復合型人才缺口的有效途徑,其靈活高效的資源配置能力,可以有效應對市場的動態(tài)變化。
而在各類在線職業(yè)培訓課程中,以考證類培訓最受歡迎,主要是考證類課程的授課目的明確,課后通過考試拿到國家承認的相關資格證書有利于幫助其在職場上升職、加薪。
大數據產業(yè)是萬物互聯、人工智能、智慧城市等新概念產業(yè)的支撐性基礎,是數字經濟發(fā)展的重要環(huán)節(jié)。目前,該產業(yè)已經由初級發(fā)展階段逐步轉向成熟期,傳統的軟件信息部門正在形成新勢力,瞄準細分領域的創(chuàng)企們亦在迭代強化,抓緊戰(zhàn)隊。