政府大資料應用的反思:大資料分析應用常見的困難
大資料是政府的事嗎?資料資源都是大資料嗎?
大資料應用存在哪些問題?網際網路+大資料是什麼關係?
常講的哪些大資料應用是片面的?企業可以從哪些方向入手大資料應用?
摘要:
新一代資訊科技與創新2.0的互動催生了大資料,生動詮釋了數字時代、知識社會創新形態的嬗變,進一步消融了創新的邊界,推動了創新2.0時代組織形態、社會形態等的深刻變革。然而在政府大資料領域,由於概念混亂、認識偏差,也出現了肝虛火旺、捨本逐末等諸多亂象。
近日,資深資訊化專家、中國資訊協會副會長鬍小明在“創新2.0研究群”就政府大資料應用的效益難題、常見困難、片面認識進行了反思探討,並就如何認識大資料的本質、腳踏實地推進政府大資料發展及其應用趨勢進行了分析,引發業界對政府大資料應用的共鳴與討論。
一、政府大資料應用效益難題
1.缺少利用大資料決策的成功案例
在智慧城市建設中,以支援政府決策為名的大資料中心建設如火如荼,但利用大資料改進決策的成功案例卻鮮有,與大資料中心的投資不成比例,令人質疑大資料中心遍地開花模式的合理性。
2.行政推動大資料應用效果不好
大資料應用本是一個經濟學問題,國內大資料應用卻太行政化了,地區之間的大資料應用評比給地方政府很大的壓力,為了爭取好的名次,只能為大資料而大資料,使大資料應用背離了實事求是的目標,大資料已淪為某些地方政府自我宣傳的招牌,離實際業務需求漸行漸遠。
3.大資料概念混亂影響了常規資料
管理大資料最初的概念是指“現有技術處理不了的大規模資料”,為了更多利用大資料的優惠政策,大資料概念被人為的擴充套件了,認為政府資料集中起來都是大資料,一些地方政府成立大資料局就包含政府所有的資料管理,大資料概念的擴充套件造成應用的混亂,傳統有效的資料管理被忽視。大資料應用需要因地制宜,中小城市做好傳統資料整合管理是第一位的,並不都需要推行大資料應用,更不都需要建大資料中心,大資料概念的混亂阻礙各地政府實事求是地解決本地區的資料管理問題。
4.大資料理念需要反思
過度宣傳大資料作用必然會形成迷信,以為大資料無所不能,該迷信只會增加盲目建設的浪費,前些年為資訊共享而共享的浪費已是前車之鑑,大資料應用正在蹈其覆轍,為大資料而大資料的做法正在蔓延,大資料應用有價值亦有邊界,超越邊界推行必然適得其反,大資料應用理念需要反思。
二、政府大資料分析應用常見困難
1.找不到適合的大資料資源大資料分析研究首要的問題是大資料從哪裡來?
雖然大資料中心存有不少資料,但適合解決領導急需問題的資料缺之又缺,不用的時候資料卻多之又多,大資料應用是對業務積累資料的再利用,不像統計調查可以根據需要進行調查設計,因此缺乏適用的資料經常是大資料決策應用的常態。
2.大資料分析對應不上領導的需求
資料專家利用大資料中心的資源也能夠分析出一些結論,但是這些結論業務部門早已知道,即使一些有價值的成果也會因與領導層當時的關注點不合拍而被冷落。政府工作有自己的優先順序,領導層不可能放下重要的工作去落實專家提出的建議,資料導向產生的分析成果很難與領導注意力的優先順序合拍。
3.資料探勘因人而異不可複製
從大資料中提取資訊不是IT技術自己能完成的工作,計算機並沒有資訊抽象能力,這種能力專家才有,同樣的資料不同人看到的資訊是不一樣的,同樣的資訊決策分析的結論也不相同,資訊提取與決策分析依賴於專家的智慧,這種認知決策的過程IT難以複製,難以形成規模,難以形成穩定的效益。
4.決策的不確定性超出IT能力
利用大資料改進決策的難題是決策本身的不確定性。確定性問題的資訊是完備的,IT處理只是一種計算,資訊科技很容易發揮其優勢;但是資訊科技不會處理政府決策不確定性問題,這是人腦擅長的領域,解決此類問題的資訊和分析能力主要來自決策者的頭腦。
決策問題的不確定性是大資料決策應用效益不好的根本原因。
三、流行的大資料應用觀點的片面性
1.大資料作用不只是改進決策
流行的大資料觀點將政府大資料應用侷限於改進決策,改進決策固然重要,但這並不是資訊科技擅長的領域,資訊科技擅長的領域是在資料層次上的操作,而不是在資訊層次上分析。
政府資料更大的作用是提高政府公共服務的效率,政府提倡的“只跑一次”、“一號、一窗、一網”式服務都是資料層次上的大資料應用,應用並不是改進決策而是提高服務效率,是公眾最能夠產生獲得感的領域。
2.對大資料的侷限性缺乏認識
流行觀念認為科學決策依賴的只是資料,資料越多資訊越多,決策越正確,大資料將成為獲取資訊的主渠道,政府決策可以建立在大資料基礎之上。然而實際情況並非如此,政府決策資訊來自諸多方面,不只是數字化資訊,很多重要的資訊難以數字化,決策者需要綜合考慮,大資料產生於相對狹窄的業務領域,適合於具體業務的改進,並不適合政府的巨集觀決策。
3.並非所有資料都是資源
“資料都是資源”的觀念是錯誤的,資料是否資源要由使用者因具體環境而定,正是在“資料都是資源”的誤導下,一些大資料中心積極囤積資料,以囤積的資料規模顯示大資料工作的成績,使許多資料中心堆滿大量資料垃圾,筆者認為大資料中心應當以應用為導向,整合有用資料,清理無用資料,資料使用效益會更好。
4.僅靠大資料不能實現科學決策
過度的大資料宣傳已形成烏托邦式夢想,以為只要有充分的大資料資源就可以實現政府的科學決策,就可以建設完備的城市大腦,實現政府決策的科學化、智慧化,建成智慧政府。其實大資料資源有其優點也有其片面性,大資料的規模是以其關注面的狹窄性為代價的,政府決策需要全面均衡,僅靠大資料資源是做不到的。況且對於不確定性問題的很多資訊是不可預測的,靠大資料自動決策沒有可行性。
四、企業大資料業務的另類思路
1.企業大資料應用成為流程型服務
企業大資料應用與政府有很大不同,企業是效益導向的,成功的大資料應用首先是一項流程型服務業務,如網上搜索、地址導航、網上支付、電子商務、摩拜單車、行動通訊等,企業的大資料業務被設計為長遠的可持續業務,惟此才能有更大的效益和更大的社會影響力,才能建立起公眾的信任,流程型服務業務本身是核心的大資料業務,大資料分析是輔助性業務。
2.直接處理實時資料
企業的大資料業務核心是直接利用實時資料進行操作,行動通訊的實時資料是為了聯通基站以便完成通訊,網上支付利用實時資料是為了完成準確的支付,搜尋服務利用客戶發來的搜尋要求進行查詢,總之,這些大資料服務業務是直接使用業務流實時產生的資料進行操作,活躍的大資料業務建立在實時資料的基礎之上,對沉澱的業務資料的分析研究只是為了改進主流業務,如亞馬遜利用歷史資料分析向用戶推薦新書。
3. 排除人腦參與的智慧系統會更快
在企業流程化的業務中,全過程是智慧化自動化處理,流程化業務是資料層次上的業務,沒有人腦的參與沒有資訊抽象的過程,排除人腦的參與是提高系統執行效率的關鍵,也是保證服務結果一致性的關鍵。人腦直接參與業務流程不僅會拖延業務效率還會造成業務的中斷。政府利用大資料分析決策是資訊層次上的業務,無法避免人腦參與,因而無法形成連續性服務業務,效率不可能高。
4. 大資料業務的兩個層次
企業的大資料應用分兩個層次進行,一個是資料層次上的應用,系統直接使用實時資料進行操作處理,系統是流程型自動執行的,直接對外服務。這是企業的主營業務,效益由該業務產生。例如行動通訊的主營業務就是實現使用者的通訊服務。
企業大資料業務的另一個層次是資訊層次上的大資料應用,其使用的是流程型業務積累下來的資料,以資料探勘、資料分析獲取資料集中包含的資訊來改進主營業務的效率。這是在資訊層次上的業務,是業務資料的再利用。通常資訊層次上的大資料分析業務是公司的輔助性業務。對行動通訊業務積累的資料進行分析,挖掘出使用者的需求特點,向用戶推薦套餐,增加公司收益。
五、“網際網路 + ”都是大資料業務
1. 效率來自組織化,網際網路重組
世界城市提高生產力的基本措施是推動社會經濟合作的組織化,效率來源於更好的資源配置與業務的合作。有效的合作關係沉澱下來就成為相對穩定的組織,城市生產力大發展是不斷組織化的結果,網際網路是優化重組的新式武器,近幾十年全球生產力大發展主要來自網際網路對社會組織化的貢獻。
2. 資訊科技推動萬事萬物的連線
社會生產力的重組與合作包括人與人、人與物、物與物的連線與重組,重組是提高效率的主要渠道,資訊科技是生產資源組織的通用工具。資訊科技之前的自動化技術不規範,它們是利用物理、化學、機械等機理專門設計的,設計複雜且難以規範化,使得自動化推廣複製異常困難,資訊科技的出現把自動化設計變成硬體基礎與軟體開發兩大過程,極大提高自動化開發的效率,帶來創新的繁榮,資訊科技成為實現事物重組的核心工具。
3. 數字化裝置之間靠資料實現連線
資訊科技對物體的連線需要被連線的物體實現數字化,物體需要裝上晶片,實現數字化,能夠理解數字訊號。資訊科技只能連線已被數字化的物體,摩爾定律的偉大貢獻在於使萬事萬物數字化的成本降到幾乎為零,數以億計的晶片、感測器、移動手機都能夠通過網路與資料進行重組,數字化裝置靠傳遞資料實現連線,大規模數字化設施的連線構成大資料爆炸的物理基礎 。
大規模數字化設施的有效連線依賴的就是資料,“網際網路 + ”連線的設施規模越來越大,傳送與接收的資料量越來越多,網際網路連線設施爆炸使連線交換的資料也隨之爆炸性增長,因此所有“網際網路 + ”業務都是大資料業務。
六、拓展政府大資料應用理念創造效益
1.大資料的應用不再侷限改進決策政府要從認知型大資料應用理念中解脫出來,從更廣闊的大資料視野出發,更開放更創新看待大資料應用。政府大資料應用既要為領導決策服務,又要為基層工作人員改進操作服務,通過資料探勘、統計分析為領導層提供決策建議是一種重要的大資料應用,認真整合微觀的資料,為基層業務服務,提高公共服務效率同樣是重要的大資料應用,而且是更有效的大資料應用。
2. 面向基層確定性業務應用易有成效
大多數政府建立的資料應用系統依然把對上服務作為重點,對基層服務重視不夠,當前對基層的服務更為迫切,基層業務工作的確定性更強,更容易取得效益,對基層服務也是資訊科技更容易發揮作用的領域,將政府大資料服務向基層傾斜,對提高資料操作效率為主的應用更容易產生效果。
目前政府對公眾服務碰到的問題是效率低,主要原因是對當事人辦事的相關資料組織的不好,連不上、調不出且把麻煩推給辦事人,資料整合可以改善這種服務,讓使用者“只跑一次”是資料層次上的大資料應用,也是更容易見成效的大資料應用。
3.城市大腦更適合做小腦型業務
城市大腦由大資料中心及城市執行管理中心構成,人們期望利用大資料來改善城市的自動化管理。城市的管理很複雜,有確定性任務與不確定性任務,資訊科技並不都能勝任,有些任務必須由專家來承擔。
不確定性的工作是資訊層次上的業務,無法用自動化程式來勝任,這些工作主要還是要靠人腦來完成,稱之為大腦型業務,需要組織專家來承擔。
確定性的業務是在資料層次上操作,可以建成智慧化的業務流程,讓資訊科技直接對資料進行處理,此類業務不需要對資料進行資訊抽象,不需要形成概念,稱之為小腦型業務。
資訊系統適合做的是小腦型業務,城市大資料中心和城市執行中心要定位在小腦型業務上才更容易看到成效。
4.推動公共服務智慧化、業務分析專業化
一切智慧化業務都是大資料業務,政府大資料業務的重要方向是推動公共服務的智慧化,政府應當學習企業的服務模式,充分利用企業對外服務的經驗改進政府工作,通過政企合作將政府的服務能力達到企業級的服務水平。
政府的大資料分析研究工作要以政府專業化部門為中心,越是專業化的部門,大資料分析越能夠發揮作用,專業化的大資料蒐集更容易做,專業化的大資料中心更容易生存。
七、政府大資料應用趨勢
1.政府公共服務效率全面提升
政府提出的口號“只跑一次”、“一號、一窗、一網”目標明確易於檢查,提高資料處理效率的業務是確定性的任務,只要認真做好資料整合,目標容易實現,提高公共服務的使用者滿意度是國家推動的重點,各地區都會努力跟進,全國公共服務的效率會迅速提高,跨地區的公共服務會逐漸增加。
2.政府公共服務向智慧化發展
政府公共服務進一步提高是向智慧化服務發展,在大資料、雲端計算、物聯網、人工智慧技術大發展的環境下,智慧化系統建設會越來越快,IT企業將在智慧化方面開展競爭,將更多進入政府系統的長期執行維護領域,政府公共服務業務的智慧化是最容易產生效果的領域,公共服務智慧化最能夠激發公眾的獲得感,會成為智慧城市亮點,競爭必將全面提高公共服務智慧化的水平。
3.大資料分析向專業化、集中化發展
政府大資料分析主要依賴專家的智慧,專家的稀缺使這項工作無法各地普及,大資料分析研究工作會向專業化、集中化發展,會形成一些高水平的研究機構,承接大型的大資料分析任務,該機構會通過雲平臺向社會提供多樣化的分析軟體工具,供各地政府使用,地方的大資料分析業務會以政研室為主與外部專業化機構合作推進。大資料中心熱會隨之降溫,將重點業務轉向常規業務資料的精細化管理。
4.視覺化應用成為熱點
隱私保護難以解決及資料價值難以評估,大資料交易熱不會產生,而視覺化資料釋出會成為熱點。擁有大資料資源的企業可以製作視覺化資料產品向社會發布,以顯示企業的能力,政府向企業定製採購視覺化資料瞭解有關趨勢,視覺化資料不僅能繞過隱私保護的困難且能加快資訊溝通,必將成為大資料時代資訊傳遞的重要方式,政府資料、企業資料向社會開放都會大量採用該模式。
5.政企合作大勢所趨
網際網路巨頭企業的資訊科技能力、創新能力、大資料處理能力遠遠超越政府,阿里、騰訊、百度、華為等企業越來越多投入智慧城市建設,政府與企業競相簽訂協議,利用企業的資金與技術點燃政府公共服務的新亮點,大型IT企業與政府合作是提高政府智慧化水平、大資料應用水平的捷徑,政企合作模式會加劇智慧城市建設的競爭,改變智慧城市的創新節奏,使智慧城市建設進入全面創新的新時代。