數據正重塑著經濟與社會。從生產到生活,從工業到服務業,從產業端到消費端,越來越多的東西呈現出了數據化的態勢,數字已經開始重新定義一切。
過去幾年里,數據治理作為數據的核心管理手段,得到了政府、企業、個人的高度關注, 伴隨著理論、法律、政策、產業的一系列實質性變化 ,各方正在將數據治理納入到政務活動、企業治理、經營管理等領域, 數據治理的理念、法規、方法、工具也得到了蓬勃發展。
隨著各行業、各組織對于數據治理實踐的推進,一些變化與趨勢正在逐步顯現。
— 01 —
趨勢一:數據治理成為數字化轉型的核心要素
2022年,數字經濟熱度不減,作為增長新引擎持續發力,“十四五”時期,我國數字經濟轉向深化應用、規范發展、普惠共享的新階段,“數字化轉型”仍是很多企業今年的重要戰略部署之一。
同時,以云計算、大數據、人工智能、區塊鏈等為代表的數字技術不斷涌現,快速向各領域進行融合滲透,加快了數字化轉型的進程,數據量和數據的價值密度都呈現爆炸式增長。據IDC公司預測,到2025年全球每年產生的數據將從 2018 年的 33ZB(1ZB=10 萬億億字節)增長到 175ZB,相當于每天產生 491EB(1EB=1.1529e+18 字節)的數據。
海量的數據資源,對企業的數據采集、存儲、分析、處理的工具、計算、建模應用等方面的數據能力提出了更高的要求。企業需要依托數據治理來實現數據、技術、流程和組織的智能協同、動態優化和互動創新,深入挖掘數據資產價值,使數據成為數字化轉型的關鍵驅動要素,賦能企業戰略、運營與業務的創新發展。
— 02 —
趨勢二:數據編織或將成為數據治理優化的新方向
人臉識別、人工智能、 AI 安防、物聯網、 5G 等新技術新業務在各個領域得到了迅速應用,再加上云計算、邊緣計算的興起,數據環境越來越復雜,傳統的集中式架構已無法滿足新業務的應用和數據增長帶來的更高的容量與性能需求,于是,采用去中心化、分布式的數據網絡架構就成為必然選擇。
在此背景下,數據編織作為一種跨平臺的數據整合方式興起。它是利用對現有、可發現的元數據資產的持續分析,以支持跨所有環境(包括混合云和多云平臺)設計、部署和利用集成和可重用數據,這將為數據治理帶來更多的便利性。
據Gartner預測:數據編制利用分析功能來持續監控數據管道,通過對數據資產的持續分析,支持各種數據的設計、部署和使用,縮短集成時間30%,縮短部署時間30%,縮短維護時間70%。
雖然目前數據編織并沒有被納入常規數據治理體系,但在日益多樣化、分布式和復雜的環境中,數據編織的架構可以被看作是實現數據管理和集成現代化的穩健的解決方案。
— 03 —
趨勢三:人工智能的發展促進數據治理走向智能化
數據治理和人工智能作為近幾年的兩大浪潮,二者之間一直存在著相輔相成的關系。
一方面,數據治理為人工智能奠定基礎。通過數據治理,企業可以提升數據質量、增強數據合規性,從而為人工智能的應用提供高質量的合規數據。
另一方面,人工智能對數據治理存在諸多優化作用。人工智能幫助實現概念模型與計算機模型的完美融合,從而優化數據模型管理;能實現對非結構化數據的采集和關鍵信息的提取,并幫助維護、整合元數據;能幫助企業識別主數據,并幫助定義和維護數據匹配規則,助力企業的主數據管理;能定義轉換規則,提取數據質量評估維度,同時,通過監督學習、深度學習來實現對數據清洗和數據質量的效果評估,最大化地實現數據質量的動態提升;能推進數據分級分類,促進數據安全保障體系完善,進一步保障數據安全……
隨著數據治理和人工智能兩個領域的各自快速發展,二者的融合會使得更多場景和商業模式涌現。
例如互聯網企業可以使用機器學習分析用戶點擊過哪些鏈接,為用戶生成畫像,打上特定的標簽,用來做商品、內容的推薦和優化用戶搜索結果。在金融行業中,目前銀行的信用卡發卡部門已經開始利用機器學習技術,來識別不合規的申請人,以及虛假的申請信息等。企業可以充分的利用人工智能技術,共享和開放一部分數據或數據加工結果,對外提供服務,提升企業競爭力。
— 04 —
趨勢四:數據治理從成本中心向價值中心演進
傳統的數據治理往往聚焦于政府或者企業的內部數據能力建設。但在目前數字化轉型的大背景下,數據要素的激活、數據價值的發揮、數據服務的建立與開放逐漸成為政府、企業在進行數據治理時的關注重點,數據治理的定位逐漸向價值中心演進,更注重效能。
寶馬領悅數據治理思路的調整就是一個典型的例子。寶馬領悅在進行數據治理之初是以自上而下的方式,搭建起了企業的數據治理框架和基礎能力,但在這個過程中遇到了一些挑戰和質疑,主要問題產生在數據治理的效果與業務支撐之間的巨大鴻溝方面。
隨后寶馬領悅便調整了數據治理的思路,數據治理不再僅僅聚焦于諸如元數據管理、主數據管理、數據質量管理、數據認責管理、數據安全管理等一系列能力建設,而是對于業務需求去進行一些有針對性的工作,讓數據治理真正支撐業務,在技術應用、業務應用以及安全合規方面都起到了非常好的支撐作用,進而逐步強化了數據治理工作在企業內部的受重視程度,推進了寶馬品牌的數字化轉型。
— 05 —
趨勢五:數據將進一步開放與共享
數字經濟時代,數據已成為基礎性戰略資源,作為新型生產要素之一,數據資產化已是必然趨勢,而數據的開放共享是則是深入挖掘數據資產價值的基礎。
從2015年9月國務院發布《促進大數據發展行動綱要》至今,政府數據的開放共享正不斷推進,各方面資源進行了有效整合,綜合治理能力大幅提升。2021年,《數據安全法》第五章專章規定“政務數據安全與開放”,在基本形成跨部門數據資源共享共用格局后,由政府主導打通政府部門、企事業單位間數據壁壘的數據共享開放平臺,進一步推動實現政府公共數據的普遍開放。
2022年,隨著全社會的數據存儲、數據挖掘、數據使用、數據參與意識逐漸覺醒,數據價值化的條件將進一步成熟,數據的所有權、使用權、增值權及數據紅利的釋放權、分配權有望在新的一年里確定更加清晰的邊界,數據要素價值將得到更有效的釋放。
此外,在數據不斷標準化、開放化的同時,行業的數據標準建設進程也將進一步加快,無論是政府、行業數據,還是企業內部數據,都將遵循一個相互認可的數據標準、處理規程。這也將進一步推動企業建立起適合自身的數據治理標準、路徑和方法。
— 06 —
趨勢六:數據安全仍是貫穿數據治理各環節的核心重點
海量、多元和非結構化已經成為了數據發展的新常態,而這給企業的數據管理帶來了許多安全隱患。根據風險基礎安全(Risk Based Security)的數據顯示,2020年全球數據泄漏達到360億條,創歷史新高。
數據治理,安全先行,數據安全治理仍是2022年各組織進行數據治理的核心重點之一。
加強數據安全治理的驅動之一來自于組織內部。
近年來數據安全事件頻發,Gartner指出,近75%的IT組織將面臨一次或多次勒索軟件攻擊。而且數據安全的威脅更加多樣化,不再局限于病毒木馬等傳統攻擊手段,數據權限濫用、API接口攻擊等問題層出不窮。
新技術的應用使數據安全問題進一步顯現。當前云計算的發展已進入成熟期,基于云原生的低代碼開發平臺受到追捧。雖然云原生可以通過提供一套完整的技術體系和方法論,來幫助企業在系統功能越來越復雜的環境下能夠實現敏捷開發并保證系統的可用性,但于此同時,機遇與風險并存:《Sysdig 2022云原生安全和使用報告》發現,超過75%的運行容器存在嚴重漏洞。數據安全治理愈發成為企業進行數據治理中的關鍵環節。
驅動之二則來自政策方面。
數據安全正步入法制化和戰略性軌道。截至2021年,我國的數據安全監管框架已經基本成型:《網絡安全法》、《數據安全法》、《個人信息保護法》三法為數據安全護航;此外,在銀行、通信、工業、能源等各領域也已經有一系列條例規章從實踐角度推動產業內數據安全治理體系的落地。
2022年,與數據安全相關的政策還在繼續細化。國家互聯網信息辦公室頒布《網絡安全審查辦法》修訂版,將網絡平臺運營者開展數據處理活動影響或者可能影響國家安全等情形納入網絡安全審查;國家九部委聯合發文規范平臺企業發展,再次針對互聯網企業合規經營,強調防止數據過度采集,打擊黑市數據交易、大數據殺熟等濫用行為;2月10日,工信部發布通知,再次公開征求對《工業和信息化領域數據安全管理辦法(試行)》的意見。可見,與數據安全相關的管理辦法等細則正在加速落地。
— 07 —
小結
2022年,數字時代的新圖景正徐徐展開。可以預見的是,各組織的數據治理正邁向更加成熟的方向邁進。數據治理是一個長期的過程,把握趨勢,不斷調整優化,才能更好地發揮數據價值,真正讓數據賦能發展。