亚洲中文字幕AⅤ天堂,亚洲成aⅴ人片久青草影院,色吊丝中文字幕,日本不卡一区二区三区在线

鐘乙喬:數據母體-數字基建底座

2020-11-30 來源/作者:國脈集團
瀏覽量: 分享

年會視頻.png

點擊上方圖片鏈接回看年會視頻 

11月26-27日,由中國社會科學院信息化研究中心、北京國脈互聯信息顧問有限公司、舟山國脈集團有限公司聯合主辦的年度改革創新研討盛會(第16年)——“2020智慧中國年會”在北京召開,以“十四五前瞻與智治社會建設”為主題,共有來自全國部委、省、市、區縣電子政務、智慧城市、大數據主管領導、行業專家、企業代表、主流媒體千余人參會。

本文系國脈集團產品經理鐘乙喬于11月26日下午在“2020智慧中國年會”上的“新基建賦能數字社會——數字經濟篇”分論壇上的演講,演講主題為“數據母體-數字基建底座”,內容通過現場速記整理,未經本人審核。

鐘乙喬.jpg

「國脈集團產品經理 鐘乙喬」

 

<--------------------以下為演講內容------------------>

各位領導、各位嘉賓,大家下午好,我是網脈科技產品經理鐘乙喬,前面各位領導講了關于數字新基建的一些看法、思路和運行方式,作為數字經濟的一個底層,接下來我給大家介紹數據母體——數字基建底座。

一、建設背景

(一)數據治理的難點痛點

在數字新基建的發展環境下,我們長期關注數據治理這個重要關注點。只有做好數據治理才能把新基建的最基層工作做好,數據治理的難點、痛點主要體現在以下幾方面。

一是數據標準化低,很多業務公司、技術公司在創建一些數據庫或者一些表字段時,對于字段的規范、長度和類型都沒有做到極致的標準化。

二是數據交換成本高,正因為數據不標準,這些問題就導致做數據交換的時候成本比較大。比如實際項目需要外部接口或者底層數據去交換的時候,就要花大量的時間和人力做對接,甚至完成對接以后的結果并不是非常理想。

三是底層數據重視程度低,業務數據的基礎庫和數據元池存在著缺失。

四是跨行業數據融合困難,發生跨業務數據融合時非常困難。數據之間無法完成精準的供需匹配。

這些都導致多網并存、信息孤島、二次錄入、數據壁壘的現象存在。

(二)數據標準化影響數據應用質量

在規劃方面,很多大型項目在開展的前期缺乏數據規劃,缺乏系統性的框架結構;

在標準依據方面,數據標準的依據標準都是不一的,有些使用了國家標準,有些使用了行業標準,有些甚至沒有使用任何標準,這導致了數據定義各異;

在應用方面,我們對于業務字段和技術字段會產生一些歧義,同樣的字段名稱在不同的業務和技術體系當中代表的意思不同,可能造成邏輯關系脫節現象。

所以要做好數據標準化,做好字段的標準化,對象定義的標準化,代碼的標準化,還有業務指標的標準化等。

(三)統一規范的數據元是數據標準化的基礎

數據元是數據的最小的單元,它的質量好壞直接影響對語義的認知,在我們的數據傳遞、流通、交換、融合、共享當中,它都是最底層的、最基礎的要求,數據元是數據的“底層建筑”、在數據體系中具有基礎地位,數據母體是新基建的底層。

(四)政策要求做好數據化標準工作

近年來,國家及地方相關政府主管部門接踵發布各自領域數據元標準和數據元目錄,如國家標準化委員會《電子政務數據元標準》、北京《法人基礎信息數據元目錄規范》、安徽《公共信息用信息數據元目錄》、遼寧《漁業信息化基礎數據元》、湖南《地名數據元規范》等。

二、數據母體

(一)產品概念

數據母體是基于公共數據元與電子政務主題詞的數據治理綜合服務平臺。它提供高質量標準化的服務,為數據治理與數據質量再造提供綜合性解決方案,構建全球數據體系的語言詞典——數據元字典。

數據母體主要從“軟件、數據、咨詢、服務”四個方面為數據治理提供服務。軟件方面,我們有數據治理的綜合服務平臺、數據標準發源地和數據質量標準檢測場、標準化數據的加工工具、原始數據質量的診斷工具;數據方面,收錄了國家出臺的標準文件,收錄了電子政務主題詞、公共數據元,還有標準術語和標準分類等,為數據治理提供一套標準政務數據設施,為異構數據間的共享、轉換、互操作、質量管理、內容加工與服務等提供基礎;咨詢方面,當用戶有需求,我們從行業領域、時間維度為用戶去梳理應該涉及的最基層的標準,還包含一些指標評估等的咨詢服務;服務方面,我們提供數據服務和產品服務,也可以數據+產品組合的方式來做好數據治理。

(二)框架結構

數據母體框架.png

框架結構圖

產品框架結構主要分為數據來源、存儲層、功能層及應用場景。其中數據來源主要為國家標準文件、行業標準文件及其他;存儲層包含公共數據元池、電子政務主題詞庫、數據模型庫及標準數據元池;功能層主要包含池庫定制、數據比對、數據清洗、數據元關聯分析、標準設計、模型應用等功能;主要的應用場景包含標準查詢、數據建模、質量分析及數據檢測。

(三)運行邏輯

運行邏輯是依托于數據母體當中的數據,經過清晰比對,把標準數據存入到公共數據元池當中,通過對數據的定義和業務的定義來對應用場景做設定,構建數據模型。再將這些數據分層分級分類,形成數據集市以供用戶按需選擇。另一方面,通過規則配置對用戶原有數據進行質量檢測,將結果生成診斷的報告,附加咨詢梳理服務給出對原有數據情況的整改建議。

實例:在政務大廳或者網上辦事的時候,有些材料會寫來源渠道是共享還是自備,共享和自備的前提是底層數據要統一和規范,也就是說大家所獲取到的材料名稱必須與實際數據庫里的數據名稱一致,不能出現歧義,不然數據無法共享。

(二)產品優勢

1.數據量全:目前已收錄國家發布的標準文件1764份,公共數據元372883條,范疇目錄190個、范疇表政務主題詞24151個,行業主題詞16180個,標準術語1909個、分類編碼1304個,區劃地址63895個(部分細化到省市縣區街道樓道)。

2.顆粒度細:收錄的數據細化到了數據元標識符、數據元類型、數據元表示、標準文件標準號、版本(年代)號、ICS編碼、CCS編碼、發布機構。

3.自定義配置:數據維度、領域可配置、數據模型可配置、清洗規則可配置、診斷報告可配置。

(三)應用場景

1.快速建模生成數據元基礎庫。基于場景需求定制,特別是各地政府對數據元采集、整理、建庫的規劃需求,通過標準數據元組合,可快速建模形成法人、船舶等各行業數據元基礎庫。

2.輔助構建標準核心數據元池。核心數據元池建立,是各地政府信息資源標準化的基礎。根據實際需求,梳理出核心數據元,并通過數據元清洗比對、標準化處理和智能標注關聯,構建標準的核心數據元池。

3.行業數據元評估清洗標準化。助力提升數據元質量、規范數據交換底層。

4.事項梳理標準數據表單建設。平臺支持標準數據元自由組合、關聯、建模,可協助快速創建和生成標準數據表單,且數據元標準規范統一,也有助于“多表合一”,提升事項梳理效率和標準化程度。

5.軟件質量問題與標準化檢測。借助相關數據元標準、體系、方法,可在一定程度上輔助軟件系統在研制和維護過程中形成適用于各領域系統數據質量問題的高效預防措施和最佳解決方案。

6.基于數據服務創建應用模型。通過大數據分析應用、自定義報表,實現數據的可視化展示;通過組織畫像、個人畫像等數據多維度分析,清晰了解業務對象的現狀與需求。

三、產品價值

(一)全要素建立數據資源體系

“數據母體”支持海量數據元存儲,用戶可根據需要批量導入數據元到其專項數據庫或系統,對其數據元資產進行存儲,并利用平臺提供的數據元目錄、數據元資產統計、數據元清洗、數據元校驗、智能關聯等模塊,有效管控數據元。

(二)全階段推進數據標準落地

“數據母體”收錄千余份涵蓋國際、國家、地區、行業權威的數據元及數據元值域的標準規范、數據字典等,并持續擴充,借助數據元標準化處理,推動數據元標準落地;用戶對數據元標準的選擇、反饋,也有助于各行業數據元標準的優化改造,并進一步提升數據元“上層建筑”數據、信息資源、事項等的標準化。

(三)全流程提升數據質量

依托“數據母體”,對數據元進行標準化檢測評估和可視化統計分析等,有助于從數據元層面排查、追溯和定位數據質量問題發生的癥結所在,包括數據元名稱同義重復、值域格式不規范、數據元與其值域不關聯等;基于問題有針對性地對數據元進行清洗比對、標準化、智能標注關聯等,可有效提升數據元及數據質量。

(四)全方面打造共享開放應用

“數據母體”支持數據元消費者、提供者、服務者、運營者等注冊入駐,并提供豐富的API和多樣化數據采集方式,實現數據元產業鏈內外各類資源不斷集聚;平臺用戶基于交易和支付系統,可進行數據元相關資源與服務流通,促進數據元資源應用變現與服務創新。

四、核心服務

(一)數據元質量檢測服務

利用數據母體,根據預先配置的規則、算法和度量指標等,對客戶擁有的數據元資產進行在線質量檢測,包括數據元同義重復、標準化程度等,并可視化呈現檢測結果;同時根據客戶需要,可由專業咨詢人員提供深度數據元質量檢測評估分析報告與相關改進、優化方案等服務。

(二)數據元池庫定制服務

根據客戶需求,通過標準數據元選取組合、清洗比對、智能標注關聯及數據元目錄編制、模型創建等,快速構建各種領域、行業、主題的標準數據元基礎庫、核心數據元池和核心數據字典,且支持通過API開放相關數據庫授權服務。

(三)數據元建模服務

提供大量數據元模板,用戶可自主選購自己需要的標準數據元模板;當標準數據元模板無法滿足需求時,用戶可借助數據元公共服務平臺、以標準字段自定義創建契合自身業務需求和業務應用的數據元模型。

(四)數據元在線標準設計服務

針對不同行業、不同主體,基于現有權威國際/國家/地區/行業數據元標準和標準數據元,結合實際應用場景、行業特色和客戶需求,在線設計、整理、編目、編制符合需求的各種領域/行業、主題的數據元標準;提供數據元標準導出、整理成符合相關格式規范的數據元標準文件等服務.

五、應用案例

數據母體已經在多省市,多個地區,項目上實際應用。

浙江省—— “最多跑一次”全省事項數據串梳理

深圳市——政務信息資源目錄白皮書(2017)及核心數據字典項目

浙江省——全省核心標準數據元池建設

海南省——法人庫、人口庫基礎數據元\擴展數據元信息梳理

公安部——大數據時代基礎信息采集錄入規范研究

南寧市——政務信息資源目錄梳理服務項目

舟山市——舟山市民生基礎信息數據標準和交換規范編制

上海徐匯區——政務信息資源目錄體系建設

北京西城區——大數據資源目錄梳理服務項目

佛山三水區——政務信息資源資產清單梳理

···

數據母體產品今天就介紹到這里,謝謝大家。



走進“2020智慧中國年會”

2020智慧中國年會新聞專場

年會二維碼.png

掃描二維碼直接進入

注:獲取更多會議資訊及嘉賓演講資料,歡迎登錄“2020智慧中國年會官網”,或關注“國脈數字智庫”公眾號。

年會微信.png

標簽:
責任編輯:hongqiong
在線客服