专题 | 万字分享数据共享交换平台的实践要点
作者介紹
蘇槐,中國計算機學會會員,數據要素發展委員會常務理事,首席數據官,現服務于龍石數據,曾就職于神州數碼、Oracle、新加坡電信等企業。擅長數據管理體系、容器技術、微服務架構及技術管理。
?
摘要:本文主要是介紹如何通過數據共享交換平臺解決橫縱各部門、各系統之間的“信息孤島”、數據煙囪、重復建設等問題,打破各部門間的信息壁壘,降低各部門數據共享門檻,建設部門間的數據高速公路,實現各部門的數據融合、業務協同、數據資產化,進而推動整個信息化建設進程飛速發展。
關鍵詞:一體化;共享交換;數據交換;資源目錄;API交換
目錄
1??電子政務發展趨勢
2??數據共享交換體系的概念
3??數據共享交換平臺的常見要素
4??數據資源目錄建設的重點和新要求
5??數據交換平臺建設的重點和新要求
6??API平臺建設的重點
1??電子政務發展趨勢
隨著我國信息化建設的深入發展,推進橫縱各部門間的數據交換,實現跨層級、跨區域、跨部門、跨系統數據共享與業務協同,已經成為當前電子政務建設的重點。我國新一代的政務服務模式“互聯網+政務服務”正在形成,保障各部門數據的使用安全性和遷移安全性,已經成為政企使用共享交換平臺的基本前提。
在“一網統管”、“一網通辦”、“互聯網+政務服務”的發展趨勢下,數據實時共享和業務協同的需求越來越多,但是由于政務數據源分散、數據相對割裂、應用及服務碎片化,使得數據開放共享工作中,需要上級單位通過行政命令方式統籌下屬各委辦局,協調各單位信息部門和職能部門,并需要系統開發廠家的高度配合,協調難度大、成本高、耗時耗力。但是,經過十多年的發展,在數據共享的切實需求驅動下,目前各個部門對政務數據資源的態度已經由原來的“不愿共享”變成了“愿意共享卻不知怎么共享”的問題。
為了解決數據共享的三難,“不愿”,“不敢”,“不會”問題,國家陸續出臺多項信息化建設指導文件,如國務院印發《促進大數據發展行動綱要》、《政務信息資源共享管理暫行辦法》、《“十三五”國家信息化規劃》、《國務院關于加快推進“互聯網+政務服務” 工作的指導意見》、《政務信息系統整合共享實施方案》,以及今年印發的《加強數字政府建設的指導意見》和《全國一體化政務大數據體系建設指南》。這些文件中都明確要求打破信息壁壘和孤島,采取授權使用等機制解決信息安全問題,構建統一高效、互聯互通、安全可靠的國家信息資源體系,打通各部門信息系統,推動信息資源跨部門跨層級共享共用等。而建設安全、高效、精細分工的共享交換平臺,形成政務信息資源共享交換體系,為以上問題找到了出路。
2??數據共享交換體系的概念
政務信息資源共享交換體系包含兩部分,政務信息資源目錄體系和數據交換體系,兩者都是為電子政務應用提供跨部門跨層級服務的基礎設施,他們相互獨立,互為支撐。各級部門單位可以根據實際應用需要,利用目錄體系發現和定位信息資源,利用數據交換體系享受數據共享交換服務。
那什么是政務資源目錄,政務資源目錄包含什么呢?
政務信息資源目錄,是通過對政務信息資源依據規范的元數據描述,按照一定的分類方法進行排序和編碼的一組信息,用以描述各個政務信息資源的特征,以便于對政務信息資源的檢索、定位與獲取。政務信息資源則是指政務部門在履行職責過程中制作或獲取的,以一定形式記錄、保存的文件、資料、圖表和數據等各類信息資源,包括政務部門直接或通過第三方依法采集的、依法授權管理的和因履行職責需要依托政務信息系統形成的信息資源等。
政務信息資源共享交換就類比用餐一樣,信息資源相當于是食材,數據交換相當于是獲取食材和分食的途徑。魚肉靠狩獵,瓜果蔬菜靠種植;分食同理,肉類用刀,湯類用勺,不同類型的信息資源也決定著不同的交換方式。結構化和半結構化的數據通過庫表交換,非結構化的數據通過文件交換,交換時效性強且高頻度的數據通過API交換。數據交換平臺需提供不同的數據交換方式,滿足于不同類型的數據共享需求。
3??數據共享交換平臺的常見要素
?圖1 數據共享交換平臺-總體架構圖
結合國標《GB/T 38664-2020信息技術 大數據 政務數據開放共享》和龍石數據共享交換平臺的建設經驗,政務數據共享交換平臺主要包含信息資源門戶、資源目錄管理平臺、數據交換平臺、API平臺和API服務底座,如上圖所示。
1)信息資源門戶為用戶提供便利的數據資源應用功能,包括數據資源的檢索、申請、審批、評價的全流程管理,以及基于資源目錄的數據在線查詢和在線下載,為數據資源的共享和應用提供便利的載體。
2)資源目錄管理平臺以《政務信息資源目錄編制指南》和相關政務信息資源共享政策為依據,提供政務信息資源的編目、發布、審核、資源掛載、下架的全流程管理,為信息資源門戶提供配套的管理支撐功能,同時支持跨層級目錄級聯的功能。
3)數據交換平臺為跨層級、跨部門、跨區域數據交換服務提供能力支撐,實現數據資源的調度和共享交換,數據交換平臺可通過信息資源門戶驅動自動化的數據庫交換、文件交換以及API服務共享,實現數據資源的自動化共享交換。數據交換平臺遵循政務信息資源共享交換體系,包括數據交換前置節點和數據交換中心節點,是城市級數據交換和數據共享應用的中樞。同時,面對數據交換量快速增加和數據安全要求逐步增高的要求,提供可擴展的集群管理能力和數據安全管理能力。
4)API平臺提供API開發、測試、發布、維護、運行到下線的全生命周期管理,實現數據的實時交換、可信交換和應用程序編程接口網關管理。通過疊加授權鑒權、流量控制、并發控制、質量監測、黑白名單安全管理等功能,提供全生命周期的API網關管理能力。同時,實現與信息資源門戶的無縫集成,方便需求部門的API申請和調用。
5)API服務底座為API提供彈性計算、資源隔離、資源共享和高性能并發的能力,是API的底層支撐平臺,為API服務提供安全、高效、穩定的運行環境和智能化運維能力,通過動態的集群與負載均衡機制,有效保證了API的高性能、高穩定性運行。
6)用戶權限中心提供全局的用戶管理與權限管理,保證數據安全,實現統一認證,為多系統集成和權限管理提供統一支撐,同時支持與其它平臺的無縫整合管理。
4??數據資源目錄建設的重點和新要求
經過十多年的演化和發展,新時期的資源目錄平臺對資源目錄分類、資源目錄編制、申請審核機制、數據資源應用、數據資源管理等方面提出了新的要求。
?圖2 數據資源目錄平臺示例
1)資源目錄編制自動化:資源目錄就是全局數據的“一本總賬”,好的賬簿要有明確的分類,才能方便檢索、定位。編制的要求不僅是按照資源屬性、涉密屬性、共享類型、層級等屬性進行基礎分類,還要在基礎分類之上按照行業、領域、使用場景等進行精細劃分,合理精確的分類是信息資源高效實用的基礎,也是數據安全分級分類的基礎。電子應用高速發展的時代,部門業務系統繁多,形成的信息資源更是數不勝數,元數據是資源目錄編制的核心內容,純粹的線上人工編制耗時耗力且準確性低,因此,支持自動化的EXCEL批量導入,(非)結構化元數據的自動采集,已成為必要手段。
2)線上審批與流程自動化:完備的數據申請、審核、授權和訂閱機制是資源目錄建設的重要組成部分。不僅是部門業務流轉過程的重要體現,也是遵循“誰提供、誰負責,誰流轉、誰負責,誰使用、誰負責”基本權責原則。資源目錄平臺提供線上、線下消息通知提醒、自動交換,根據有效期自動啟停數據交換流程等功能。在日常辦公過程中,很容易因為短時間內工作任務量大,導致某些審批擱置時間過長,產生忘記審批和忘記推送數據的情況,而消息通知、自動交換、自動啟停等功能無疑又是為此類問題上了一道保險,從而避免不必要的績效影響。
3)數據在線應用:傳統的資源目錄平臺,資源目錄主要是通過文字或者元數據來描述資源屬性,無法實時直觀看到這個資源背后真正的數據情況,更不可進行數據批量比對工作。經過一兩天的申請審核流程,申請下來的數據不是預期想要的,更有相差甚遠的情況,重新協調又需花費大量時間,往往迫于工作緊急性,只能先“有什么,用什么”,后續再協調改進,數據應用效率低下。考慮到這一因素,資源目錄平臺對已經審核通過的資源應當提供線上查詢比對、自動生成數據API的功能,避開了這類“數據資源瞎子”的問題。
4)數據資源深化管理:數據資源目錄建設的主要目標是打通部門壁壘,實現部門間數據資源的高效安全共享。那么,高質量的數據資源是實現有效數據共享交換的前提,數據質量、數據標準和數據安全屬性也是數據資源目錄的重要組成部分,也是各部門數據管理工作的重要成果。因此,需要在資源目錄上展示數據資源的數據標準引用和貫徹情況,數據質量的監測規則和質量指標情況,以及數據安全分級分類情況,為數據資源應用方提供量化參考依據,促進數據資源有效利用,從而通過數據應用需求倒逼源頭數據治理和數據質量的提升。
5)一體化目錄級聯:資源目錄平臺應當支持橫向各部門資源歸集、整合,向上支持目錄級聯,向下支持目錄同步,致力于構建橫縱一體、跨層級跨部門的城市級政務信息資源體系,加速一體化政務大數據體系的實現。
?圖3 全國一體化政務大數據體系總體架構圖
5??數據交換平臺建設的重點和新要求
數據交換平臺是集庫表交換、文件交換、API交換于一體的交換全流程管理平臺,包括增量交換和全量交換,數據采集、傳輸、加工、清洗以及整合,主要解決跨區域、跨層級、跨部門、跨系統、跨網絡的實時數據交換傳輸以及落地數據中心的需求,構建數據中心和數據倉庫,打造星型和網狀兼容的數據交換體系。
?圖?4 數據交換平臺示例
在疫情防控的背景下,數據交換平臺已經成為城市中不可或缺的數據交換樞紐,同時對數據交換吞吐量、數據交換及時性以及平臺穩定性都提出了更高的要求,因此,根據我們的實踐經驗,分享下幾個關注要點:
1)數據交換的技術保障:數據交換平臺是多部門數據交換的樞紐,數據交換平臺(前置機)的主要用戶是各個職能部門,因此,從職責分工上來看,數據管理部門應當負責交換節點接入和數據交換培訓,職能部門應當基于統一的數據交換平臺負責數據發送、數據接受和數據交換流程設計。但是,鑒于部分職能部門技術力量薄弱的情況,不但數據交換平臺應當通過一些可視化的方式降低平臺的使用門檻,而且,數據管理部門應當為職能部門配套必要的技術支撐服務。從我們的實踐經驗來看,這是數據交換平臺得以順利應用的一個重要條件,也是數據交換平臺不斷收集職能部門需求和升級優化的重要途徑。
2)數據安全三重保障:數據作為當下重要的生產要素之一,其中涉及到的價值不言而喻,保障數據安全是數據共享交換最基本的前提。一是引入部門前置機保護數據安全,前置機將各部門業務系統隔離開來,防止生產環境被滲透攻擊,并且與以往點對點的交換模式不同,依托中心統管的交換模式,各部門只能管理和使用本部門前置機,部門間的數據交換工作由交換平臺完成,有效的保護各部門的數據隱私安全。二是使用數據加密傳輸,對數據交換通道提供自動化加解密功能,交換過程即使受到攔截和攻擊也無法獲取明文數據。三是提供數據安全管控機制,通過數據安全管理模塊,自定義識別敏感數據的策略,對信息資源元數據分級分類,取得部門授權后,自動化清除各部門前置機周期內全量數據。
3)數據交換主題管理:隨著業務的不斷發展,業務環境越來越復雜,數據量增長趨勢一路攀升,面對各式各樣的數據,如果不能進行分門別類管理,會極大加重日常的數據統計、分析和總結工作。交換平臺應當能夠按主題劃分數據交換通道,按主題接入部門前置機,實現一部門多節點、一主題一節點、專項數據專用前置機等多種管理模式。例如按主題劃分數據交換通道,能夠支持按疫情防控統計各類疫情數據交換情況,為疫情研判、流調溯源、人員管控等分析工作提供數據支撐。
4)可視化交換流程設計:數據交換平臺通過可視化流程設計器降低職能部門的使用門檻,無需準備任何開發環境,線上拖拽就能完成業務庫數據到部門前置庫的雙向采集、加工、清洗等工作,輕松實現庫到文件、文件到庫、跨數據庫轉換過程,同時提供各類業務數據處理模板,支持對同類業務流程的可復制性,更低成本的輔助部門完成簡易或復雜的數據交換流程設計工作。
?圖5 可視化交換流程示例
5)數據交換全流程管理:數據交換平臺應當提供數據對賬、交換監控、消息通知、預警提醒等功能,貫穿整個數據交換流程,解決交換過程中用戶所有的疑慮和擔心。例如遇到數據遺漏、丟失、失敗、滯后時需要第一時間告知交換雙方,以往都是通過運維人員手工發現問題,如果運維巡檢不及時,就會出現業務停滯,嚴重還會產生業務事故。為改善以上情況,降低業務風險,交換平臺應當支持業務庫與前置庫和源頭前置庫與目標前置庫的全流程對賬,掃清數據遺漏、滯后甚至宕機故障,方便問題溯源排查;同時,應當支持節點故障的短信、郵箱預警,交換任務失敗的短信、郵箱預警,減輕運維壓力;甚至,為了實現重要數據交換成功后的及時感知,應當支持數據交換成功后消息通知運維人員、數據提供方和數據接收方,降低三方數據交換的感知延遲。
6)實時數據交換:在“一網通辦”、“互聯網+政務服務”的發展趨勢下,數據實時共享需求越來越多,最大化減輕辦理人員壓力,讓客戶現場來,現場辦,最多跑一次,已是當下共享交換的新課題。數據交換平臺應當支持實時交換,通過讀取數據庫日志的方式,實時獲取前置庫內數據的變化(增刪改),并實時將數據變化更新到目標庫,根據我們的實踐經驗來看,普通的交換前置機也可以實現分鐘內百萬條數據的同步。例如,在沒有實時交換之前,辦理生育登記和津貼領取、身后一件事、企業開辦一件事等業務,最短也是隔天才能完成,如今只是喝一盞茶的功夫,這無疑是共享交換實踐階梯式的跨越。
7)高穩定、高性能、高擴展:鑒于數據交換平臺在城市業務協同中的重要支撐作用,平臺的穩定性、性能和擴展性已經成為不得不慎重考量的重要話題。因此,數據交換平臺應當實現中心集群能力,包括對中心數據庫、中心文件服務器、數據交換中心節點,實現負載均衡,搭建主備雙活交換中心,主中心宕機后可自動切換至備中心,保持平臺穩定運行。交換平臺應當同時支持節點端集群,實行多節點協同工作,一節點管理、監控,多節點支撐交換調用請求。交換平臺應當無縫對接資源目錄平臺,自動化接收數據交換請求,自動化創建交換任務;同時,對外提供可擴展統計接口,實現交換成果上屏等功能。
6??API平臺建設的重點
當今復雜的數字生態系統由許多相互關聯的部分組成。API平臺作為看門人和連接器在其中發揮著關鍵作用——提供了許多最終用戶甚至沒有注意到的自動化機會和效率。API平臺的主要目標是(1)基于數據中心的建設成果,創建自己的API,提供給各個職能部門調用;(2)接入各個職能部門的API,實現全市API的統一授權鑒權、流量控制、并發控制、質量監測、黑白名單安全管理等。
?圖6 API平臺架構圖
目前,職能部門基于數據安全的考慮,越來越多地通過API實現數據共享交換,各職能部門也對數據共享交換平臺提出新的要求,包括接入便利性、數據安全性、平臺可靠性等。因此,根據我們的實踐經驗,分享下幾個關注要點:
1)API全生命周期管理:API平臺應當支持API全生命周期管理,保障接口服務正常運行、降低系統性風險、降低開發和管理成本、提高管理維護效率,助力快速、安全、低成本地將能力、服務、數據以API的形式接入、開放和治理,構建健康的API生態系統,全面支持數據開放共享的建設要求,為數據應用提供可靠的技術支撐。支持每個API從開發、測試、發布、維護、運行到下線的完整生命周期管理,提供實時交換的網關服務支撐能力。支持API調用安全審計功能,精準識別使用者的身份。支持從多種維度分析和監控API,包括:可用性、正確性、響應時效等指標,并形成健康分析報告,便于全面了解平臺API的健康情況。提供統一的API管理和數據集成解決方案,方便與業務系統進行集成。
2)API自助式開發:在數據共享交換和數據中心建設成果的基礎上,數據管理部門需要將數據通過API的方式提供的職能部門使用,傳統模式下,需要開發人員開發API服務,并經過一系列的安裝部署工作,才能將API提供給數據需求部門。為了改變這一現狀,API平臺應當支持通過可視化配置的方式將數據轉換為接口服務,無需編碼,快速實現數據接口服務的開發,降低數據提供方的API開發成本,減少API調用方的等待時間。
3)API安全:API平臺應當支持授權鑒權功能,每個數據申請部門都持有自己的公私鑰,公鑰用于請求發送和數據傳輸,私鑰用于請求簽名和身份識別,平臺用于保證秘鑰安全不泄露,從而保證數據共享交換的安全性;同時,可結合業務應用場景,分配不同鑒權碼,方便后期通過鑒權碼對數據應用的追溯、管理和統計;支持通過訪問限流保障數據不被惡意抓取,通過并發限制保障API服務的穩定,通過黑白名單限制惡意訪問,通過訪問日志保障安全事故可被追溯,從而全方位保證API安全與穩定。
4)API監控:API管理包括對外部接入API的管理和自有API的管理,外部API或自有API的宕機將會造成API申請方的業務系統宕機,因此,API需要在第一時間感知API的故障或潛在風險。因此,API平臺應當對API的可用性、準確性與響應時間等指標進行監控,一旦發現API不可訪問,或API響應時間超過設定的閾值,應當以短信和郵件等方式通知相關運維人員,在對業務產生影響之前快速解決問題。同時,可用性、準確性和響應時間等監測結果也是對API提供方的重要評價依據。
5)高穩定、高性能、高擴展:與數據交換平臺一樣,API平臺在城市業務協同中具有同樣重要的支撐作用,API平臺是所有API服務的統一出入口,平臺的穩定性、性能和擴展性也是必須考量的重要因素。因此,API平臺應當支持集群部署架構,具備彈性水平擴展能力,通過平臺負載均衡、流量控制以及API服務底座的資源管理,保證數據實時共享,保障API服務和API平臺的穩定高性能運行。同時,API平臺應當支持與數據資源目錄平臺集成,將API文檔信息對接到數據資源目錄平臺;數據資源上架審核通過后,API平臺自動為數據資源創建對應的API;數據資源需求部門申請使用資源請求審核通過后,API平臺自動為數據資源需求部門創建API鑒權碼。
總結
數據共享交換平臺是實現政務數據目錄統一管理、數據資源統一發布、共享需求統一受理、數據供需統一對接、數據異議統一處理的基礎支撐平臺,是實現數字政府高質量發展的前提條件,因此,數據共享交換平臺的建設應當適應新時期的高標準要求,實現政務數據實時交換,支持海量數據高速傳輸,實現數據分鐘級共享,形成安全穩定、運行高效的數據供應鏈。
總結
以上是生活随笔為你收集整理的专题 | 万字分享数据共享交换平台的实践要点的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 员工关系专员岗位职责是什么?什么是员工关
- 下一篇: 医院RFID资产管理之大型医疗设备资产管