<address id="nzfpj"></address>
<noframes id="nzfpj">

    <form id="nzfpj"><th id="nzfpj"><progress id="nzfpj"></progress></th></form><noframes id="nzfpj"><address id="nzfpj"></address>
      北京物流信息聯盟

      專欄 | 高校信息化數據治理探討

      精華教育科技 2021-10-27 12:48:15

      摘要

      目前數據質量問題已成為制約高校信息化發展的主要問題,需要利用數據治理建設全校級別的數據管理流程體系才能有效全面地提升數據質量。數據治理是指將數據作為高校資產而展開的一系列標準化工作,是對數據的全生命周期管理,其目標是提高數據的質量。本文結合高校特點提出數據治理模型,給出了具體的實施方法步驟和評估辦法,具有較強的可操作性,能夠充分發揮數據治理的效果。



      一、引言

      高校信息化經過多年的發展,很多高校已積累了大量的業務和相關數據,但是因為數據質量不高、冗余數據大量存在和數據可用性不高,使很多數據處理工作還需要通過人工來確保正確,浪費了大量的人力和時間。造成這樣的問題,主要是因為高校的信息化建設往往是多系統分散進行,在建設時缺乏統一的數據規劃和相關標準,雖然做了大量的數據集成,但是因為數據不規范、不一致、冗余、部分數據無法共享等原因,使數據質量低下、可用性不高。因此我們需要通過數據治理建設全校級別的數據管理流程體系來進行數據全生命周期的管理。


      數據治理是指將數據作為資產而展開的一系列的標準化工作,是對數據的全生命周期管理。數據治理是需要技術與管理相結合并進行持續改善的管理機制,貫穿整個數據管理的全生命周期,通常需要制定組織架構、政策制度、技術工具、數據標準、流程規范、監督及考核等方面內容。數據治理的目標是提高數據的質量,保證數據的安全性,實現數據資源在高校各業務部門的有效整合和共享,從而提升高校信息化水平,更有效地發揮信息化作用。


      目前,數據治理的研究往往從兩個方面展開:一個是從數據質量管理方面,定義數據質量活動和相應的角色職責;[1][2]而最近越來越多的研究引入IT治理的經驗和辦法,從全局考慮治理框架和生命周期管理,比較常見的是以國際數據管理協會(DAMA)[3]、數據治理協會(DGI)[4]等機構提出的治理框架具有較強的借鑒意義。在高校信息化領域,許曉東等[5]提出高校數據治理可以分為數據的獲取和抽取、整合和分析、解釋和預測幾個階段,給出了基本的實施步驟,但是缺少整體的框架。包冬梅等將數據治理應用到高校圖書館,并提出了CALib數據治理參考框架。


      二、數據治理模型


      數據治理模型需要明確闡明數據治理的主要目標、相關角色、治理活動和相應的職責。[7]在這里我們可以建立RACI(R=Responsible,即負責執行活動的角色;A=Accountable,即對活動負全責的角色;C=Consulted,即擁有完成項目所需的信息或能力的人員;I=Informed,即應及時通知結果的角色)模型矩陣(見表 1)來確定相應的角色和活動的職責關系。


      其中角色包括以下五類,也構成了高校數據治理的組織架構:


      信息化領導小組:審議數據治理發展規劃,推進數據治理在全校落實。


      數據治理委員會:主持數據治理組織工作,制定數據治理相關規章制度。


      數據治理項目負責人:業務部門和信息中心負責人,管理數據治理管控活動,對數據質量負責。


      數據治理業務管理員:負責其所負責的業務數據定義、業務規則以及執行相關的正常標準。


      數據治理技術管理員:確保數據治理被有效地理解、使用和共享,滿足治理和完整性標準。


      數據治理主要活動包括制定數據治理方案、制定數據治理審核流程、制定數據模型和流程、制定數據標準、制定元數據和制定數據集成方案。其中數據治理方案將從戰略角度來統籌和規劃,對數據資產和系統進行清理,確定數據治理的范圍,明確數據治理的流程及職責,確定數據治理的評估指標、方法;數據治理審核流程是指當發現數據質量有誤時,需要啟動變更管理流程,由相關業務部門和信息中心確認變更內容和執行方法,并在學校全局得以應用,確保數據質量。而后續的步驟將涉及具體的實施方案,在第三章進行詳細介紹。


      三、主數據管理實施

      高校數據主要包括實體數據和業務數據。實體數據描述的是具體的對象,例如教師、學生、資產、教室等;業務數據描述實體發生的業務活動,例如學生選課、教師教學等,其本質是多個業務實體之間的活動關系。其中核心的實體數據往往會在多個業務系統中共享使用,這些實體數據和其屬性就被稱為主數據。ISO 8000-2-2012中定義“主數據描述了對組織起到基礎作用的實體,這些實體是獨立的,并且是組織進行事務處理需要參考的數據實體”。主數據包括元數據、屬性、定義、角色、關系和類別等。


      由于主數據作為多個業務系統中最核心的、尤其需要共享的基礎數據,分散管理的主數據由于不具備一致性、準確性和完整性,使內部數據共享受到阻礙,數據資產的價值無法有效開發,因此對主數據進行治理也是數據治理任務中的重中之重。在高校,數據治理的實施就可以先在主數據范圍內選擇不同主題進行。主數據管理旨在從高校的多個業務系統中抽取主數據并進行整合,然后進行數據治理,并以服務的方式把統一、完整、準確的主數據分發給其他業務系統應用。選擇主數據進行治理,可以選擇最為重要的數據,集中精力把有限的資源投入到需要的地方。


      主數據管理可以參考圖1進行實施:


      主數據管理是個長期性、螺旋性上升的過程,通過實施步驟,不斷進行數據規范化改進與沉淀,實現數據全生命周期建設。


      (1)數據模型和流程設計:根據業務規則,識別由業務產生、控制和使用的數據實體,按照數據實體的聯系,對數據實體進行分析、篩選、聚類、歸并等,建立數據模型,數據模型包括實體(理解為表)、屬性(理解為包含所表示的實體的特征的列)、實體之間的關系和完整性規則,以及所有這些部件的定義,輸出數據ER(實體聯系)模型;梳理數據集成方案,明確數據流向,輸出DFD圖(數據流圖);明確數據生產者,數據生產者、使用者、擁有者與管理者的職責與權限,輸出數據U/C(使用/創建)矩陣。


      (2)元數據實施:元數據(metadata)描述了如何理解數據,作為數據的顯性知識包括了術語、業務規則和限制、字段格式、字段范圍、字段類型、數據的使用方法和權限管理。元數據對數據的管理、數據的使用和數據的質量都非常關鍵。


      (3)數據標準實施:確定數據定義、數據格式以及數據應用標準,制定數據定義規則與數據應用規則,最終確定標準化的代碼標準與規則體系。代碼標準給出了其他數據相應字段需要參照的內容,例如學科代碼、課程代碼等。


      (4)實體表、業務表實施:實體表包含了高校數據的主要實體信息;業務表描述實體發生的業務活動。兩者都是復合表,涵蓋了實體和業務的所有信息,需要關聯到其他的代碼表、對象表和關系表等。對于表中的每一個字段,我們需要明確數據的限制和數據類型。


      (5)數據集成實施:通過數據集成轉換工具,依據集成方案進行數據集成實施,需要完成數據集成到主數據庫,主數據庫提供數據共享給需要的業務系統,在實施過程中需要保障安全權限。


      四、數據質量評估

      數據質量的提升是數據治理的最終目標,因此需要建立相應的評估模型來對數據治理結果進行評估。這里我們可以參考數據質量評估框架DQAF(Data Quality Assessment Framework),該框架是國際貨幣基金組織(IMF)以聯合國政府統計基本原則為根本構建的數據質量評估框架體系,從數據質量的完備性、及時性、有效性、一致性和完整性五個維度來進行數據質量評估和提升。



      完備性:數據提供內容需要是完整和充分的??梢詮臄祿膶挾群蜕疃葍蓚€方面度量,即包含所有需求希望的屬性字段(寬度)和需求希望的數據量(深度)??梢酝ㄟ^檢測治理的數據匯總數據與控制記錄提供的匯總數據進行比較。


      及時性:從時間維度度量數據從更新到被主數據管理的滿足程度??梢杂脭祿谄湓搭^被更新到能夠提供給主數據進行管理的時間差進行度量。


      有效性:是數據對數據標準、數據模型、業務規則、元數據和參考數據等符合程度。例如,對輸入數據的值與某個數據標準的有效值進行比較。


      完整性:用于度量哪些數據是缺失的或者哪些數據不可用,例如超出閾值。該維度體現了對基本數據的質量測量??梢酝ㄟ^校驗規則來保證數據完整性。


      一致性:用于度量哪些數據的值在信息含義上是沖突的,是對各種不同的數據庫、應用和系統中所存儲或使用的信息等價程度的測量。例如某些考評結果,有的是優、良、差;有的是甲、乙、丙,這就造成了數據度量不一致。因此滿足一致性是進行數據集成的基礎。


      在主數據管理過程中可以在四個階段進行數據質量評估,包括源數據評估、集成過程評估、集成結果評估和定期測量評估。圖2給出了每個階段的評估內容??梢苑謩e從數據、字段、數據集和跨表數據等進行各個維度的評估。

      五、結論

      數據將成為高校的寶貴資產,它具有真正的、可衡量的價值。在高校信息化建設的過程中,通過開展高校數據治理以提高數據質量,可以有效提高數據價值,為組織決策的制定提供幫助。同時,通過對高校信息化建設中數據治理的研究,可以認清在高校信息化中存在的問題,有效促進我國高校信息化的建設。




      ?來源:《中國教育信息化》雜志

      精華教育十八年來致力教育信息化服務,已為國內數百所各類院校提供了系統、專業的教育信息化服務。聯系電話:0371-56178600

      AV一本大道香蕉大在线

      <address id="nzfpj"></address>
      <noframes id="nzfpj">

        <form id="nzfpj"><th id="nzfpj"><progress id="nzfpj"></progress></th></form><noframes id="nzfpj"><address id="nzfpj"></address>