CNCC 2020 國雙:以業務場景爲驅動,實現數據、業務治理迭代閉環
(原標題:CNCC 2020 國雙:以業務場景爲驅動,實現數據、業務治理迭代閉環)
10月22-24日,計算領域年度盛會——2020中國計算機大會(CNCC2020)在北京舉行。國雙董事長兼CEO祁國晟受邀參與,作《以業務場景爲驅動的數據治理——實現企業數字化、智能化轉型的必經之路》主題報告,與圖靈獎獲得者、兩院院士、國內外頂尖學者共同展望大數據、人工智能前沿趨勢,分享國雙技術創新成果。
國雙認爲:高效地獲取、集成、治理、管理及運用“數據”和行業“知識”是大數據與人工智能技術在企業、政府組織的數字化、智能化轉型中實現場景化落地的先決條件。新型數據治理需要在“場景”的驅動下,形成“數據”和“知識”的雙輪驅動,實現數據治理、業務治理的迭代閉環。
圖:國雙董事長兼CEO祁國晟
傳統數據治理中,人們常常從“數據”出發,將多源異構的不標準、不一致、不完整、不及時的數據通過質量管理、生命週期管理、元數據管理等過程進行治理,並沒有很好的場景化落地,應用效果也欠佳。在新型的數據治理中,我們可以從企業生產、經營、銷售,政府的管理等實際業務應用場景出發,將業務中的“知識”沉澱下來、數字化之後,形成數據圖譜、資產圖譜、業務圖譜、流程圖譜、指標圖譜等融入到數據治理中,形成“數據”和“知識”對業務的雙輪驅動。
圖:國雙數據治理的雙輪驅動
作爲非常重要的一層,“知識”一方面將“業務”與“數據”關聯起來,讓機器知道什麼業務場景需要什麼數據,這些數據必須達到怎樣的標準和質量,進而幫助數據治理;另一方面,通過數據治理所形成的業務發現,或者是數據治理本身的方法、其他產出,又會沉澱成新的“知識”,在數字化轉型中釋放價值。
圖:知識在數據治理中的作用
會議當天,祁國晟先生還結合國雙實際案例,介紹了國雙新型數據治理在司法、油氣、審計領域的應用:
司法:誰是好法官?
法院有立案、審判、訴訟管理、執行管理等諸多IT系統。除了當事人信息、標的、法官信息等基本信息之外,系統中還包含受理案件數、審結案件數等統計。基於現有數據,法院考覈法官時,常常會用到結案時間,也就是一個法官在一段時間內辦理了多少案件作爲績效的重要依據。而在實際辦案中,一些複雜案件常常會分配給資深法官,1個案件耗時6個月辦結是常態。一些簡單案件則會分配給新手,一位剛入職的法官就可以辦理民間借貸案件,一個3人審判團隊月結案50-60並非難事。這樣一來,資深法官因爲辦理複雜案件,用時長、績效低,年輕法官則因爲辦理簡單案件,用時短、績效高。
影響案件審理時長的因素非常多,比如,應當出庭的當事人或證人正當理由未能到庭(疫情、疾病、地質災害、政治封鎖…)、當事人要求對特定財產進行評估等等,對每一個案件分類非常複雜。爲了解決這一問題,國雙通過文本解析技術,將起訴書、答辯書、裁判文書等文本中的要素要點進行提取,構建知識體系和知識圖譜,將這些要素作爲字段補入到原有數據中,並將不同的數據進行融合。在此基礎上,通過搭建類案模型,系統可以自動對案件進行分類,案件難易程度被引入到原有的評估體系中。
好的考評體系可以提升辦案效率。在以知識和數據雙輪驅動建立考評體系的過程中,,國雙還爲法院研發了司法文書自動撰寫、類案同案智能推送等多種辦案輔助工具,進一步提升法官的辦案效率。
石油勘探開發是一個知識密集型行業,很多寶貴數據卻因爲沒有治理好而沉睡在數據庫中,沒有完全發揮其價值。現有勘探開發數據,部分在數據產生過程出現問題,比如命名規則不統一,將同一業務對象命名成不同的形式,無法進行有效油藏類比;部分是在數據治理過程出現問題,比如誤刪除,數據缺失;還有一些存在業務邏輯矛盾,需要業務人員才能發現問題,比如孔隙度的計量單位沒有統一,誤將6%輸入成了0.06,系統按照0.06%計算,嚴重低估了油氣儲量,錯失優質採油機會。
爲了解決這些問題,國雙將知識融入數據治理,提升數據質量:依據業務特徵和名稱,我們可以推理幾個不同名稱的小油層實際上是一個油藏;依據業務知識,我們可以推理出對於同一口井的小層產量,如果生產時間連續,那麼可以從業務上判斷生產層位應該相同,數據庫中缺失的層位信息可以與上下行的層位信息保持一致;針對計量單位不統一的情況,可以運用業務知識,設置數據下限,降低計量單位等錄入錯誤。
基於新型數據治理,我們助力油氣行業實現“向數據要構造、要圈閉、要儲量、要產量”的目標,提高油氣從業者的工作效率、降低勘探風險、提高採收率。
審計:新型數據治理下的行業產業之變
傳統審計工作本身就是從數據治理實踐展開:初級審計師花費大量時間進行數據標準統一、表格拆分、表格合併等基礎數據處理工作,形成關鍵信息表後,交給高級審計師;高級審計師結合行業知識與業務經驗給出行動綱領,循環往復。而在新型數據治理中,在審計初期便可以將領域知識融入其中,大幅提升審計師的效率、解放人力,讓初級審計師能擁有更加高階的業務知識,實現審計服務的升級。
在這個過程中:
通過提升審計業務質效,可以賦能審計行業;
通過審計工作提升稅務風險管理能力,可以賦能社會治理。
“數據”與“知識”雙輪驅動的新型數據治理是國雙產業人工智能的又一實踐,也是國雙"把人從經濟社會常規運營的繁瑣工作中解放出來"這一目標的探索成果。未來,國雙將繼續不斷研究和突破關鍵技術與算法,結合場景化落地能力,爲新基建與企業數字化、智能化轉型提供強勁動力。