引用格式:徐睿,劉金,馮志,等. 基于知識圖譜與本體驅動的數(shù)據建模框架[J].網絡安全與數(shù)據治理,2025,44(8):39-45.
引言
數(shù)據建模作為數(shù)據治理的核心任務,通常采用實體-關系模型,通過定義實體、屬性和關系等抽象結構來描述數(shù)據的語義,再映射為具體的數(shù)據庫表、字段及約束,從而實現(xiàn)數(shù)據的存儲與管理。然而,隨著數(shù)據量的迅猛增長以及業(yè)務需求的日益復雜,傳統(tǒng)的關系型數(shù)據建模方法逐漸暴露出諸多局限性。例如,傳統(tǒng)方法依賴于靜態(tài)的表結構和字段定義,難以有效處理多維度、動態(tài)變化的數(shù)據關系,也很難適應異構數(shù)據源的集成需求。隨著大數(shù)據、人工智能和知識圖譜等新興技術的快速發(fā)展,數(shù)據建模的范式也在發(fā)生深刻變化。
在這一背景下,知識圖譜和動態(tài)本體技術可以在數(shù)據治理領域發(fā)揮重要作用。知識圖譜通過圖結構表示實體及其關系,并能夠通過語義推理揭示數(shù)據之間的深層次聯(lián)系。本體則為知識圖譜提供了一個規(guī)范的語義框架,幫助明確各類實體及其屬性的定義及相互關系。知識圖譜和動態(tài)本體的結合,不僅提供了更靈活的建模手段,還能夠促進跨系統(tǒng)的數(shù)據集成,提升數(shù)據的語義理解與質量控制。
這一映射過程不僅是技術創(chuàng)新,也體現(xiàn)了對人類認知與理解世界方式的模擬。認知科學認為人類通過抽象符號、分類和關系表達知識,本體與知識圖譜正是構建這種抽象模型的工具。在智能化趨勢下,知識圖譜作為模擬人類認知的“圖式語言”,幫助機器理解、推理與學習數(shù)據,例如結合圖神經網絡(Graph Neural Network,GNN)進行推理與分析[1]。在網絡安全領域,知識圖譜能夠通過路徑推理識別攻擊者的潛在利用路徑(如漏洞→系統(tǒng)→攻擊者),或通過關系映射發(fā)現(xiàn)未修復漏洞的關聯(lián)防御措施。
在此基礎上,考慮到當前大部分業(yè)務系統(tǒng)的數(shù)據仍主要存儲于結構化數(shù)據庫中,而知識圖譜直接應用于業(yè)務系統(tǒng)的落地尚存在較大挑戰(zhàn),因此本文提出一種基于知識圖譜和本體驅動的數(shù)據建模框架。通過將知識圖譜中的實體、屬性和關系有效映射到數(shù)據庫表結構,實現(xiàn)從語義建模到結構化數(shù)據存儲的高效轉化;并結合威脅情報自動抽取、跨系統(tǒng)數(shù)據融合等業(yè)務應用場景驗證框架能力。
本文詳細內容請下載:
http://m.ihrv.cn/resource/share/2000006649
作者信息:
徐睿1,2,劉金1,2,馮志1,2,張雅勤1,2,董偉1,2
(1.中國信息安全研究院有限公司, 北京102209;
2.華北計算機系統(tǒng)工程研究所, 北京100083)