條件約束的數(shù)據(jù)修復(fù)方法
隨著經(jīng)濟與信息技術(shù)的發(fā)展,在許多應(yīng)用中均產(chǎn)生大量數(shù)據(jù),然而,受硬件設(shè)備、人工操作、多源數(shù)據(jù)集成等諸多因素的影響,在這些應(yīng)用之中往往存在較為嚴重的數(shù)據(jù)質(zhì)量問題,特別是不一致性問題,從而無法有效管理數(shù)據(jù).因此,首要的任務(wù)就是開發(fā)新型數(shù)據(jù)清洗技術(shù)來提升數(shù)據(jù)質(zhì)量,以支持后續(xù)的數(shù)據(jù)管理與分析,現(xiàn)有工作主要研究基于函數(shù)依賴的數(shù)據(jù)修復(fù)技術(shù),即以函數(shù)依賴來描述數(shù)據(jù)一致性約束,通過變更數(shù)據(jù)庫中部分元組的屬性值(而非增加/刪除元組1來使得整個數(shù)據(jù)庫遵循函數(shù)依賴集合,從一致性約束描述的角度來看,函數(shù)依賴并非是唯一的表達方式,還存在其他表達方式,例如硬約束、數(shù)量約束、等值約束、非等值約束等.然而,隨著一致性約束種類的增加,其處理難度也遠比僅有函數(shù)依賴的場景要困難.考慮以函數(shù)依賴與其他一致性約束共同表述數(shù)據(jù)庫的一致性約束,并在此基礎(chǔ)上設(shè)計數(shù)據(jù)修復(fù)算法,從而提升數(shù)據(jù)質(zhì)量.實驗結(jié)果表明,所提方法的執(zhí)行效率較高.
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%