基于CombBLAS圖聚類并行算法
大?。?/span>0.47 MB 人氣: 2017-11-22 需要積分:0
圖聚類是指把圖中相對連接緊密的頂點及其相關(guān)的邊分組形成一個子圖的過程,在包括機器學(xué)習(xí)、數(shù)據(jù)挖掘、模式識別、圖像分析及生物信息等領(lǐng)域有著廣泛應(yīng)用。但是,隨著大數(shù)據(jù)時代的到來,圖數(shù)據(jù)海量增長。面對廣泛的大規(guī)模圖計算需求,由于圖結(jié)構(gòu)本身的不規(guī)則性,單機算法運行效率低下,用傳統(tǒng)的并行計算方法進行圖計算難以獲得高性能。使用線性代數(shù)的方法在Combinatorial BLAS上實現(xiàn)了同輩壓力(Peer Pressure)圖聚類的分布式算法,首先將該圖聚類的算法轉(zhuǎn)換為對稀疏矩陣的運算,從而結(jié)構(gòu)化表示圖的不規(guī)則數(shù)據(jù)結(jié)構(gòu)及接入模式,然后基于MPI編程模型將其并行實現(xiàn)。實驗結(jié)果表明,在并行處理規(guī)模達到43億的由稀疏矩陣表示的超大規(guī)模圖時,基于線性代數(shù)表示的同輩壓力圖聚類算法在曙光超級計算機上取得了較高的并行性能及良好的可擴展性,在64個核上獲得了40.1的并行加速。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%