基于數據挖掘的管道高后果區智能識別分析系統
來(lái)源:《管道保護》雜志 作者:肖麗;錢(qián)濟人;范文峰;李園 時(shí)間:2019-11-26 閱讀:
肖麗 錢(qián)濟人 范文峰 李園
浙江浙能天然氣運行有限公司
摘 要:隨著(zhù)管網(wǎng)和城市化的快速發(fā)展,天然氣管道穿越人口密集區的情況日益突出,沿線(xiàn)各級政府要求管道企業(yè)全面開(kāi)展人員密集型高后果區識別和風(fēng)險評價(jià)工作。傳統的人工識別方法存在數據采集困難、準確度不高、效率低等缺點(diǎn),無(wú)法滿(mǎn)足企業(yè)實(shí)際需求。浙江浙能天然氣運行有限公司充分利用現有的遙感影像(DOM)和線(xiàn)劃圖(DLG),采用數據挖掘方法實(shí)現了高后果區的有效識別。
關(guān)鍵詞:高后果區識別;建筑數據矢量化; DBSCAN聚類(lèi)算法
浙江省經(jīng)濟發(fā)達,土地資源緊張,天然氣管道周?chē)丝诿芗,形成了大量高后果區,一旦發(fā)生泄漏爆炸事故,將會(huì )給人民生命和財產(chǎn)帶來(lái)巨大損失。
輸氣管道高后果區分級的前提是統計管道中心線(xiàn)兩側至少200米范圍內的所有建筑數據,傳統人工現場(chǎng)識別方法識別時(shí)間長(cháng)、成本高、質(zhì)量低,耗費大量人力、物力、財力,已無(wú)法與企業(yè)提質(zhì)增效的目標相適應,如何準確高效識別管道高后果區成為必須思考與解決的問(wèn)題。
基于數據挖掘的天然氣管道高后果區識別系統(以下簡(jiǎn)稱(chēng)識別系統)依托于智慧油氣管網(wǎng)建設,通過(guò)將天然氣管道與大數據分析相結合,采取建筑數據矢量化的創(chuàng )新方式進(jìn)行數據采集,基于密度的DBSCAN聚類(lèi)算法高效智能準確地完成高后果區識別工作,實(shí)現天然氣管道管理信息化、數字化,取得了很好的效果。
1 數據采集
1.1 數據庫搭建
數據庫以開(kāi)源PostgreSQL數據庫為核心,通過(guò)擴展PostGIS組件,建立PostgreSQL數據庫到ArcGIS通道,實(shí)現空間地理數據存儲與管理;通過(guò)擴展TimescaleDB組件,建立PostgreSQL數據庫關(guān)聯(lián),實(shí)現時(shí)間序列數據存儲和管理;通過(guò)擴展MinIO組件,建立對象數據與PostgreSQL數據庫的關(guān)聯(lián),實(shí)現照片、文檔等數據存儲與管理。從而實(shí)現了一專(zhuān)多能的時(shí)空全棧數據庫,滿(mǎn)足數據挖掘所需的各種類(lèi)型數據存儲和檢索全息信息。
1.2 數據分層
識別系統所依賴(lài)的第一層(最底層)數據是正射遙感影像(DOM),該數據來(lái)源于最新衛星遙感和航測影像數據,直觀(guān)反映了管道周邊的環(huán)境,但其僅為影像數據,無(wú)法直接用于高后果區的識別。第二層數據為數字線(xiàn)劃圖(DLG),將影像數據中的建筑 轉換為矢量,將建筑標記后作為一個(gè)多邊形保存在空間數據庫里。第三層數據為建筑屬性數據,如建筑類(lèi)型、聯(lián)系人及電話(huà)等。
1.3 數據處理
首先通過(guò)歸納分析,對空間數據庫的數據預處理。
(1)針對管道周?chē)罅哭r村住宅,其線(xiàn)劃圖長(cháng)寬比有一定的范圍,高度一般不超過(guò)4層,利用激光雷達點(diǎn)云數據獲得的建筑物頂層高度,就可以將農村住宅分類(lèi),農村住宅定義為一幢一戶(hù)。
(2)小區住宅,歸納小區住宅的長(cháng)寬比,考慮線(xiàn)劃圖的面積和住宅小區每戶(hù)面積在70~130平方米,建立數學(xué)模型可推導每層戶(hù)數。小區住宅一般高度均超過(guò)7層,利用線(xiàn)劃圖高度屬性,可推導出層數,由此可計算出一幢住宅的住戶(hù)數。
(3)工廠(chǎng)、商場(chǎng)等特定場(chǎng)所和住宅形狀、長(cháng)寬比、高度均有差異,通過(guò)計算,將工廠(chǎng)商場(chǎng)等特定場(chǎng)所分類(lèi)標注。
(4)由于線(xiàn)劃圖均有精確的GPS坐標,通過(guò)與百度、 BIGMAP等地圖數據的位置匹配,能夠取得特定場(chǎng)所的屬性,如單位名稱(chēng)、聯(lián)系人及電話(huà)、詳細地址等信息。建筑標注綠色為農民住宅,藍色為小區住宅,黃色為一般特定場(chǎng)所,紅色為易燃易爆場(chǎng)所。
1.4 數據完善
針對PC端無(wú)法確認的部分建筑數據,利用手機端高后果區采集APP核實(shí)現場(chǎng)數據,可直接導航至該建筑位置,大大節省了現場(chǎng)數據采集時(shí)間。
對存儲在數據庫中的管道兩側200米的所有建筑數據自動(dòng)預處理并現場(chǎng)核實(shí)完善后,不僅可快速確定各類(lèi)住宅所包含的戶(hù)數,而且對特定場(chǎng)所進(jìn)行標注。建筑數據的矢量化為高后果區智能識別分析打好基礎(圖 1)。
2 智能識別
2.1 識別準則量化
依據GB 32167―2015《油氣輸送管道完整性管理規范》,結合公司管道周邊建筑實(shí)際分布情況,公司量化了管道高后果區識別準則。
(1)Ⅲ級高后果區:四級地區,某地區連續出現10幢4層及以上建筑(不包括農村住宅,一般指小區住宅)。
(2)Ⅱ級高后果區分為以下三種情況:
①三級地區,戶(hù)數100戶(hù)以上。
②連續有10個(gè)工廠(chǎng),兩個(gè)工廠(chǎng)之間間隔不超過(guò)30米。
③其他存在易燃易爆場(chǎng)所的地區。
(3)Ⅰ級高后果區:其他存在特定場(chǎng)所的地區,如學(xué)校、幼兒園、醫院等。
2.2 核心算法
2.2.1 算法原理
完成數據預處理后,這些建筑可以看成是一個(gè)帶有戶(hù)數屬性的點(diǎn)。這些點(diǎn)在管道周?chē)姆植紱](méi)有特定形狀,形成一定的散布,沿管線(xiàn)計算確定建筑(戶(hù)數)密集區域即可實(shí)現高后果區分級。
常用的聚類(lèi)算法有k-means算法,試用后發(fā)現k-means算法基于平均距離決定同類(lèi)聚集,適用于球形聚集,不適合民房空間分布。通過(guò)比較研究,選擇了具有噪聲的基于密度的DBSCAN(Density-BasedSpatial Clustering of Applications with Noise)聚類(lèi)算法,該算法是以密度、而不是距離來(lái)計算簇和簇邊界。其基本思路(圖 2)是以建筑密集區域的某一建筑為圓心,選擇合適半徑畫(huà)圓,即規定了圓的半徑及圓內最少包含的建筑密度。若圓內建筑密度大于等于預先指定的值,那么這個(gè)圓圈的圓心就轉移至該圓圈內的其他建筑,繼續畫(huà)圓去計算,直至圓內所包含的建筑密度少于預先指定的值,聚類(lèi)終止;诿芏鹊腄BSCAN聚類(lèi)算法適用于在管線(xiàn)周?chē)ㄖ植紖^域中,去尋找高密度分布的區域,并與建筑分布形狀無(wú)關(guān)。
2.2.2 算法應用
根據量化后的管道高后果區識別準則,將基于密度的DBSCAN聚類(lèi)算法應用到高后果區識別中。以管線(xiàn)為基本單位,首先調用空間數據庫中的小區住宅, 半徑設置成100米,數量設置為10,計算出小區住宅簇的區域,滿(mǎn)足識別標準時(shí)將該區域劃分為Ⅲ級高后果區。
去除小區住宅簇后,調用空間數據庫中標有工廠(chǎng)、商業(yè)建筑等建筑,半徑設置成100米,數量設置為10,計算出工廠(chǎng)、商業(yè)建筑簇的區域,滿(mǎn)足識別標準時(shí)將該區域劃分為Ⅱ級高后果區。
去除以上兩個(gè)簇后,調用空間數據庫中標有農村住宅的建筑,半徑設置為50米,數量為100,計算出民居簇的區域,滿(mǎn)足識別標準時(shí)將該區域劃分為Ⅱ級高后果區。
去除以上三個(gè)簇后,根據數據預處理后特定場(chǎng)所標注的屬性,易燃易爆場(chǎng)所劃為Ⅱ級高后果區,其他場(chǎng)所劃為Ⅰ級高后果區。
3 自動(dòng)統計分析
識別系統對1 766公里(經(jīng)統計管道周邊建筑8萬(wàn)多個(gè))天然氣管網(wǎng)進(jìn)行了高后果區自動(dòng)識別;趶秃蠄D文一體化智能報告生成技術(shù),按報告模板自動(dòng)統計分析數據并以圖表格式展示(圖 3), 1小時(shí)內即可出具全省共55份報告。
4 功能實(shí)現
基于數據挖掘的管道高后果區智能識別系統的開(kāi)發(fā)應用成功,一是實(shí)現了管道高后果區的精準識別,達到管道高后果區的數據化、可視化管理目標,為政府及管道企業(yè)管理提供有力依據。二是有效降本提質(zhì)增效,滿(mǎn)足企業(yè)越來(lái)越高的精細化及經(jīng)營(yíng)管理的要求。三是可與其他管道保護業(yè)務(wù)系統關(guān)聯(lián)(如與應急管理系統關(guān)聯(lián)),實(shí)現數據共享,進(jìn)一步加強管道安全運行管理。四是實(shí)現了基于管道高后果區的大數據管理與維護,從數據采集、數據展示、數據應用到數據更新,實(shí)現數據的高效采集、直觀(guān)展示、統計分析及更新的全過(guò)程管理,增強數據的實(shí)用性(圖 4)。
5 結論
管道高后果區智能識別系統識別質(zhì)量高,高后果區等級劃分均有數據可追溯,并有多種統計維度,如按照全省各地市行政區劃統計、公司管道管理單元統計、識別時(shí)間統計、高后果區及其變化情況統計等,取得了手工識別無(wú)法做到的識別結果,奠定了管道完整性管理基礎,也夯實(shí)了應急預案落地基點(diǎn),將有效提高管道風(fēng)險消減效果。
作者:肖麗,女, 1992年生,助理工程師, 2015年畢業(yè)于中國石油大學(xué)(華東)油氣儲運專(zhuān)業(yè),現主要從事管道保護工作。錢(qián)濟人, 1963年生,高級工程師,科創(chuàng )中心主任,現主要從事管道先進(jìn)科技技術(shù)研究工作。
上篇:
下篇: