變權(quán)組合模型在景觀水體水質(zhì)模擬中的應(yīng)用
中國污水處理工程網(wǎng) 時(shí)間:2015-10-21 8:29:47
污水處理技術(shù) | 匯聚全球環(huán)保力量,降低企業(yè)治污成本
景觀水體大多數(shù)都是靜止或者流動性較差的緩流水體,自凈能力差,易出現(xiàn)水體的污染和富營養(yǎng)化[1]。景觀水體的水質(zhì)模擬與預(yù)測能為水質(zhì)評價(jià)、水體富營養(yǎng)化與污染的控制以及水環(huán)境管理規(guī)劃等提供科學(xué)的依據(jù)[2]。
在水質(zhì)模型中,存在著兩種學(xué)習(xí)型模型:人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)模型。然而,這兩種模型都存在著一定的局限性和缺點(diǎn),如基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化的人工神經(jīng)網(wǎng)絡(luò)是一種在應(yīng)用和試驗(yàn)中建立的啟發(fā)式方法,可能出現(xiàn)局部最優(yōu)[3]。而基于結(jié)構(gòu)風(fēng)險(xiǎn)最優(yōu)化的支持向量機(jī)方法在處理大規(guī)模的樣本時(shí),往往需要求解復(fù)雜的二次規(guī)劃問題,計(jì)算復(fù)雜[4]。
組合預(yù)測是由Bates等[5]于1969年提出的一種預(yù)測方法,該方法在充分利用各個(gè)單一預(yù)測模型優(yōu)點(diǎn)的基礎(chǔ)上,能克服單一模型的局限性和缺點(diǎn),并最高效率地利用與挖掘數(shù)據(jù)信息,因而被廣泛地應(yīng)用于水環(huán)境領(lǐng)域[6-9]。然而,實(shí)際情況往往是各單一模型是時(shí)間等一系列自變量的函數(shù),在不同時(shí)刻模型變化也不相同,所以固定權(quán)重的分配方式自然無法體現(xiàn)這種關(guān)系。而變權(quán)重組合預(yù)測模型,提出權(quán)重隨時(shí)間等一系列自變量而變化的思想,避免固定權(quán)重的弊端[10]。所以,本文采用基于神經(jīng)網(wǎng)絡(luò)與支持向量機(jī)2種模型,建立權(quán)重隨時(shí)間等一系列自變量而變化的變權(quán)組合模型,來應(yīng)用于景觀水質(zhì)的水質(zhì)模擬與預(yù)測。
1 變權(quán)組合模型
1.1 神經(jīng)網(wǎng)絡(luò)模型神經(jīng)網(wǎng)絡(luò)(artificialneuralnetworks)是由大量的人工神經(jīng)元廣泛地連接而成,用以模仿人腦神經(jīng)網(wǎng)絡(luò)的復(fù)雜網(wǎng)絡(luò)系統(tǒng)。BP(back-propagation)神經(jīng)網(wǎng)絡(luò),即誤差反向傳遞的神經(jīng)網(wǎng)絡(luò),是將輸出誤差以某種形式通過隱含層向輸入層逐層反傳,并將誤差分?jǐn)偨o各層的所有單元,從而獲得各層單元的誤差信號,此誤差信號即作為修正各單元權(quán)值的依據(jù)。權(quán)值經(jīng)過不斷的修正,最終得到可以滿足要求的BP神經(jīng)網(wǎng)絡(luò)模型[11]。
1.2 支持向量機(jī)模型支持向量機(jī)(supportvectormachine)是一類新型的機(jī)器語言,它具有完備的統(tǒng)計(jì)學(xué)習(xí)理論和出色的學(xué)習(xí)性能,能根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以求獲得最好的推廣能力[12]。對于非線性問題,支持向量機(jī)的基本思想是通過一個(gè)非線性映射將數(shù)據(jù)映射到高維特征空間,并在這個(gè)空間進(jìn)行線性回歸[13]。
1.3 變權(quán)組合模型變權(quán)組合模型,其核心就是確定各個(gè)模型在各個(gè)時(shí)刻所占的權(quán)重,從而使模型更好地符合實(shí)際情況。對于m個(gè)單一預(yù)測模型得到的預(yù)測值f1,f2,…,fm,不妨假設(shè)每一個(gè)自變量對應(yīng)一個(gè)相應(yīng)的時(shí)刻,則其變權(quán)組合預(yù)測模型為:f(t) =Σmi=1gi(t)fi(t) (1)式中:t=1,2,…,n;i=1,2,…,m;fi(t)為第i個(gè)模型在t時(shí)刻的預(yù)測值;gi(t)為第i個(gè)模型在t時(shí)刻的權(quán)重,其滿足:1=Σmi=1gi(t) (2)假設(shè)gi(t)為t的連續(xù)函數(shù),則gi(t)可以用p次多項(xiàng)式來表示:gi(t) =gi0·t0 +gi1·t1 +gi2·t2 +… +gip·tp(3)則:f(t) =Σmi=1gi(t)fi(t) =[f1(t),f2(t),…,fm(t)]g10 g11 … g1pg20 g21 … g2p… … … …gn0 gn1 … géêêêêëùúúúúûnpt0t1…téêêêêëùúúúúûn=Δ F(t)GT(t) (4)一旦gi(t)多項(xiàng)式的次數(shù)p確定,就可以通過廣義逆矩陣的循環(huán)迭代法[10]來求解系數(shù)矩陣G,并確定最終的變權(quán)組合預(yù)測模型。同時(shí),從系數(shù)矩陣G的求解過程中可以發(fā)現(xiàn),變權(quán)重組合預(yù)測方法其實(shí)就是根據(jù)m個(gè)單一預(yù)測模型在前n個(gè)時(shí)刻的預(yù)測值來確定某個(gè)時(shí)刻(某個(gè)自變量)的權(quán)重值,從而得到變權(quán)組合預(yù)測模型的預(yù)測值。
2 實(shí)例分析
2.1 基本資料本文選取天津市某園區(qū)的景觀水體作為研究對象,該景觀水體的水面面積約為29000m2,平均深度為3.6m,總?cè)莘e約為10500m3,屬于典型的城市封閉緩流水體。水質(zhì)監(jiān)測點(diǎn)位于水體主體水域地帶,監(jiān)測時(shí)間從2012年7月到2013年11月,共監(jiān)測數(shù)據(jù)樣本為35個(gè),監(jiān)測指標(biāo)包括水溫、pH值、氨氮、總氮、總磷和化學(xué)需氧量(COD)等水質(zhì)指標(biāo)。
COD作為一種表征水體有機(jī)物含量大小的重要指標(biāo),在一定程度上可以表示景觀水體的水質(zhì)狀況和水體的污染情況。因此,本文建立COD與時(shí)間、水溫、pH值、氨氮、總氮和總磷之間變化關(guān)系的水質(zhì)模型,通過COD的變化來了解當(dāng)前景觀水體水質(zhì)狀況,并為水質(zhì)的預(yù)測預(yù)警作出科學(xué)的判斷與分析。
2.2 BP神經(jīng)網(wǎng)絡(luò)模型本文利用該景觀水體從2012年7月到2013年11月的監(jiān)測數(shù)據(jù),建立BP神經(jīng)網(wǎng)絡(luò)水質(zhì)模型。由于各個(gè)水質(zhì)監(jiān)測指標(biāo)值的量綱及數(shù)量級不同,在BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練前要先對原始水質(zhì)數(shù)據(jù)進(jìn)行歸一化處理[14],使得各個(gè)指標(biāo)值落在[0,1]之間。對于歸一化方程,輸入時(shí)間t,是以2012年7月28號為第1天,以后各個(gè)監(jiān)測時(shí)期的時(shí)間為實(shí)際監(jiān)測日期與7月28號的時(shí)間距離,單位為天。然后再將輸入時(shí)間、水溫、pH值、氨氮、總氮、總磷和COD值采用歸一化公式(5)進(jìn)行處理,公式如下:Xi = xi-xmin xmax -xmin(5)式中:xmin為原始監(jiān)測值的最小值;xmax為原始監(jiān)測值的最大值;xi為第i個(gè)原始監(jiān)測值;Xi為歸一化處理之后的第i個(gè)監(jiān)測值;
對于建立的BP神經(jīng)網(wǎng)絡(luò)模型,輸入量包括時(shí)間、水溫、pH值、氨氮、總氮和總磷,輸出量為COD,隱含層的神經(jīng)元采用Sigmoid型變換函數(shù),輸出層則采用線性變換函數(shù)。而對于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中的各個(gè)參數(shù)確定則利用學(xué)習(xí)時(shí)間較短、精度與收斂性較好的L-__M算法,隱含層的節(jié)點(diǎn)數(shù)[15]則根據(jù)公式(6)確定:Ny =(Ns +Nj)0.5 +N (6)式中:Ny 為隱含層的節(jié)同時(shí),將景觀水體水質(zhì)監(jiān)測樣本的數(shù)據(jù)分為訓(xùn)練集、檢驗(yàn)集兩個(gè)部分。用訓(xùn)練集來訓(xùn)練與擬合BP神經(jīng)網(wǎng)絡(luò),用檢驗(yàn)集來對模型的預(yù)測結(jié)果進(jìn)行檢驗(yàn)。本模型中將前3/4的歸一化的數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集,用后1/4的實(shí)際監(jiān)測值作為BP神經(jīng)網(wǎng)絡(luò)模型的檢驗(yàn)集。利用MATLAB中的BP神經(jīng)網(wǎng)絡(luò)工具箱,取訓(xùn)練的最大循環(huán)次數(shù)epochs=10000,性能函數(shù)goal=0,最大驗(yàn)證數(shù)據(jù)失敗的次數(shù)max_fail=20,最小的性能梯度值mingrad=0.00001。進(jìn)行不斷地調(diào)試,發(fā)現(xiàn)在N=2,即隱含層的節(jié)點(diǎn)數(shù)Ny為4時(shí),模型收斂性最好。模型結(jié)果與實(shí)際監(jiān)測值的比較如圖1所示。具體參見http://szhmdq.com更多相關(guān)技術(shù)文檔。