期刊VIP學術指導 符合學術規范和道德
保障品質 保證專業,沒有后顧之憂
統計建模論文范文一:
地震動是非常復雜且具有很強隨機性的隨機過程,其主要特性可以由幅值、持時和頻譜三個基本要素來描述[1?2]。其中,地震動的頻譜特性是指地震動對不同自振周期的結構反應特性的影響,在工程抗震中通常用傅里葉譜和功率譜來表示。地震動功率譜用來表征地震動的能量在各頻段內分布的相對關系,可以進一步清晰地描述地面運動能量的頻域分布規律,是地震動模型的重要組成部分[3?5]。對于功率譜模型的研究,最早是Housner[2]在1947年提出的平穩白噪聲功率譜模型,后來Kanai[6]將平穩白噪聲過程經過一個阻尼比和圓頻率分別為ξg和ωg的單自由度體系過濾后得到絕對加速度的功率譜,但是Kanai?Tajimi譜嚴重高估了地震動的低頻含量。作為地震學和地震工程學的重要內容之一,對功率譜模型的研究在過去的幾十年內取得了令人矚目的進展,多種改進模型被提出,如:C?P譜[7]、胡聿賢?周錫元譜[8]、歐進萍譜[9]、杜修力譜[10]和洪峰譜[11]等,這些功率譜模型基本上都是對Kanai?Tajimi譜的修正。
在隨機地震反應分析中,一般采用功率譜密度函數表征地震地面運動,目前最大的難點就是地震動功率譜模型及其參數的確定。所采用的功率譜模型是否合理,參數是否準確,這將直接決定分析結果的可信度。在各類功率譜模型中,Clough等[7]提出的C?P譜利用了兩個線性濾波器,可以過濾掉超低頻率處的激勵,從而改善了Kanai?Tajimi譜不能反映基巖地震動的頻譜特征以及過分夸大低頻能量的缺點,具有明確的物理意義。但是,由于C?P譜的參數較多且物理關系較為復雜,這在一定程度上限制了該模型的工程應用。因此,研究C?P譜模型的參數識別方法及參數統計規律,對該模型在工程抗震中的廣泛應用具有重要意義。
對于C?P譜模型參數識別的研究,田利等[12?13]根據《電力設施抗震設計規范》(GB 50260—2013),采用普通最小二乘(Ordinary Least Square,OLS)算法對模型參數的取值進行了分析。柳國環等[14]、彭凌云等[15]均采用OLS算法對功率譜模型參數進行識別。但是,OLS算法對模型參數初始值的選取以及原始功率譜曲線的非線性要求高,這顯然給大數據批處理統計分析制造了巨大的困難。為更加準確地保留原始功率譜的特性,尋求一種廣泛適應性和快速收斂性的智能優化識別算法尤為重要。隨著計算機技術的快速發展,越來越多的智能優化算法被應用于復雜的計算中,如遺傳算法(GA)、蟻群算法(ACA)、粒子群優化算法(PSO)等,其中PSO算法具有群體智能、內在并行性、迭代格式簡單、可以快速收斂到最優解所在區域等優點,被廣泛應用于函數優化、神經網絡訓練和模糊控制系統等領域。
在地震工程中進行結構動力時程分析時,需要選擇合適的地震記錄。《建筑抗震設計規范》(GB 50011—2010)[16]規定:采用時程分析法時,應按建筑場地類別和設計地震分組選用實際強震記錄和人工模擬的加速度時程曲線,其中實際強震記錄的數量不應小于總數的2/3。與真實地震記錄相比,人工合成地震動能更有代表性地反映地震動的統計特征,并滿足結構抗震設計需求,因此研究科學合理且高精度的人工地震動合成方法具有重要意義。
為解決上述問題,本文采用自適應加權粒子群優化(AWPSO)算法,對Clough?Penzien譜模型的參數進行識別,然后從地震動數據庫中挑選4159條地震記錄并按照《建筑抗震設計規范》(GB 50011—2010)中的場地分類標準將其分組,采用AWPSO算法對C?P譜模型進行參數識別,并依據K?S檢驗、A?D檢驗及AIC準則和BIC準則確定參數的最優概率分布模型。依據各參數間的相關性,建立Clough?Penzien譜模型參數的聯合概率密度函數。以Ⅱ類場地為例,對比分析規范場地轉化功率譜與統計抽樣功率譜的譜型差異,利用功率譜迭代修正的人工地震動合成方法,生成具有場地特性的地震記錄,為地震危險性、易損性和風險評估以及工程結構抗震設計和評估等提供可靠的地震動輸入。
1 Clough?Penzien功率譜模型參數及識別方法
1.1 Clough?Penzien功率譜模型及參數
Kanai?Tajimi譜假定基巖地震加速度為白噪聲,不能反映基巖地震動的頻譜特征,且存在夸大地震動低頻含量、不能求出地震地面位移、速度以及加速度的有限方差等缺點。Clough等[7]提出的C?P譜模型,其優點是利用兩個線性濾波器,過濾掉超低頻率處的激勵,改善了Kanai?Tajimi模型[6]過分夸大低頻能量的情況,從而得到修正的模型如下:
S(ω)=ω4g+4ξ2gω2gω2(ω2g?ω2)2+4ξ2gω2gω2? ω4(ω2f?ω2)2+4ξ2fω2fω2?S0
(1)
式中 ωg和ξg分別為場地的卓越圓頻率和阻尼比;ωf和ξf分別為第二過濾層的卓越圓頻率和阻尼比;ω
為圓頻率;S0為譜密度。
C?P譜模型的隨機參數向量θ為:
θ=[ωg ξg ωf ξf S0]
(2)
對于上述5個參數的取值,目前學者們僅僅指出了ωf的取值應該小于ωg,建議ωf的取值范圍為0.1~0.15倍的ωg,ξf可以取與ξg相同的值,并沒有依據真實地震記錄給出場地可供參考的取值范圍。
劉章軍等[17]依據建筑抗震設計規范反應譜,給出了不同場地各參數的建議取值,但對于ωf的取值采用0.1倍的ωg,ξf取與ξg相同的值,一方面由于第二個過濾層的參數設置的固定化,忽視了由于場地的隨機性與復雜性所導致的功率譜模型參數的不確定性;另一方面由于規范反應譜對各類場地的5倍特征周期以上的譜值已經進行了人為的放大,使譜值在不同周期段的概率特性、精度和協調性不一致,進而導致了規范反應譜并不能準確反映真實地震記錄的時頻特性。因此基于真實地震記錄對隨機參數向量θ進行精確識別和統計,給出不同場地各參數的取值范圍,對工程抗震設計和評定具有重要意義。
1.2 基于自適應加權PSO算法的參數識別
洪峰等[11]將Kanai?Tajimi譜模型非線性函數化,然后利用OLS算法確定參數,并給出了軟土、中等土兩類場地的參數識別結果。孔辰等[18]基于日本KiK?net強震數據庫,采用上述方法對杜修力?陳厚群功率譜[10]進行了四類場地的參數識別。在對大量原始地震記錄功率譜進行參數識別時,由于OLS算法對數據的非線性以及擬合參數初始值的設置要求較高,一般預先對原始數據進行平滑化處理,以達到準確的識別結果。鄂國康等[19]利用移動平均算法對原始地震記錄功率譜進行平滑化處理,然后采用OLS算法確定功率譜模型參數。彭凌云等[15]也采用了類似的方法對不同功率譜模型進行參數識別,但移動平均算法有兩大缺陷:一方面,平滑處理后的功率譜譜值與真實譜值之間存在一定的誤差;另一方面,由于沒有考慮結構的自振頻率,無法實現不同頻率區間采用不同窗口大小的功能。
目前研究人員可以利用不同的譜窗以及數字濾波器技術實現對功率譜的平滑化,無論何種方法,都是削峰填谷,使整體變得平滑,產生偏差是在所難免的。原始地震記錄由于受到震源特性、傳播路徑和場地條件的影響,功率譜在頻率上呈現出顯著的多峰性、非平穩性和隨機性的鋸齒狀,平滑處理后僅大致反映地震能量的平緩分布,消除了大量的隨機性特征,保留了頻譜的主體特性。因此,基于預平滑處理后和采用OLS算法進行參數識別的誤差平方和分別可以表示如下:
???????????????????εsmooth=∑i=1n[Sreal(ωi)?Ssmooth(θ,ωi)]2εOLS=∑i=1n[Ssmooth(θ,ωi)?SOLS(θ,ωi)]2εtotal?OLS =εsmooth+εOLS
(3)
式中 Sreal(ω)為原始地震記錄的功率譜函數;Ssmooth(θ,ω)為經過平滑處理后的功率譜函數;SOLS(θ,ω)為OLS算法參數識別后的功率譜函數模型。
OLS算法的目標是尋找一組隨機參數向量θ(ωg ξg ωf ξf S0),使得觀測值與理論值的殘差平方和εtotal?OLS達到最小值。可以看到,采用傳統OLS算法進行參數識別存在兩部分誤差:一個是由平滑化處理引起的誤差平方和εsmooth,另一個是OLS算法參數識別產生的誤差平方和εOLS。由此可見,兩項誤差源必定會導致總誤差偏大,從而影響函數模型參數識別的準確性。
當前,越來越多的智能優化算法被應用于復雜工程問題的求解中,其中PSO算法的應用最為廣泛,它通過設計一種無質量的粒子來模擬鳥群中的鳥,粒子僅具有兩個屬性:速度和位置,速度代表移動的快慢,位置代表移動的方向,粒子分別通過以下兩個公式來更新自己的速度和位置:
νi,d(t+1)=λνi,d(t)+c1r1[pbesti,d(t)?xi,d(t)]+ c2r2[gbesti,d(t)?xi,d(t)]
(4)
xi,d(t+1)=xi,d(t)+νi,d(t+1), i=1,…,d
(5)
式中 νi,d(t)為粒子i在第t次迭代的速度;xi,d(t)為粒子i在第t次迭代中的當前位置;pbesti,d(t)為粒子i的個體極值點的位置;gbesti,d(t)為整個種群的全局極值點的位置;r1,r2為[0,1]之間的隨機數;c1,c2為正的學習因子(加速系數);d為維數;λ為慣性權重系數。
每個粒子在搜索空間中單獨搜尋最優解,并將其記為當前個體極值,并將個體極值與整個粒子群里的其他粒子共享,找到最優的那個個體極值作為整個粒子群的當前全局最優解,粒子群中的所有粒子根據自己找到的當前個體極值和整個粒子群共享的當前全局最優解來調整自己的速度和位置,其中粒子更新的方法如圖1所示。
統計建模論文范文參考二:
相對于震源機制等地震學因素和“震源-傳播途徑-局部場地”的物理模型,工程上更加關注地震動本身的工程特性。演變功率譜模型從地震動的幅值、持時、頻譜等工程特性出發,是地震工程中應用最廣泛的隨機地震動模型。一般來說,演變功率譜模型由強度調制函數和平穩功率譜兩部分組成,強度調制函數對平穩信號進行調幅;平穩功率譜描述局部場地作用在白噪聲過程下的能量分布規律。在確定了演變功率譜模型之后,便可用諧波合成法[1]模擬地震動加速度過程。 目前演變功率譜的常用參數是根據規范反應譜擬合得到的確定性取值,這雖然便于工程應用,但是忽略了地震震級、傳播途徑、場地條件等因素的不確定性,從而忽略了演變功率譜參數顯著的隨機性。這將導致生成的地震動樣本過于規則,且工程特性單一,不能反映地震動豐富的概率信息和細部概率結構。
對于參數取值的確定性研究,已有較多學者以抗震規范為基礎,取得了較為完善的成果[2-5]。對于參數的隨機性建模,丁艷瓊等[6]基于工程隨機地震動物理模型,對7 000條地震動進行了精細的分組與參數識別,并對其進行了統計建模;李杰等[7]同樣基于工程隨機地震動物理模型,對5 000條地震動進行了參數識別與統計建模。雖然隨機性參數與功率譜的概念似有矛盾,但卻更符合工程上對地震動認知與應用。
為了體現震級、距離以及場地因素對地震動造成的影響,本文對實測強震記錄進行了精細的分組。利用最小二乘法,識別演變功率譜的模型參數;并結合擬合優度檢驗和貝葉斯信息準則,確定每個參數的最優概率模型;最后引入隨機函數約束[8-10],僅用6個隨機變量便可實現地震動過程在概率層面上的模擬。由于地震動代表性時程具有賦得概率,可進而與概率密度演化理論相結合[11-12],對結構進行精細的動力響應和可靠度分析。
1 地震動工程隨機模型及人工合成方法
根據文獻[13],非平穩地震動過程的演變功率譜密度函數可表示為:
SUg(ω,t;λUg)=f(t;λf)2S(ω;λS) (1)
式中:SUg(ω,t;λUg)為非平穩地震動加速度過程Ug(t)的單邊演變功率譜;f(t;λf)為強度調制函數;S(ω;λS)為單邊功率譜。
對于強度調制函數,采用工程上常用的Amin-Ang模型[14]。該模型優點是可以較為全面地刻畫地震動的波形;缺點是采用了分段形式,形式復雜且無法準確地反映地震動峰值到達時刻[15]。
式中:t1、t2和c分別代表非平穩地震動過程的平穩段起始時間、平穩段結束時間和衰減段的衰減速度。因此,Amin-Ang模型的參數向量可表示為λf=(t1,t2,c)。
對于單邊功率譜,采用工程上常用的Kanai-Tajimi模型[16]。該模型優點是從動力學角度推導,參數具有明確的物理意義;缺點是S(0;λS)≠0,不符合實際情況:
式中:ωg和ξg分別為場地土的卓越圓頻率和阻尼比;S0為白噪聲激勵的強度,可表示為[17]:
式中:Amax表示地震動峰值加速度;r為峰值因子;ωe為S0=1時S(ω;λS)與坐標軸圍成的面積。因此,Kanai-Tajimi模型的參數向量可以表示為λS=(ωg,ξg,r)。
這樣,演變功率譜密度函數的參數向量λUg便可表示為:
λUg=(λf λS)=(t1,t2,c,ωg,ξg,r) (5)
確定演變功率譜密度函數SUg(ω,t;λUg)之后,便可采用諧波合成法生成地震動過程。根據文獻[10],非平穩地震動過程的源譜表達為:
式中:Δω為頻率步長;Δω=ωu/N;N為截斷項數;ωk=k×Δω(k=1,2,…,N);ωu為截斷頻率。
式(6)中,Xk,Yk為一組零均值的標準正交隨機向量,滿足以下基本條件:
E[Xk]=E[Yk]=0,E[XjYk]=0
E[XjXk]=E[YjYk]=δjk (7)
式中:E[·]為數學期望;δjk為Kronecker-delta記號。
傳統的諧波合成法在本質上屬于Monte Carlo方法:一方面,生成的樣本數量巨大,極大地增加了結構動力反應分析的計算量;另一方面,Monte Carlo方法在本質上屬于隨機抽樣方法,所生成的樣本概率信息不完備,無法進行結構精細化動力反應分析和動力可靠性評價。為克服傳統Monte Carlo方法的上述挑戰,本文引入了隨機函數的降維思想[8-10],將標準正交隨機變量集{Xk,Yk}(k=1,2,…,N)定義為基本隨機向量的正交函數形式:
2 實測強震記錄
本文從太平洋地震動工程研究中心(PEER)NGA-West2地震動數據庫中篩選了1 766條主軸方向的實測強震記錄,且嚴格遵循以下原則挑選:
(1) 斷層距離應大于10 km,以減少近斷層地震動的數量。
(2) 實測記錄的矩震級應大于5,以排除對結構影響較小的地震動。
在篩選的實測強震記錄中,Rjb(Joyner-Boore距離)范圍為0~540 km;vS30(地下30 m平均剪切波速)范圍為106.83~1 525.85 m/s;M(矩震級)范圍為:5.0~7.9。
《中國地震動參數區劃圖》[18]中建議了Ⅰ0~Ⅳ五種場地類別。本文結合文獻[9],根據每條實測強震記錄的vS30對實測強震記錄進行分類。同時,為了進一步體現震級與距離因素對地震動工程特性造成的影響,本文以M和Rjb為指標,采用K均值聚類的方法,將每個場地的實測強震記錄另分為3組,可概括為:遠場大震、近場小震和近場大震[6]。由于小震無法傳播到較遠的距離,因此沒有遠場小震這一項。
Ⅱ類場地的聚類結果如圖1所示。可以看出,聚類方法的分組結果與《建筑抗震設計規范(GB 50011—2010)》[19]中的地震分組有著相似性。
表1給出了不同聚類分組和場地對應的實測強震記錄數量:
此外,實測強震記錄還需要四階Butterworth濾波處理以及1%~99%范圍的能量截取,以保證研究結果的可靠性[20]。
圖2和圖3分別給出了不同場地的反應譜均值對比圖和Ⅱ類場地不同分組的反應譜均值對比圖。需要說明的是,為了對比清晰,將實測強震記錄均調幅至0.2g·m/s2。由圖2可知,隨著場地土變軟,反應譜峰值逐漸向長周期移動,且長周期成分也逐漸增多。由圖3可知,不同分組的反應譜峰值和長周期成分有著顯著差異,充分證明了震級和距離對地震動工程特性的顯著影響。
3 演變功率譜參數識別
對于第i條實測記錄ai(t),其隨時間變化的歸一化能量曲線Ii(t)可表示為[21]:
式中:Ti為第i條實測強震記錄的持時。
對于非平穩地震動過程,其隨時間變化的歸一化模型能量曲線P(t)為:
以Ii(t)為目標值,采用最佳平方逼近原則,便可識別ai(t)的參數向量λf,i:
根據帕薩瓦爾定理,信號在時域上的能量與頻域上的能量相等,可以得到:
令
于是:
同時結合式(3)和式(4)得:
由于ai(t)的峰值加速度Amax,i是已知的,將參數向量λf,i代入式(14)中便可得到Ei,再根據式(15b)便可得到與ai(t)對應的峰值因子ri。
對于平穩地震動功率譜的場地參數,采用擬合反應譜的方法識別。為簡便起見,在對場地參數進行識別時,將地震動視為等效平穩過程。Vanmarcke將隨機過程的反應譜定義為單質點體系反應峰值系數的平均值與反應方差的乘積[22],因此,地震動反應譜與功率譜轉換公式可以定義為:
式中:(ω0;λf,i)為等效平穩過程的峰值因子;σ(ω0,ξ;λS,i)為等效平穩過程的反應方差。ω0與ξ分別為結構的固有圓頻率和阻尼比,在本文中ω0≥1.05 rad/s,ξ=0.05;Td,i為等效平穩過程的持續時間,即為強度超過峰值50%的持續時間,對于Amin-Ang模型,Td,i的表達式為:
以ai(t)前6 s反應譜αi(ω0)為目標值,根據式(16),采用最佳平方逼近原則,對參數向量λS,i進行識別:
這樣,便完成了與ai(t)對應的演變功率譜參數向量λUg,i的識別。類似地,可依次識別1 766組實測強震記錄的參數向量λUg,i。
以SFERN地震為典型實例,根據式(11)與式(16),反應譜和地震動歸一化能量的結果見圖4(a)
與圖4(b),可以看出,模型與實測記錄均擬合良好,驗證了本文采用的識別方法的有效性。參數識別結果如表2所列。
4 演變功率譜參數統計建模
為了體現演變功率譜參數的隨機性,本文選取了5種備選概率模型對每個參數的概率分布進行擬合。這5種備選概率模型分別為:對數正態分布(LOGN)、耿貝爾分布(GUM)、廣義極值分布(GEV)、韋布爾分布(WEI)、伽馬分布(GAM),它們的概率密度函數如表3所列。
以Ⅱ類場地的參數ωg為例,概率分布擬合結果如圖5。可以看出,難以直接判斷ωg的最優概率模型。
為此,本文引入了K-S檢驗。一般來說,當K-S檢驗為0時,表示接受該備選概率模型;為1時,表示拒絕該備選概率模型。進一步地,當有多個備選概率模型通過K-S檢驗時,則根據貝葉斯信息準則進一步篩選。貝葉斯信息準則可表示為[24]:
BIC=ln(n)u-2ln(L) (21)
式中:u為概率模型中參數的個數;L為模型最大似然函數;n為樣本容量。一般地,BIC值越小,代表模型擬合度越好。
結合K-S檢驗與BIC信息準則,每個演變功率譜參數的最優概率模型以及對應的模型參數如表4所列。
在表4中,當概率模型為LOGN時,Par1為均值,Par2為標準差;概率模型為GUM時,Par1為位置參數,Par2為形狀參數;概率模型為GEV時,Par1為形狀參數,Par2為尺度參數,Par3為位置參數;概率模型為WEI時,Par1為比例參數,Par2為形狀參數;概率模型為GAM時,Par1形狀參數,Par2為尺度參數。
為了更清晰地表現參數隨場地變化的趨勢,圖6展示了每個參數均值不同場地的變化趨勢圖。
圖6(a)可知,隨著土質變軟,場地土卓越圓頻率逐漸變小;而峰值因子和場地土阻尼比沒有明顯的變化。對于場地土阻尼比,文獻[6]指出,阻尼比不僅與場地土的軟硬有關,還與其厚薄、孔隙率、形狀、體積等因素有關。因此不能通過簡單的場地類別與分組反映其影響的強弱。對于峰值因子,文獻[3]指出,峰值因子對場地變化不敏感。
圖6(b)可知,隨著土質的變弱,地震動的平穩段起始時間和地震動衰減因子逐漸縮小,而地震動的平穩段持續時間逐漸延長。這說明隨著土質的變弱,地震動的總持時逐漸延長。
綜上,建議將場地土阻尼比和峰值因子近似做均值處理,而其他參數做隨機變量處理。
5 數值算例
5.1 降維模擬的實現
由前文可知,模擬地震動共需要6個隨機變量{t1,t2,c,ωg,Xk,Yk}。且根據式(8),Xk,Yk均是同一個基本隨機變量的函數形式。這樣,模擬地震動過程共需要5個基本隨機變量。
式中:l=1,…,nsel;F-1ωg、F-1t1、F-1t2及F-1c分別代表任意分組下ωg、t1、t2及c最優累計分布函數的反函數。這樣,便得到了具有隨機性的演變功率譜模型參數。
式中:l=1,…,nsel。
這樣,便得到了地震動過程的基本隨機變量集Θ={Θ1,Θ2,Θ3,Θ4,Θ5},將基本隨機變量Θ1~Θ4,場地土阻尼比均值和峰值因子均值代入式(1)中,便可得到非平穩地震動的演變功率譜模型SUg(ω,t;λUg);將基本隨機變量Θ5代入式(8)中,得到隨機變量{Xk,Yk}。再根據式(6),便可模擬地震動樣本。
如果您現在遇到期刊選擇、論文內容改善、論文投稿周期長、難錄用、多次退修、多次被拒等問題,可以告訴學術顧問,解答疑問同時給出解決方案 。