Evaluation of Influencing Factors of Earthquake Damage of Multi-storey Brick Building Based on AdaBoost Algorithm
-
摘要: 多层砖房是最常用的结构形式之一,对其进行震害预测尤为重要,选择合适的影响因素是震害预测中最重要的环节之一。本文基于AdaBoost算法对多层砖房震害影响因素进行评估,给出影响因素重要度排序,并将结果与灰色关联分析法进行比较。研究发现结构合理性、地震峰值加速度、砖墙面积率和场地条件对多层砖房震害影响最大,因此在多层砖房震害预测中应优先考虑这4个因素,并在结构设计建造过程中予以足够重视。
-
关键词:
- 多层砖房 /
- 震害 /
- 影响因素 /
- AdaBoost算法
Abstract: Multi-storey brick houses are one of the most commonly used structural forms, so it is especially important to predict earthquake damage. Choosing the appropriate influencing factors is one of the most important aspects of earthquake damage prediction. Based on the AdaBoost algorithm, this paper evaluates the influencing factors of seismic damage of multi-storey brick buildings, gives the order of importance of factors, and compares the results with the gray correlation analysis method. It is concluded that the structural rationality, the peak acceleration of the earthquake, the area ratio of the brick wall and the site conditions are the most important, so it should be given enough attention in the process of structural design and construction.-
Key words:
- Multi-storey brick houses /
- Earthquake damage /
- Influencing factors /
- AdaBoost algorithm
-
引言
建筑结构震害预测是地震工程学科的重要内容之一(于天洋等,2018;贾晗曦等,2019),其研究方法主要分为专家经验法、模糊类比法和基于机器学习相关算法组成的方法。其中,多层砖房作为国内量大面广的结构形式之一,许多学者对其进行震害预测研究,如尹之潜等(1991)基于易损性概率分析方法得到震害等级与平均折算抗剪强度的关系;欧盛(2011)基于最小二乘法对尹之潜方法中的修正系数进行修正;刘章军等(2007)使用模糊数学理论对多层砖房进行震害预测;部分学者基于反向传播神经网络(刘本玉等,2002;姜伟等,2011)和蚁群聚类径向基网络模型(杨秀萍等,2013)对多层砖房进行震害评估。
通过不同方法均可进行震害预测,但机器学习算法模型无需进行任何假设,适合内部因素错综复杂的问题,因此机器学习算法更适用于震害预测。而机器学习模型中,最关键的问题是选择合适的输入参数,即多层砖房震害影响因素。汤皓等(2006)使用灰色关联分析法对不同因素进行分析,但仅对内部关系进行分析,并未得到因素的重要性排序。集成学习算法被证明在因素重要度评估中具有良好表现(Jia等,2019)。因此,本文使用集成学习中的AdaBoost算法(Asim等,2018)对多层砖房震害影响因素进行重要度分析,以期弥补灰色关联分析的不足。
1. 影响因素与数据选取
影响多层砖房地震破坏的因素较多,主要源于以下3个方面:地震、场地和结构本身。本文选取汤皓等(2006)与姜伟等(2011)研究中的影响因素作为模型输入参数,包括房屋高度、施工质量、砂浆等级、结构合理性、砖墙面积率、房屋整体性、场地条件和地震峰值加速度(PGA)。在地震方面未选择震级和烈度是因为其与PGA具有一定关系,三者仅选择其一避免重复,且震级和烈度变化小、分级少,1次地震只出现1个震级(余震不计),不同地区烈度基本从Ⅵ度到Ⅹ度变化,仅有5个分级。
震害对应的破坏状态分为以下5个等级:基本完好、轻微破坏、中等破坏、严重破坏和倒塌,各影响因素具体分类及特征和取值见表 1,多层砖房影响因素部分数据集见表 2。
表 1 多层砖房震害影响因素特征及取值Table 1. Characteristics and influencing factors of seismic damage of multi-storey brick buildings影响因素 特征 取值 房屋高度 — — 施工质量 其他条件相同时,施工质量越好,破坏程度越低 优 10 中 8 差 6 砂浆等级 — 按实际等级取值 结构合理性 结构合理度越大,破坏程度越低 取结构抗震性能良好隶属度的值(谭克艰等,1997) 砖墙面积率 $砖墙面积率= \frac{砖墙净面积}{建筑面积}$ 按实际计算取值 房屋整体性 整体性越好,破坏程度越低 楼盖 现浇 5 预制 4 木制 3 屋盖 现浇 5 预制 4 木制 3 圈梁 有 1 构造柱 有 1 是否有地下室和筏板基础 是 1 否 0 房屋是否开裂 是 -1 否 0 场地条件 场地条件越好,破坏程度越低 Ⅰ类 10 Ⅱ类 8 Ⅲ类 6 场地条件 场地条件越好,破坏程度越低 Ⅳ类 4 地形地貌是否不利 是 -1 否 0 地下水位是否较高 是 -1 否 0 PGA PGA越大,破坏程度越高 按实际值取值 表 2 数据集Table 2. Data set序号 房屋层数 施工质量 砂浆等级/MPa 结构合理性 砖墙面积率/% 房屋整体性 场地条件 PGA/g 破坏程度 1 2 10 25 0.50 8.20 8.00 6 0.20 中等破坏 2 2 10 10 0.40 10.00 8.00 7 0.25 严重破坏 3 3 10 10 0.30 11.50 9.00 8 0.25 中等破坏 4 2 10 35 0.45 9.70 9.50 7 0.15 轻微破坏 5 4 10 25 0.36 7.60 7.50 10 0.20 中等破坏 6 2 10 25 0.55 4.30 10.00 9 0.10 轻微破坏 7 3 10 25 0.43 6.87 8.00 3 0.25 严重破坏 8 3 10 10 0.40 7.52 9.50 7 0.30 中等破坏 9 2 10 35 0.38 8.32 8.50 6 0.20 轻微破坏 10 5 10 10 0.46 11.50 8.00 8 0.25 基本完好 11 2 10 25 0.41 4.65 7.50 9 0.05 轻微破坏 12 3 10 10 0.50 9.42 12.00 8 0.20 基本完好 13 3 10 10 0.47 13.60 9.00 5 0.25 轻微破坏 14 2 10 25 0.52 10.70 8.50 7 0.20 轻微破坏 15 4 10 25 0.48 3.60 7.50 4 0.15 倒塌 16 3 10 25 0.54 6.69 8.00 8 0.25 轻微破坏 17 3 10 10 0.40 8.40 9.50 8 0.20 轻微破坏 18 4 10 25 0.45 8.50 9.46 8 0.30 严重破坏 19 2 10 25 0.47 10.30 7.00 7 0.25 中等破坏 20 4 10 25 0.47 3.23 8.00 8 0.15 轻微破坏 21 2 10 10 0.48 3.50 9.00 8 0.10 轻微破坏 22 3 10 5 0.35 8.64 8.00 7 0.20 严重破坏 23 3 10 10 0.37 6.00 8.00 7 0.20 严重破坏 24 3 10 10 0.34 9.00 10.00 7 0.25 严重破坏 25 3 10 10 0.40 9.00 7.00 7 0.30 倒塌 26 3 10 10 0.44 6.00 9.00 7 0.15 中等破坏 27 3 10 25 0.40 10.00 10.00 8 0.30 倒塌 28 3 10 25 0.40 9.00 10.00 7 0.25 倒塌 29 2 10 10 0.50 9.00 12.00 10 0.20 基本完好 30 4 10 10 0.50 9.00 9.00 9 0.15 轻微破坏 2. AdaBoost算法
AdaBoost算法是集成学习中具有代表性的一种算法,其原理是将若干个弱分类器训练集合成一个强分类器(Shin等,2009)。该算法具有强自适应性,排在前位的弱分类器算错的数据被重新计算,用于训练下个弱分类器,在这个过程中加入新的弱分类器。整个AdaBoost算法结束的标志为达到期望的错误率或达到自设的最大迭代次数,达到二者其一,迭代终止。AdaBoost算法具体迭代步骤如下:
(1)对数据集中的每个数据权值进行初始化处理。样本总数为N,将1/N的权重赋予每个数据,这些权重组成向量S。
(2)训练基本分类器。在每轮训练中,数据分为以下2种情况:当被正确分类时,加入下个训练集中时权重被自动减小;未被正确分类时,权重增加。被更新过的训练集用于训练新增的基本分类器,不断重复这个过程。AdaBoost算法为每个分类器都分配1个权重$\partial $。
(3)把每次训练后得到的基本分类器集成为1个强分类器。每轮迭代结束后,误差率$\varepsilon $低的基本分类器权重被增加,在集成的强分类器中占比更大,重要度也更高;误差率$\varepsilon $高的基本分类器权重被减小,在集成的强分类器中占比更小,重要度也更低。
具体计算公式如下:
$$ \varepsilon \rm{=}\frac{未正确分类的样本数目}{N}$$ (1) $$\partial = \frac{1}{2}\left({\frac{{1 - \varepsilon }}{\varepsilon }} \right)$$ (2) 数据被正确分类后的权重向量值为:
$${\boldsymbol{S}}_i^{(t + 1)} = \frac{{{\boldsymbol{S}}_i^{(t)}{e^\partial }}}{{sum({\boldsymbol{S}})}}$$ (3) 数据未被正确分类后的权重向量值为:
$${\boldsymbol{S}}_i^{(t + 1)} = \frac{{{\boldsymbol{S}}_i^{(t)}{e^{(- \partial)}}}}{{sum({\boldsymbol{S}})}}$$ (4) 式中,i是弱分类器,t是迭代次数。
3. 评估模型训练及结果
3.1 AdaBoost算法训练过程
本模型直接调用sklearn库中的AdaBoostClassifier分类器,默认使用CART决策树。分类算法选择基于类别概率、效果更好的SAMME.R算法,具体参数选择为:max_depth=2,min_samples_split=20,min_samples_leaf=5,n_estimators=300,learning_rate=0.5。
n_estimators表示采用的最大弱分类器个数,分类器过多模型易出现过拟合情况,但太少会出现欠拟合情况。learning_rate表示学习率,即整个模型迭代速度,学习率越小,迭代次数越多,该值下降会影响模型精度。n_estimators和learning_rate对整个模型的影响最大,因此进行重点调整,其取值不同时的系统分类精度如图 1。由图 1可知,当n_estimators和learning_rate分别为300和0.5时,模型精度最高。同时也可看出AdaBoost算法精度较高。选用的模型算法除须保证精度外,还须确保模型的稳定性,每次计算结果不能相差太大。模型3次计算结果如图 2,由图 2可知,每次计算不同参数的重要度虽不相同,但排序基本一致。这证明AdaBoost算法精度和稳定性均较好,适用于多层砖房震害影响因素评估。
3.2 AdaBoost算法训练结果
模型计算结果即为每个因素的重要度,AdaBoost算法训练结果见表 3,并列出灰色关联分析法中的排序。由表 3可知,多层砖房结构合理性的重要度最高,约占1/4;PGA的重要度仅次于结构合理性,约占1/5;砖墙面积率与场地条件的重要度相近;结构合理性、PGA、砖墙面积率与场地条件的重要度占比超过80%,远超其他因素,可见房屋整体性、砂浆等级、房屋高度、施工质量的重要性较低。以上分析仅针对AdaBoost算法训练结果,并未分析数据本身。
表 3 影响因素重要度排序及与灰色关联分析法结果的对比Table 3. Ranking of factors of influence factors and comparison with results of grey correlation analysis method影响因素 重要度(AdaBoost结果) 灰色关联分析法中的排名 结构合理性 0.266878512 4 PGA 0.196731755 1 砖墙面积率 0.170314083 2 场地条件 0.168439716 5 房屋整体性 0.089834515 8 砂浆等级 0.067375887 6 房屋高度 0.040425532 7 施工质量 0.000000000 3 从算法原理和数据本身来看,分级越多的影响因素重要度越高。在本模型中,施工质量全部为优,因此默认分级只有一级,数据无变化,算法默认重要度为0。但在实际工程中,施工质量对震害程度的影响很大,因此灰色关联分析法中其排名为第3。随着数据量的增加,此类问题逐渐减少。
AdaBoost算法训练结果与灰色关联分析法的结果相差较小,只有结构合理性和房屋整体性的排名出入较大。结构合理性在本模型中至关重要,但在灰色关联分析法结果中仅排在中等位置。灰色关联分析法中,如果某影响因素和破坏程度呈正相关性或负相关性,则模型自动认为此因素较重要,模型结果反映各影响因素对震害相关性强弱的顺序。2种算法内部机理不同,灰色关联分析法更注重影响因素与破坏程度的趋势关系,而AdaBoost算法更注重影响因素本身对破坏程度的贡献度及整个模型的自适应性,通过不断迭代筛选最优解。因此,对于重要度排序而言,AdaBoost算法更有优势。综上所述,多层砖房结构合理性更应被重视,而房屋整体性可排在次要位置。
通过以上对比分析可知,AdaBoost算法在处理高度非线性问题上更有优势,训练结果更接近震害经验,调节合适的参数后,其精度高达96%,且稳定性较高。因此,AdaBoost算法在多层砖房震害评估中具有适用性。灰色关联分析法作为特征重要度评估的经典方法,有其可取之处,在特征之间的关系较明晰、数据量较少的情况下同样适用。
4. 结论
本文基于AdaBoost算法对多层砖房震害影响因素重要度进行评估,得到不同影响因素的重要度排序,并将结果与灰色关联分析法进行比较。其中,结构合理性、PGA、砖墙面积率和场地条件最重要,在震害预测影响因素选择中应着重考虑。具体结论如下:
(1)AdaBoost算法具有良好的稳定性和精度,适用于多层砖房震害影响因素重要度评估。
(2)房屋结构合理性在诸多影响因素中排名第1,重要度约占1/4,可见其重要性,设计建造时应着重考虑;地震峰值加速度排名第2,重要度约占1/5,设计阶段应予以高度重视。
(3)砖墙面积率与场地条件的重要度相对较高,而房屋整体性、砂浆等级、房屋高度与施工质量的重要度较低,其中施工质量重要度排序与灰色关联分析法差异最大,这是数据有限的原因。
此外,多层砖房震害影响因素远不止文中所列,由于时间和数据限制,本文仅提出探索性模型,仍需进一步拓展影响因素、补充数据,将数据质量较差的例子删除,以期提升模型准确度和适用性,以便推广使用。
-
表 1 多层砖房震害影响因素特征及取值
Table 1. Characteristics and influencing factors of seismic damage of multi-storey brick buildings
影响因素 特征 取值 房屋高度 — — 施工质量 其他条件相同时,施工质量越好,破坏程度越低 优 10 中 8 差 6 砂浆等级 — 按实际等级取值 结构合理性 结构合理度越大,破坏程度越低 取结构抗震性能良好隶属度的值(谭克艰等,1997) 砖墙面积率 $砖墙面积率= \frac{砖墙净面积}{建筑面积}$ 按实际计算取值 房屋整体性 整体性越好,破坏程度越低 楼盖 现浇 5 预制 4 木制 3 屋盖 现浇 5 预制 4 木制 3 圈梁 有 1 构造柱 有 1 是否有地下室和筏板基础 是 1 否 0 房屋是否开裂 是 -1 否 0 场地条件 场地条件越好,破坏程度越低 Ⅰ类 10 Ⅱ类 8 Ⅲ类 6 场地条件 场地条件越好,破坏程度越低 Ⅳ类 4 地形地貌是否不利 是 -1 否 0 地下水位是否较高 是 -1 否 0 PGA PGA越大,破坏程度越高 按实际值取值 表 2 数据集
Table 2. Data set
序号 房屋层数 施工质量 砂浆等级/MPa 结构合理性 砖墙面积率/% 房屋整体性 场地条件 PGA/g 破坏程度 1 2 10 25 0.50 8.20 8.00 6 0.20 中等破坏 2 2 10 10 0.40 10.00 8.00 7 0.25 严重破坏 3 3 10 10 0.30 11.50 9.00 8 0.25 中等破坏 4 2 10 35 0.45 9.70 9.50 7 0.15 轻微破坏 5 4 10 25 0.36 7.60 7.50 10 0.20 中等破坏 6 2 10 25 0.55 4.30 10.00 9 0.10 轻微破坏 7 3 10 25 0.43 6.87 8.00 3 0.25 严重破坏 8 3 10 10 0.40 7.52 9.50 7 0.30 中等破坏 9 2 10 35 0.38 8.32 8.50 6 0.20 轻微破坏 10 5 10 10 0.46 11.50 8.00 8 0.25 基本完好 11 2 10 25 0.41 4.65 7.50 9 0.05 轻微破坏 12 3 10 10 0.50 9.42 12.00 8 0.20 基本完好 13 3 10 10 0.47 13.60 9.00 5 0.25 轻微破坏 14 2 10 25 0.52 10.70 8.50 7 0.20 轻微破坏 15 4 10 25 0.48 3.60 7.50 4 0.15 倒塌 16 3 10 25 0.54 6.69 8.00 8 0.25 轻微破坏 17 3 10 10 0.40 8.40 9.50 8 0.20 轻微破坏 18 4 10 25 0.45 8.50 9.46 8 0.30 严重破坏 19 2 10 25 0.47 10.30 7.00 7 0.25 中等破坏 20 4 10 25 0.47 3.23 8.00 8 0.15 轻微破坏 21 2 10 10 0.48 3.50 9.00 8 0.10 轻微破坏 22 3 10 5 0.35 8.64 8.00 7 0.20 严重破坏 23 3 10 10 0.37 6.00 8.00 7 0.20 严重破坏 24 3 10 10 0.34 9.00 10.00 7 0.25 严重破坏 25 3 10 10 0.40 9.00 7.00 7 0.30 倒塌 26 3 10 10 0.44 6.00 9.00 7 0.15 中等破坏 27 3 10 25 0.40 10.00 10.00 8 0.30 倒塌 28 3 10 25 0.40 9.00 10.00 7 0.25 倒塌 29 2 10 10 0.50 9.00 12.00 10 0.20 基本完好 30 4 10 10 0.50 9.00 9.00 9 0.15 轻微破坏 表 3 影响因素重要度排序及与灰色关联分析法结果的对比
Table 3. Ranking of factors of influence factors and comparison with results of grey correlation analysis method
影响因素 重要度(AdaBoost结果) 灰色关联分析法中的排名 结构合理性 0.266878512 4 PGA 0.196731755 1 砖墙面积率 0.170314083 2 场地条件 0.168439716 5 房屋整体性 0.089834515 8 砂浆等级 0.067375887 6 房屋高度 0.040425532 7 施工质量 0.000000000 3 -
贾晗曦, 林均岐, 刘金龙, 2019.建筑结构地震易损性分析研究综述.震灾防御技术, 14(1):42—51. http://zzfy.eq-j.cn/zzfyjs/ch/reader/view_abstract.aspx?file_no=20190105&flag=1 姜伟, 马令勇, 刘功良, 2011.基于MATLAB神经网络方法的多层砖房震害预测.西北地震学报, 33(2):155—158. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=xbdzxb201102009 刘本玉, 叶燎原, 江见鲸, 2002.用模糊人工神经网络方法预测多层砖房震害.清华大学学报(自然科学版), 42(6):843—846. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=qhdxxb200206036 刘章军, 叶燎原, 2007.基于模糊概率的多层砖房震害预测.地震研究, 30(1):99—105. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=dzyj200701019 欧盛, 2011.砖砌体房屋震害预测方法研究.哈尔滨: 中国地震局工程力学研究所. 谭克艰, 曹晖, 毛沂, 1997.建筑体型抗震性能模糊评判专家系统.重庆建筑大学学报, 19(06):108—112. http://www.cnki.com.cn/Article/CJFDTotal-JIAN706.018.htm 汤皓, 陈国兴, 2006.基于灰关联与人工神经网络综合评价模型的多层砖房震害预测.世界地震工程, 22(4):133—139. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=sjdzgc200604025 杨秀萍, 程运平, 陈克珩等, 2013.基于ACCRBF网络的多层砖房震害预测.震灾防御技术, 8(1):90—96. http://zzfy.eq-j.cn/zzfyjs/ch/reader/view_abstract.aspx?file_no=20130110&flag=1 尹之潜, 李树桢, 赵直等, 1991.地震灾害预测与地震灾害等级.中国地震, 7(1):11—21. http://www.cqvip.com/Main/Detail.aspx?id=661030 于天洋, 郭恩栋, 李倩等, 2018.清水池震害综合预测方法.震灾防御技术, 13(2):353—362. http://zzfy.eq-j.cn/zzfyjs/ch/reader/view_abstract.aspx?file_no=20180210&flag=1 Asim K. M., Idris A., Iqbal T., et al., 2018. Seismic indicators based earthquake predictor system using Genetic Programming and AdaBoost classification. Soil Dynamics and Earthquake Engineering, 111: 1—7. doi: 10.1016/j.soildyn.2018.04.020 Jia H. X., Lin J. Q., Liu J. L., 2019. An earthquake fatalities assessment method based on feature importance with deep learning and random forest models. Sustainability, 11(10): 2727. doi: 10.3390/su11102727 Provost F., Hibert C., Malet J. P., 2017. Automatic classification of endogenous landslide seismicity using the Random Forest supervised classifier:Seismic sources automatic classification. Geophysical Research Letters, 44(1): 113—120. doi: 10.1002/2016GL070709 Shin Y., Kim D. W., Kim J. Y., et al., 2009. Application of AdaBoost to the Retaining Wall Method Selection in Construction. Journal of Computing in Civil Engineering, 23(3): 188—192. doi: 10.1061/(ASCE)CP.1943-5487.0000001 -