射线检测底片的缺陷影像识别和复评是判断管道环焊缝质量的重要依据之一,为有效管控大口径、高压力、高强钢管道环焊缝失效的问题,国内管道企业进行了在役油气管道环焊缝射线检测底片复核和超标缺陷排查工作。由于底片复评工作量大且非常依赖评片人员的专业经验,严重缺陷的排查效率较低。
中俄东线作为首条全数字化移交的大口径输气管道,在环焊缝检测方面,全线采用了胶片射线检测(RT)底片数字化技术、数字射线成像技术(DR)、全自动超声检测技术(AUT)等数字化无损检测技术,为智能评片技术积累了高质量的缺陷特征样本数据。
中俄东线管道环焊缝数字化无损检测技术应用现状
数字化无损检测技术的应用
按照标准GB 50369—2014《油气长输管道工程施工及验收规范》的要求,中俄东线北段管道采用了100%的AUT检测,同时对20%的焊口进行RT复验,并对RT检测的部分含缺陷焊口进行了DR检测效果验证,用于DR设备校正、相关标准体系的研究完善等。按照相关标准要求,DR成像灰度等级应不低于12位,像素尺寸应不大于200 μm,缺陷评定标准与RT缺陷评级标准一致。RT和DR的数字化射线检测图像均参照标准ASTM E 2339—2008《无损检测的数字图像和传输标准实施规程》的要求,数字底片图像以Dicom(医学数字成像和通信)格式存储。
RT底片数据质量分析
对中俄东线北段管道的RT检测底片数字化图像进行了质量分析。各检测单位使用了3家不同品牌的底片数字化设备,通过抽查统计分析了数字化扫描底片中像质计的最小可见丝号及缺陷图像清晰度关联情况。RT数字化底片最小可见丝号与缺陷图像清晰度关系如图1所示,笔者随机抽取了83张使用不同型号设备进行数字化的缺陷底片,发现原物理底片上的缺陷,经数字化后其缺陷可见、不清晰和不可见的分别有27,26和30张,相应的数字化底片最小可见像质计丝号平均值分别为10.2,9.9和9.2号。参照高速列车焊缝射线检测智能评定系统及GB/T 26141.2—2010《无损检测射线照相底片数字化系统的质量鉴定 第二部分:最低要求》等标准要求,数字化后的底片可见像质计丝号应与原物理底片一致,并且数字化等级应达到DB级以上。因此,在底片数据清洗及选择缺陷特征样本数据时,选择缺陷清晰可见的底片图像,能提升智能识别算法的精度。
图1 RT数字化底片最小可见丝号与缺陷图像清晰度关系
对于缺陷清晰的底片图像,通常也具有以下特点:
底片图像间存在较大的亮度差异、单张图像背景起伏较大;
底片中缺陷图像与背景的灰度对比度很低;
由于X光散射现象,底片图像中存在较大的随机噪声;
各类缺陷具有位置随机、形态各异、尺寸跨度较大等特点。
这些问题都会对缺陷的图像检测产生较大的干扰,从而造成误检和漏检。因此,在对射线检测底片图像进行智能识别算法开发时,需要在图像处理、目标检测算法开发调试等方面提高检测算法的适应性。
RT检测底片图像智能识别技术
主要技术内容
射线检测缺陷智能识别分析及软件开发框图如图2所示,射线检测图像智能识别技术结合底片图像特点和深度学习等人工智能技术,其开发的主要内容包括RT检测数据管理、图像数据批量处理、缺陷样本收集和标注、建立缺陷智能识别算法模型、辅助评片、结果数据查阅分析以及对应的软件功能模块开发。通过对流程和软件进行技术研发,目前笔者单位已经初步具备射线检测底片图像智能识别分析的能力,实现了未熔合等主要缺陷的自动检测,提升了环焊缝线性危害缺陷排查的智能化水平和效率。
图2 射线检测缺陷智能识别分析及软件开发框图
图像处理的关键算法
对于中俄东线不同标段和不同批次的X射线检测底片图像,笔者进行了统一批量处理,以满足样本标注和缺陷智能识别分析的基本格式要求。射线检测底片图像处理的主要算法流程如图3所示,具体包括以下几个算法:
归一化处理:
由于射线检测底片图像采集所使用的扫描仪规格不同,其具有多种通道数和位数,且图像长宽方向不一。通过归一化处理,可获得精度和尺寸一致的图像数据。
去白边处理:
X射线检测底片数字化扫描过程中,在图像采集的起始和末尾时可能产生无有效底片图像的白边区域。去除白边区域可去除对智能识别结果的影响。
自适应裁剪:
中俄东线单张底片图像宽度约为900像素,高度为8000~20000像素。为解决缺陷尺寸相对于整幅底片图像占比很小导致的检出率较低及不同底片图像尺寸不一等问题,设计和研发了一种自适应裁剪工具,以提高缺陷在图像中的相对占比,同时确保图像尺度在较小的范围内波动。经试验分析和评估,设定裁剪后单张底片图像的尺寸为2000像素×1000像素。
样本随机划分:
在深度学习算法中,通常将原始数据集划分为训练集、验证集和测试集3个部分,划分时需要尽可能保持数据分布的一致性。其中训练集用于学习模型参数,验证集用于挑选超参数,测试集用于判定训练出模型是否达标。
图3 射线检测底片图像处理的主要算法流程
缺陷图像增强显示算法
在缺陷样本的标注及阅览缺陷细节特征等过程中,需要反复对缺陷的X射线检测图像进行调整,通过调整图像亮度、缺陷的对比度和辨识度等,达到增强缺陷图像显示的效果。针对该技术需求,笔者开发了智能灰阶工具和窗技术,智能灰阶和窗技术的处理效果如图4所示。
智能灰阶工具:
在医学影像学领域,可以使用自适应直方图均衡方法,计算图像中多个局部区域的直方图,之后通过重新分布亮度来改变图像的对比度,该方法对于明暗区域对比明显的X射线检测图像有较好的图像增强显示效果。但是管道环焊缝的X射线底片图像明暗区域对比并不明显,像素值分布比较均匀,采用与医学X射线图像相同的处理方法时,会出现过度放大图像中均匀区域噪声的现象。限制对比度自适应直方图均衡方法(智能灰阶)可将输入的影像按照像素点分成块区域,再对每一个区域进行自适应直方图均衡处理,可有效减少噪点,保存缺陷影像的细节特征。
窗技术:
在医学影像学领域,窗技术是观察不同密度正常组织或病变组织的一种显示技术,包括窗宽和窗位。提高窗位则图像变黑;降低窗位则图像变白。增大窗宽,则图像层次增多且对比度下降;缩小窗宽,则图像层次减少,组织间对比度增加。引入窗技术,评片人员可通过调节窗宽和窗位来改变X射线底片图像黑白及不同区域间的对比度,以便于观察各类形态不同的缺陷,达到辅助评片的目的。
图4 智能灰阶和窗技术的处理效果
缺陷特征的深度学习算法
基于深度学习的主流目标检测算法根据有无候选框生成阶段分为双阶段目标检测算法和单阶段目标检测算法两类。双阶段目标检测算法(如Faster R-CNN算法)先在图像中提取候选区域,然后基于候选区域做二次修正得到检测结果,其检测精度较高,但检测速度较慢;单阶段目标检测算法(如YOLO算法)直接对图像进行计算,生成检测结果,检测速度快,但检测精度相对较低。
笔者同时采用了这两类目标检测算法并基于不同缺陷数据集进行了设计和调优,最终确定对于环焊缝区域和圆形缺陷采用Faster R-CNN算法,未熔合和条形缺陷采用YOLO算法。
环焊缝区域检测
焊缝样本集具有以下特点:
① 焊缝图像尺寸变化范围较小;
② 裁剪后的焊缝样本集高度为2000像素,宽度为100~600像素;
③ 高宽比为3.3~20的焊缝图像占比较大。
圆形缺陷检测
圆形缺陷图像样本集具有以下特点:
① 缺陷高度为13~644像素,宽度为15~213像素;
② 缺陷高宽比为0.25~10.3,跨度较大。
圆形缺陷样本图像的面积分布如下:
① 面积小于322像素的占11%;
② 面积介于322像素和962像素之间的占84%;
③ 面积大于962像素的占5.46%。
基于以上特点,笔者设计了不同的网络结构、数据增强方法、预训练模型、参数设置、loss函数以及nms算法,开展了12组消融试验,并选择以Faster R-CNN作为圆形缺陷的目标检测方法,主干网络采用ResNet101,同时考虑到缺陷尺寸变化较大,引入特征金字塔结构(FPN)来对主干网络进行改造。
未熔合和条形缺陷检测
未熔合为断续的细直黑线,长宽比变化非常剧烈。条形缺陷的形状特征不规则,通常将长宽比大于3的缺陷判断为条形缺陷。由于YOLO算法有卷积层池化作用,图像会不断地进行压缩。然而大部分缺陷属于小尺寸目标,默认的候选边界框对小尺寸目标存在检测不准确的问题。笔者通过K-meas聚类分析得到合适的anchor box尺寸,并设计了8组消融试验,最终确定了超参设置和检测模型。
缺陷智能识别效果和分析
评价指标
笔者采用查准率和查全率对缺陷特征的智能识别检测结果进行评估。查准率和查全率通常借助混淆矩阵进行得分统计,混淆矩阵包括4个子定义:
真正例(TP),实际为正例,预测为正例;
真反例(TN),实际为负例,预测为负例;
假正例(FP),实际为负例,预测为正例;
假反例(FN),实际为正例,预测为负例。
查准率Pr是指在所有预测为正例中真正例的比例,即预测的准确性;查全率R是指在所有正例中被正确预测的比例,即预测正确的覆盖率。
交并比(IoU)衡量的是两个区域的重叠程度,是两个区域重叠部分面积占二者总面积的比例。交并比计算方式如图5所示,两个矩形框的交并比是红色交叉面积与红色合并面积比值。交并比为0.5,并不意味着每个框刚好有50%与另外一个框面积重叠,而是每个框大约有2/3的面积重叠。
图5 交并比计算方式示意
智能识别效果及分析
经过数据清洗和预处理,以3000余张原始的X射线检测底片图像作为样本数据,进行缺陷智能识别算法的开发和调试。由于缺陷仅存在于X射线底片图像中的焊缝区域,笔者首先检测焊缝并提取其为感兴趣区域(ROI),然后对ROI执行未熔合等缺陷的识别和检测算法。由于焊缝检测采用深度学习目标检测方法,需对大量图像进行焊缝标注,以得到用于训练焊缝检测模型的样本集。环焊缝及主要缺陷特征样本的智能识别结果如表1所示。
表1
环焊缝及主要缺陷特征样本智能识别结果
环焊缝检测效果及分析
采用Faster R-CNN最优焊缝模型对1464张测试样本进行检出效果测试, 设置IoU阈值为0.5及置信度阈值为0.8情况下,焊缝图像的查准率和查全率均达到了99.9%。即该算法能实现焊缝区域的准确检出,同时具有很低的误检率。焊缝图像的智能识别效果如图6所示,可见焊缝智能识别模型能够适应图像亮度、对比度及图像边缘过渡区域变化,检测结果稳定且满足缺陷检测的要求。
图6 焊缝图像的智能识别效果示例
(上:焊缝标注区域;下:焊缝智能识别区域)
圆形、条形及未熔合缺陷的检测效果及分析
根据中俄东线X射线检测的实际缺陷数量分布情况,确定圆形缺陷、未熔合及条形缺陷是最主要的3种焊接缺陷类型,基于这3种缺陷的图像样本数据,进行了智能识别算法开发和调试其缺陷图像的人工标注和智能识别效果对比如图7所示。
图7 圆形、条形及未熔合缺陷图像的人工标注和智能识别效果对比示例
圆形缺陷的智能识别:
设置IoU阈值为0.5及置信度阈值设为0.8情况下,焊缝图像的查准率和查全率分别为86.9%和97.8%。对不同尺寸圆形缺陷,其智能识别效果有所差异,对于面积小于322像素的圆形缺陷,缺陷图像的形态变化很小且对比度较明显,样本标注较为精确;圆形缺陷面积为322~962像素时(样本中该尺寸缺陷占比极大),其主要由单个缺陷、小范围聚集状缺陷及小区域的微弱缺陷组成,缺陷形态跨度较大,检测指标降低;圆形缺陷面积大于962像素时,该类缺陷主要是聚集状缺陷,由于标注为一个整体时会包含大量的背景区域,实际模型检测时可能将缺陷逐个检出,而非整体检出,计算得到的交并比降低至阈值以下,最终导致对标注为大缺陷的圆形缺陷的查准率和查全率指标偏低。此外,面积大于962像素的圆形缺陷训练样本比例较低,可能是导致指标值降低的另一方面原因。
未熔合及条形缺陷的智能识别:
与圆形缺陷不同,未熔合及条形缺陷图像的形态相似性更大,为提高这两类缺陷的识别分类准确性,采用同一个YOLO深度学习算法进行智能识别模型的开发和调试。该做法引入了一种竞争机制,将未熔合和条形缺陷图像的细微差异嵌入到训练智能识别模型中,并最终在两类缺陷的分类准确性方面体现出来。由表1可见,未熔合缺陷的查准率和查全率较低,存在较多的误判和漏判问题。这主要是中俄东线管道环焊缝的厚度大,单个未熔合缺陷的自身高度低于一个焊层厚度,在X射线底片上未熔合缺陷影像的黑度和对比度偏低,导致未熔合缺陷图像的智能识别更加困难。
裂纹缺陷的智能识别:
由于裂纹缺陷数量较少,未单独进行裂纹缺陷的智能识别算法模型开发。采用上述圆形缺陷、未熔合及条形缺陷的智能算法模型,测试了中俄东线北段的19处裂纹缺陷底片图像。裂纹缺陷的智能识别算法测试结果如表2所示,现有智能检测模型共报告30处缺陷,其中15处识别为未熔合缺陷,且其置信度大多在0.5以上,高于真实未熔合缺陷的平均值。裂纹缺陷检测效果如图8所示,图8a,b两个裂纹缺陷识别结果为未熔合,图8c裂纹识别为条形缺陷。初步分析,裂纹缺陷智能识别的置信度偏高,其主要原因与裂纹缺陷的黑度和对比度偏高有关。可见,智能识别算法模型对于裂纹缺陷有较好的识别作用,且多数分类为未熔合,尽管有4处识别为条形缺陷及11处非裂纹缺陷误判为未熔合和条形缺陷,结合缺陷智能识别分类的置信度排序,仍有望提升裂纹、未熔合等危害性缺陷的排查效率。
表2
裂纹缺陷的智能识别算法测试结果
图8 裂纹缺陷检测效果示例
缺陷图像智能识别技术的应用展望
当前,基于X射线检测底片图像的缺陷智能识别技术,可用于辅助评片和环焊缝质量排查,及时减少漏判、误判,提高危害性缺陷排查的技术水平和效率。
缺陷智能分析技术在管道环焊缝全生命周期中的作用如图9所示,除建设期产生的射线、超声等检测图像数据外,在役管道还需要进行周期性的内检测及相应的开挖检测,管道运行阶段仍会不断产生新的管道环焊缝检测数据。通过与建设期移交的无损检测缺陷数据等进行自动对比,可以快速准确地实现补口腐蚀和焊缝缺陷增长的智能分析预测,更好地做出维护修复决策。X射线检测底片图像的缺陷智能识别技术,将在DR射线检测图像、AUT检测三维图像、内检测信号图像等方面继续发展,助力管道大数据价值的充分挖掘,实现管道智能化运营管理水平的提升。
图9 缺陷智能分析技术在管道环焊缝全生命周期中的作用框图
结语
基于中俄东线北段管道全数字化移交的射线检测底片图像和人工评级结果,通过数据清洗和缺陷特征标注,建立了全自动焊接环焊缝射线检测缺陷样本数据库,可用于缺陷智能识别算法的调试、优化和效果评价。采用Faster R-CNN、YOLO等最新深度学习算法,完成了未熔合等主要类型缺陷智能识别技术的研究和开发,初步实现了未熔合、裂纹等危害性缺陷的智能识别。
在“全数字化移交、全智能化运营、全生命周期管理”的目标框架下,射线检测底片缺陷智能识别技术的开发和应用,可应用于辅助评片、危害性缺陷筛查及判断缺陷增长情况,从而实现管道大数据价值的充分挖掘,提升管道智能化运营管理的水平。