Page 117 - 2024年第55卷第11期
P. 117
一个值相同的数据点,同时标记此类钻进段。
为更好利用各异常钻进过程的数据特征,表 1给出了相应识别准则和处理方法。
图 6 尾部平台段
表 1 异常钻进过程数据识别和处理方法
异常钻进过程 典型特征 识别准则 处理方式
过短钻进段 钻进时间缩短,无法达到预期钻进距离 阈值设定方法 删除此类钻进过程
连续时间区 间 内,数 据 的 分 布 或 特 征 发
数据漂移段 钻进速度>0.01mm?min 删除并重新插补相关数据
生显著变化
从末尾反向 遍 历 钻 进 位 移,标 记 末 尾 值
尾部平台段 钻进位移长时间停滞在某个位置 删除相关数据
小于 0.5m钻进
3.3 钻进数据缺失插补 采取在正常钻进位移数据上手动设置缺失值的实验方法,对比分析两点线性
插补、线性拟合插补、多项式拟合插补以及 RF拟合插补 [21] 4种方法的插补效果。其中,两点线性插
补是根据钻进位移特征提出的一种新方法,即通过连接两个已知坐标点的直线来预测中间缺失段,实
现缺失段数据插补,可实现较高的精度和运算速度。
( 1)数据缺失试验设置:首先,从钻进时间超过 1000s的区间中随机选取一段。接着,从选定的
钻进区间中移除中间连续 200s数据,被移除的数据将作为后续进行数据插补的目标。具体的数据缺
失设置示意图见图 7。这两个案例中,案例 1的数据缺失率为 6.7%,案例 2的数据缺失率为 17.1%。
图 7 数据缺失示意图
(2)插补效果评价:通过对原始钻进位移数据和插补后的钻进位移数据进行均方根误差(RMSE)、
平均绝对误差(MAE)和平均相对误差(MRE) [22] 的测量,以评估插补效果。
图 8展示了基于 4种插补方法对不同缺失率的插补效果。图 9展示了 4种方法评估指标的直方图。
可以看出,不同数据缺失率下,两点线性插补方法均取得了最低的误差指标,平均 RMSE、平均 MAE
和平均 MRE分别为 0.0012、0.001、0.0012。RF拟合插补在面对不同的缺失率时会呈现不同的插补效
果。这是因为 RF拟合插补的效果很大程度上受结构参数和训练数据量的影响 [23] ,如图 7(b)所示,
较高的缺失率意味着训练数据量减少,导致模型的插补效果变差。线性拟合插补和多项式拟合插补则
表现较为平均,其误差指标相对较小,对于一些钻进位移数据趋势简单、计算要求不高的场景,能够
3
— 1 8 3 —