Page 117 - 2024年第55卷第11期
P. 117

一个值相同的数据点,同时标记此类钻进段。
                  为更好利用各异常钻进过程的数据特征,表 1给出了相应识别准则和处理方法。

















                                                      图 6 尾部平台段
                                             表 1 异常钻进过程数据识别和处理方法

                异常钻进过程                 典型特征                          识别准则                     处理方式
                过短钻进段       钻进时间缩短,无法达到预期钻进距离             阈值设定方法                           删除此类钻进过程
                            连续时间区 间 内,数 据 的 分 布 或 特 征 发
                数据漂移段                                     钻进速度>0.01mm?min               删除并重新插补相关数据
                            生显著变化
                                                          从末尾反向 遍 历 钻 进 位 移,标 记 末 尾 值
                尾部平台段       钻进位移长时间停滞在某个位置                                                  删除相关数据
                                                          小于 0.5m钻进

              3.3 钻进数据缺失插补 采取在正常钻进位移数据上手动设置缺失值的实验方法,对比分析两点线性
              插补、线性拟合插补、多项式拟合插补以及 RF拟合插补                          [21] 4种方法的插补效果。其中,两点线性插
              补是根据钻进位移特征提出的一种新方法,即通过连接两个已知坐标点的直线来预测中间缺失段,实
              现缺失段数据插补,可实现较高的精度和运算速度。
                  ( 1)数据缺失试验设置:首先,从钻进时间超过 1000s的区间中随机选取一段。接着,从选定的
              钻进区间中移除中间连续 200s数据,被移除的数据将作为后续进行数据插补的目标。具体的数据缺
              失设置示意图见图 7。这两个案例中,案例 1的数据缺失率为 6.7%,案例 2的数据缺失率为 17.1%。
















                                                     图 7 数据缺失示意图

                  (2)插补效果评价:通过对原始钻进位移数据和插补后的钻进位移数据进行均方根误差(RMSE)、
              平均绝对误差(MAE)和平均相对误差(MRE)                  [22] 的测量,以评估插补效果。
                  图 8展示了基于 4种插补方法对不同缺失率的插补效果。图 9展示了 4种方法评估指标的直方图。
              可以看出,不同数据缺失率下,两点线性插补方法均取得了最低的误差指标,平均 RMSE、平均 MAE
              和平均 MRE分别为 0.0012、0.001、0.0012。RF拟合插补在面对不同的缺失率时会呈现不同的插补效
              果。这是因为 RF拟合插补的效果很大程度上受结构参数和训练数据量的影响                                      [23] ,如图 7(b)所示,
              较高的缺失率意味着训练数据量减少,导致模型的插补效果变差。线性拟合插补和多项式拟合插补则
              表现较为平均,其误差指标相对较小,对于一些钻进位移数据趋势简单、计算要求不高的场景,能够

                                                                                                   3
                                                                                              —   1 8 3 —
   112   113   114   115   116   117   118   119   120   121   122