0 引言
1 算法基本原理
1.1 时域卷积神经网络
1.2 麻雀搜索算法
2 数据收集与处理
2.1 油田数据采集
2.2 数据处理
2.2.1 数据填充与降维
2.2.2 数据整合
2.3 特征参数分析
2.4 油井生产历程划分
2.5 时间滑窗与数据集划分
3 模型结构及评价
3.1 模型结构设计
3.2 麻雀优化算法参数设计
表1 改进的TCN模型超参数SSA寻优结果 |
| 网络层 | 滤波器数量 | 卷积核大小 | 膨胀率 | 作用 |
|---|---|---|---|---|
| 第1层 | 46 | 1 | 1 | 特征提取 |
| 第2层 | 25 | 1 | 1 | 特征提取 |
| 第3层 | 10 | 1 | 1 | 特征提取 |
| 第4层 | 46 | 2 | 1 | 时间信息融合 |
| 第5层 | 125 | 12* | 1 | 时间信息融合 |
注:*模型固定超参数,此处选择输入时间步长 |
3.3 对比模型设计
3.4 模型训练设计
3.5 模型评价
4 应用与讨论
4.1 算法对比
表2 不同模型第13个月预测值的平均绝对误差对比表 |
| 模型 | 阶段模型平均绝对误差/m3 | 全生命周期模型平均绝对误差/m3 | |||||
|---|---|---|---|---|---|---|---|
| 低含水阶段 | 中含水阶段 | 高含水阶段 | 特高含水阶段 | 集成模型 | 单一模型 | ||
| 本文改进的TCN | 23.22 | 17.93 | 13.15 | 19.53 | 17.66 | 20.71 | |
| 对 比 模 型 | CNN-LSTM | 30.86 | 18.89 | 19.84 | 21.44 | 21.39 | 21.60 |
| LSTM | 37.55 | 22.71 | 16.98 | 22.40 | 22.35 | 22.55 | |
| Attention-LSTM(T) | 65.26 | 31.31 | 38.95 | 28.13 | 35.72 | 30.20 | |
| Attention-LSTM(F) | 53.80 | 25.58 | 32.27 | 25.27 | 30.28 | 30.20 | |
| Attention-LSTM(T&F) | 75.77 | 38.00 | 42.78 | 31.95 | 40.79 | 40.71 | |
| Self Attention(F) | 65.26 | 36.09 | 25.58 | 40.55 | 37.63 | 34.02 | |
| Self Attention(T) | 131.19 | 61.89 | 33.22 | 49.15 | 55.12 | 33.06 | |
| Self Attention(T&F) | 139.79 | 92.46 | 30.35 | 44.38 | 59.32 | 34.98 | |
| Self Attention-LSTM(F) | 79.60 | 38.95 | 27.49 | 31.00 | 36.39 | 25.42 | |
| Self Attention-LSTM(T) | 92.97 | 46.60 | 93.42 | 33.86 | 54.18 | 26.38 | |
| Self Attention-LSTM(T&F) | 110.17 | 54.24 | 121.13 | 31.00 | 60.60 | 28.46 | |
注:T—在时间维度添加注意力机制;F—在特征维度添加注意力机制 |
4.2 数据填充校正方法对比
表3 TCN模型采用不同填充校正方法处理的输入样本预测结果对比表 |
| 数据处理方法 | MAE/m3 | MAPE/% | R2 | RMSE/m3 |
|---|---|---|---|---|
| 本文方法 | 23.83 | 5.16 | 0.99 | 63.57 |
| 均值无校正 | 26.13 | 5.42 | 0.98 | 68.10 |
| 均值有校正 | 25.72 | 5.32 | 0.98 | 69.25 |
| 插值有校正 | 24.35 | 5.29 | 0.99 | 64.02 |
注:以12个月的生产数据为输入,预测未来3个月的产量;表中数据为第13个月产油量预测值的误差评价数据 |
4.3 输入步长对比
4.4 模型结构分析
4.4.1 堆叠一维卷积核层进行特征提取的必要性
表4 添加和不添加特征提取层的TCN模型3个预测值的定量评价结果 |
| 方法 | MAE/m3 | MAPE/% | R2 | RMSE/m3 |
|---|---|---|---|---|
| 不添加特征提取层(13) | 26.83 | 5.46 | 0.99 | 60.12 |
| 不添加特征提取层(14) | 39.67 | 6.98 | 0.97 | 86.58 |
| 不添加特征提取层(15) | 52.77 | 11.23 | 0.95 | 112.69 |
| 添加特征提取层(13) | 20.71 | 4.96 | 0.99 | 53.57 |
| 添加特征提取层(14) | 35.80 | 6.31 | 0.97 | 84.31 |
| 添加特征提取层(15) | 49.94 | 10.05 | 0.95 | 111.07 |
注:以12个月的生产数据为输入,预测未来3个月的产量,(13)、(14)、(15)分别为第13个月、第14个月、第15个月的预测月产量 |
4.4.2 因果卷积层输出的选择
表5 因果卷积层不同输出步长对模型预测结果影响 |
| 输出步长 | MAE/m3 | MAPE/% | R2 | RMSE/m3 |
|---|---|---|---|---|
| 全输出 | 20.71 | 4.96 | 0.99 | 53.57 |
| 最后1个月的输出 | 20.81 | 4.97 | 0.99 | 53.59 |
| 最后2个月的输出 | 23.35 | 5.14 | 0.99 | 57.47 |
| 后6个月的输出 | 24.12 | 5.28 | 0.99 | 57.53 |
| 后10个月的输出 | 24.83 | 5.31 | 0.99 | 57.62 |
注:以12个月的生产数据为输入,预测未来3个月的产量 |
4.4.3 激活函数的选择
表6 不同激活函数下TCN模型预测结果对比 |
| 激活函数 | MAE/m3 | MAPE/% | R2 | RMSE/m3 |
|---|---|---|---|---|
| softmax | 23.63 | 5.17 | 0.99 | 57.32 |
| sigmoid | 23.49 | 5.15 | 0.99 | 55.90 |
| softsign | 20.71 | 4.96 | 0.99 | 53.57 |
| relu | 28.87 | 5.73 | 0.98 | 64.18 |
| tanh | 23.13 | 5.12 | 0.99 | 58.10 |
注:以12个月的生产数据为输入,预测未来3个月的产量 |