根据数据类型可将吉木萨尔凹陷页岩油现场数据资料分为3类:地质、工程和生产数据。这些海量数据离散化严重,直接应用困难,建立数据库能够高效管理并调用数据资料,为压裂参数智能优化提供数据基础。测试产量、首年累计产量及单井预测最终可采储量(
EUR)等生产数据通常作为智能模型的优化目标
[3]。地质和工程数据需与优化目标建立复杂的映射关系从而优化压裂工艺
[4]。精准、高效的映射关系能够准确描述压裂工艺与生产效果间的内在关系。近年来,支持向量机、神经网络、随机森林等智能算法相继用于研究压裂工艺与产量间的关系
[5-7]。由于现场数据具有样本少、分布窄、波动大的特点,这些算法的预测能力通常较差
[8]。改善数据质量是提升预测能力的有效途径,使用CMG、Petrel等油藏数值模拟软件不仅能扩充样本数量,还能扩大参数取值范围,解决数据集中的问题
[9-10]。但这些数据在生成时需进行历史拟合,这一主观过程一定程度破坏了压裂参数与目标变量间映射关系的准确性。同时,大量模拟数据的存在降低了预测模型中现场真实数据的权重,建立的预测模型虽然在数据集中具有较高的预测精度,但与现场压裂的实际结果通常存在一定差异
[11]。因此,急需融合领域知识的智能算法来准确描述地质、工程参数与生产能力间的复杂映射关系。遗传算法、粒子群算法等元启发式智能算法由于不需要明确的目标函数
[12-13],被广泛用于压裂参数优化,但这些常规优化算法存在全局搜索能力差和易陷入局部最优的缺点,容易导致错过理想的压裂参数。同时,这些算法对于压裂中多维问题的优化效果较差。为解决这些难题,研究者引入特征重要性和主成分分析对其进行降维处理
[14-15],但降维后的参数变量牺牲了数据精度且可解释性差。保持压裂效果预测模型的多维特征参数,自适应平衡优化算法在迭代过程中的搜索能力和开发能力对于实现压裂参数多维优化至关重要。