科研进展

科研进展

Marine and Petroleum Geology |通过先进岩心数据增强技术提高储层参数预测的工作流

作者:罗歆,孙建孟 审核人: 责任编辑: 发布时间:2025-09-30 浏览次数:10

依赖岩心数据作为数据集标签的机器学习模型已成为预测储层参数的主流方法。然而,与岩心数据采集相关的高成本和空间采样密度不足往往导致这些模型的非线性表示较弱、泛化能力差和过度拟合。为了应对有限的岩心数据挑战,我们提出了一种可靠性分析驱动的工作流程,该工作流程优化选择多种岩心数据增强方法来增强储层参数预测(图1)。进而,为增强油气勘探小样本储层参数预测提供了可复现框架,进而证明合成数据增强能够有效缓解数据稀缺性,为地球物理数据分析提供一种借鉴思路。

图1通过数据增强提高储层参数预测的工作流

增强后数据集的可靠性是研究人员关心的问题,该工作的创新之处在于提出的工作流对多种前沿岩心数据增强技术进行了不同规模合成数据的可靠性分析(图2,3)。其次,该工作流将数据增强算法分别与机器学习、预训练语言模型集成在一起,通过开发和应用增强预测模型的多种组合,来实现实例井中的岩性分类和物性参数预测。

图2小规模合成数据下不同岩性类别特征分布


图3大规模合成数据下与原始数据集的特征分布

可靠性分析结果表明,岩心数据增强中的表格变分自编码器(TVAE)、增量表格变分自编码器(DeltaVAE)和表格去噪扩散概率模型(TabDDPM)为小尺度数据集生成了高质量的合成输出。对于大规模数据生成,预训练的大语言模型(GReaT 和TabPFGen)表现出强大的潜在性能。在应用效果方面,在各种岩心数据增强-机器学习模型组合中,TabDDPM-TabPFN表现优越的潜在性能。分别在岩性分类、孔隙度、渗透率预测方面,TabDDPM-TabPFN取得最好的应用效果(图4)。在未来的研究中,我们旨在探索该工作流程在更复杂油藏中的适用性,并将岩心数据增强与物理模型相结合,以进一步增强合成数据集的可靠性。

图4 不同岩心数据增强-机器学习模型组合下孔隙度预测结果

研究成果发表在地球物理领域国际重要期刊Marine and Petroleum Geology上,论文第一与通讯作者为437必赢会员中心博士生罗歆,其博士生导师为孙建孟教授,合作者包括中石化经纬有限公司的慈兴华、437必赢会员中心的迟蓬和崔瑞康,深层油气全国重点实验室为第一署名单位。受国家自然科学基金(No.42474156)、437必赢会员中心研究生创新基金项目和“中央高校基本科研业务费专项资金”(No.25CX04045A)资助。

论文信息:Luo Xin, Ci Xing-hua, Sun Jian-meng, et al. Enhancing Reservoir Parameter Prediction Workflows via Advanced Core Data Augmentation. Marine and Petroleum Geology, 2025: 107605. Doi: https://doi.org/10.1016/j.marpetgeo.2025.107605.