石油和天然气中的信息提取 - 使用AI找到油

迪伦Azulay
《阿凡达》

迪伦是Emerj金融服务的高级分析师,研究银行、保险和财富管理领域的人工智能用例。

油气信息提取——利用人工智能寻找石油

石油和天然气公司面临许多相同的挑战银行并建立保险公司在搜索他们积压的文件时。他们希望使用存储在这些文档中的数据来做出决策来钻取,并确定是否符合法律法规。

困难在于许多文件都是以物理格式存储的:纸张、物理地图、磁带。石油和天然气公司非常习惯于使用这些物理格式,这就给将现代技术集成到工作流程带来了一些挑战。

预测分析应用程序和类似的人工智能解决方案需要大量有组织的数字数据,以便为油气公司产生洞察和驱动价值。瑞士比利时盘口

例如,有许多AI供应商提供预见性维护对石油和天然气公司的申请具体。这些申请承诺提醒当需要修理时的机器或设备时对石油钻井平台和炼油厂的人员提醒人员。

通过这种方式,维修人员可以在机器或设备发生故障、导致产量大幅下降或严重伤害之前进行修复,而这可能会让油气公司付出数百万美元的法律费用和罚款,同时也会对其声誉造成严重打击。

如果石油和天然气公司要将机器和设备的损坏情况、停机时间和维修频率以物理记录的形式保存在维修人员的办公桌上,那么他们将在预见性维护应用程序的初始设置上花费更多的时间。

石油和天然气公司的数字化纸质文件

为了克服这一挑战,并为未来几年的人工智能应用做好准备,石油和天然气公司可能会受益于基于人工智能的文档数字化软件。文档数字化软件通常涉及机器视觉,这是一种让计算机“理解”数字图像或视频内容的人工智能方法。

因此,石油和天然气公司的员工将能够扫描他们的物理文件和笔记,并将它们以pdf或jpg的形式上传。然后,文档数字化软件可以将这些文件中的字母转录成输入文本,填充到字处理器或数字形式。

一旦文档被数字化,油气公司就可以通过解决方案从这些文档中提取信息和见解,与预测性维护应用相比,这些解决方案的资源集成度要低得多。瑞士比利时盘口

铁山是一家AI供应商,提供石油和天然气公司的文件数字化和信息提取软件,其后者在自然语言处理(NLP)算法上运行。

我们谈到了Anke Conzelmann他谈到了基于人工智能的信息提取和文档搜索在石油和天然气行业中的应用。在本文中,我们讨论了石油和天然气中基于人工智能的文档数字化和信息抽取的几个用例,如石油位置和合同管理。

有关II的更多信息,用于石油和天然气中的信息提取,下载铁山的白皮书主题

为寻找石油而进行的信息提取

根据Conzelmann:

地球科学家正在寻找地理位置数据,这样他们就可以通过地理位置来访问它。(使用AI),玩家可以指向地图上的一个点,点击即可获得与该位置相关的所有资产,而不考虑信息的类型或格式

石油和天然气公司的地球科学家花了很多时间通过过去的钻探和井的日志数据和地震数据来辨别出来的地方,在那里他们可能会发现更多的油和它可能所在的岩石的结构。这项工作是耗时的,涉及各种地球科学专家,其时间有限。

在许多情况下,这些地质学家被留下来假设他们有他们需要决定在哪里进行地震测试或钻取的所有信息和数据。

他们将搜索以不同格式存储在不同地点的实体文档和数字文档,这些文档通常杂乱无章。

如果一家石油和天然气公司能够将这些数据完全数字化,并将其转化为一个可搜索的数字数据库,不仅可以在每次研究过程中节省数十万美元,还可以通过更快地发现新油田来增加实际收入。

基于自然语言处理和机器视觉的搜索功能可以使这成为可能。在这些文件被数字化并组织到数字数据库之后,基于人工智能的信息提取软件可以帮助地质科学家根据油气公司可以访问的过去的地理位置数据找到新的钻井位置。

自然语言处理

例如,地质学家可能希望从特定位置快速审查所有井数据,以便确定附近是否存在类似地质的区域可能包含更多的油。目前,地质学家需要搜索个人文件,都是物理和数字,并且有时会根据位置本身组织它们。他们不知道他们是否收集了公司对此特定良好的所有文件。

此外,它们可能需要收集存储在Web和公共数据库的各个位置的位置上的公共数据。利用基于NLP的信息提取软件,地质学家可以在数据库中搜索,并在公共数据库中搜索所有文档和/或与特定地理位置相关的信息。

根据集成的广度,软件可以能够在特定时间段内搜索更多粒度信息,在这些文档或数据中的特定类型的数据。

从理论上讲,地质科学家可以在搜索功能中输入“X井区域内和Y井类似地质结构附近的井的性能数据”,软件就会提取出所需的数据。

石油和天然气工业中的NLP采用挑战

也就是说,建立一种自然语言处理算法的石油和天然气工业的挑战,主要是由于行业在其中没有发现了许多特定的术语。因此,如果石油和天然气公司的专业员工打算将它们用于搜索,则需要在行业中使用的NLP算法“了解”这些单词和短语。

石油和天然气公司要么需要确保他们的主题专家可以说出我们所谓的“数据科学语言”,以便他们可以向内部数据科学家传达,其中一个有用的NLP算法在其行业中可能看起来像什么。

或者,该公司可以与AI供应商合作,只要供应商在石油和天然气行业工作的强大经验。如果他们这样做,他们自己的数据科学家可能会与公司的主题专家“谈谈”。然后,它们可以协作并建立一个有用的NLP算法,允许公司员工搜索有关他们定期在工作中使用的单词和短语的信息。

在某些情况下,向油气行业提供信息提取软件的人工智能供应商将“经过预先培训”。换句话说,在算法启动之前,供应商的数据科学家可能只需要根据客户公司主题专家的少量反馈稍微调整算法。

机器视觉

机器愿景还可以帮助地质学家加快他们采取的时间来收集他们想要分析的信息,并最终需要决定钻井的地方。石油和天然气公司当然希望他们的地球科学家找到尽可能多的石油水库,因为它们可以在竞争对手面前,而机器愿景可以让他们更可靠地选择石油丰富的地区,而不是传统方式更可靠地钻探。

地球科学家可能会遇到地质入侵的图像,或过去曾导致地下丰富的油藏的地震仪。

具有机器视觉功能的基于AI的搜索功能可能允许地形分子搜索类似于他们发现的图像的图像,指示富含储物液。因此,他们可以发现他们以前忽视的新钻井地点或者公司拥有但尚未探索。

地震胶带

一个多世纪以来,石油和天然气公司一直在探索地球的地下。因此,它们有数万亿的数据点存储在各种不同的数据存储单元上。

其中之一是地震数据磁带,其中从石油和天然气公司进行的调查中储存地震录音,以确定地理定位是否可能留出油。铁山声称他们可以在完全退化之前将这些磁带的录音转移到数字格式,并且它们可以将它们添加到公司可搜索的数据库中。

因此,Geoscientists可以使用40年前与机器视觉功能的信息提取软件从40年来开始,以更好地通知推荐他们的公司练习的地方。

协调来自不同来源的元数据

元数据或描述其他数据的数据是在许多情况下,用于开发基于NLP的搜索功能,因为它通常将数据放入从搜索查询中完善结果的隐式类别。

换句话说,许多情况下基于NLP的文档搜索软件使用元数据来组织文档和其中内容的信息,从而加速了石油和天然气公司的地球科学家和其他员工的搜索过程。

例如,高性能井的物理位置是一个数据点,但存在数百万的理论数据点,可以描述物理位置:关于其地质的数据,购买它的实体以及其地震活动的数据,以及其地震活动其他。

这些信息对地质科学家来说至关重要,因为他们可以对石油和天然气公司的钻探地点做出明智的建议。

然而,这些元数据通常存储在不同的位置,包括在石油和天然气公司的文档中(包括数字的和物理的)。根据Conzelmann:

已经提供了元数据。与数字化内容同步到同步是很重要的。能够在现有元数据旁边采取我们从ML的透视中生成的东西,并且能够在它们之间创建关系的关系是能够实现那些地球化学家找到所有这些东西并花费大部分时间分析而不是找到所需的信息。

元数据通常也可以从第三方数据供应商购买,或者从公共数据库免费获得。后者通常是石油和天然气公司最近可能购买的特定资产的情况。

创建一个用于运行基于nlp的信息提取软件的数据库,需要使用所有这些元数据来标记公司资产,为了AI用例的目的,将元数据组合在一个位置,这个过程称为数据协调。

Integrating an AI solution like Iron Mountain’s would require a harmonization between the oil and gas company’s existing metadata, which they may not currently be aware of, metadata from purchases, and public metadata before any machine learning algorithm would be able to generate insights about a given property, well, or other asset, for example.

底线 - 什么石油和天然气公司需要知道

Conzelmann通过石油和天然气公司的地球科学工作来到了一个关键问题的核心:地球科学家(以及雇用他们的公司)宁愿花时间分析井和地震数据,以便在钻头做出决定;他们不希望他们的大部分工作日都要去寻找他们想要分析的信息。

很少有人工智能供应商专门为油气行业服务,许多供应商都提供预测分析软件,这必然需要大量的数字化数据。在开始漫长的人工智能项目之前,石油和天然气公司可能首先想要把他们的纸质文件、磁带和其他物理数据存储单元数字化。

这样一来,他们就有更好的机会避免这样一种情况:他们雇佣了几个数据科学家,这些数据科学家在开发过程的不同阶段去找相关领域的专家,询问他们在哪里可以找到公司根本没有的数字数据。

与此同时,油气公司需要通过数据科学家和相关领域专家的合作来决定哪些文档需要数字化。然而,在数字化之后,石油和天然气公司可能希望与提供NLP和机器视觉搜索软件的人工智能供应商合作。

Conzelmann简洁地阐述了基于人工智能的搜索应用的潜在价值:

机器学习和人工智能的强大之处在于,你可以大规模地处理数百万个文档,即使你处理的是完全不同的、外观不同的内容。

信息提取软件可以帮助石油和天然气公司节省地球科学劳动力成本,并以较高绩效的油井的形式推动新的收入。

本文由铁山赞助,并在与我们的透明方面进行了编写,编辑和公布Emerj赞助的内容指南。了解更多关于触及我们的人工智能关注的高管观众Emerj广告页面

标题图像信用:Star.kiwi

保持AI曲线的领先地位

发现在未来商业中区分赢家和输家的关键AI趋势和应用。

注册“AI Advantage”时事通讯:

" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Thanks - check your inbox for a confirmation email">
" data-trigger="manual" data-title="Notice" data-placement="bottom" data-content="Error - There was some problem.">
订阅
订阅镜像
保持领先于机器学习曲线

加入超过20,000名以上的可调性的商业领袖,并收到每周提供的最新的AI研究和趋势。

感谢您订阅Emerj的“人工智能优势”通讯,请查看您的电子邮件收件箱确认。