北极圈内收数据,圣诞老人不知情:AI油气勘探应用
坐標,美國阿拉斯加,北極圈。
一架白色小型飛機穿過湍急的強風,在白皚皚的積雪中穩(wěn)穩(wěn)著陸。李成博博士欣賞著窗外熟悉的景色,冰封的世界,像極了他的老家中國東北。雪景怡人,但旅程卻頗為周折,為了到達目的地,他需要頂風冒雪轉(zhuǎn)飛機四次。最后一程還是小型螺旋槳飛機,因為它能在冰上直接降落。安全降落后,他才發(fā)現(xiàn),著陸地點是在一個冰湖上。
這樣的到訪已經(jīng)三次,每次的任務(wù)都和收集數(shù)據(jù)有關(guān),而又不僅僅是收集數(shù)據(jù)。一位數(shù)據(jù)科學家為什么要到這極寒之地?這和“壓縮感知地震采集技術(shù)(CSI)”有著莫大的關(guān)系。
CSI技術(shù)是地震數(shù)據(jù)獲取技術(shù)上的一個突破,它使人類可以在短時間內(nèi)收集海量地震數(shù)據(jù),并數(shù)據(jù)質(zhì)量較高,為下一步機器學習提供基礎(chǔ)。更進一步地說,這一技術(shù)的出現(xiàn),很好地解決了油氣行業(yè)三維地震數(shù)據(jù)采集成本高、耗時長的難題。CSI能夠在同等成本的條件下,成倍提高數(shù)據(jù)采集的效率和質(zhì)量,為下一步大數(shù)據(jù)與人工智能提供基礎(chǔ),目前是美國康菲石油公司(ConocoPhillips)所有的專利技術(shù)。最終目的是提取地下有效信息。有了有效信息,就好比有了地下情況說明書。而需要強調(diào)的是,這里的地震是人為的,人為產(chǎn)生震動,再用“聽診器”獲得地下的健康狀況。
作為CSI技術(shù)的核心研發(fā)人員,李成博博士向《親愛的數(shù)據(jù)》主編譚婧介紹了自己的求學與研究經(jīng)歷。2011年他從美國萊斯大學畢業(yè),獲得了計算和應(yīng)用數(shù)學博士。畢業(yè)當年,他加入美國康菲石油公司,擔任總部高級地球物理學家。他說,選擇加入美國康菲石油,也是和開發(fā)壓縮感知地震采集技術(shù)技術(shù)有關(guān)。
近幾年,他的工作聚焦在地球物理應(yīng)用的壓縮感知技術(shù),包括地震數(shù)據(jù)采集最優(yōu)化設(shè)計和成像。數(shù)據(jù)既來自陸地,也來自海洋。現(xiàn)在,他負責開發(fā)用于地震處理的機器學習解決方案。他與研究伙伴合作發(fā)明了——壓縮感知地震采集技術(shù)。2016年,他獲“創(chuàng)新精神獎”。2018年,獲“科技優(yōu)勝者獎”、“亞洲OTC新技術(shù)聚焦獎”。2017年,他和合作者的論文《Operational deployment ofcompressive sensing systems forseismic data acquisition》被選為國際知名雜志《the Leading Edge》的當年最佳論文。2019年,他獲得了“杰出科研技術(shù)人員精神成就獎”。
雖然榮譽滿滿,但是這位優(yōu)秀的青年科學家身上低調(diào)、嚴謹?shù)奶刭|(zhì)非常突出。
地球物理數(shù)據(jù)采集環(huán)境往往是非常特殊的自然環(huán)境,除了愛好冒險和向往極致自然景觀的探險者,普通人很難有這份兒體驗。
“不允許留下任何人為的痕跡。車輛如果滲油,那么就得連同冰與雪一起回收起來。對任何表面有植被的地方,決不允許人員與車輛進入。”他說,“做地震數(shù)據(jù)采集的項目面臨的挑戰(zhàn)實質(zhì)上有兩個,一個是極端惡劣環(huán)境,一個是環(huán)境保護的良心。”
“夏天的時候不能有任何活動,只有在冬季的時候,整個地表全部都凍起來,形成凍層之后,才會被允許進行地質(zhì)勘探活動。”由于辦公場地的特殊性,李博士的工作時間比普通人更加受限。
北極圈附近的氣候異常極端,人們會誤解該地區(qū)很難遭到人為的環(huán)保破壞。然而,該地區(qū)的生態(tài)環(huán)境卻非常的脆弱。作為到訪北極圈的科研工作者,他對“環(huán)境保護”理解非常深刻。既要考慮科研目的,也確保人類的任何活動都要保護當?shù)丨h(huán)境。從一開始,環(huán)保就是擺在科研優(yōu)先性前面的原則。
“可以被允許工作的時間段,不超過四個月。”李成博博士第一次踏上北極圈的雪地是在2015年的2月份。
眾所周知,在北極圈工作,將面臨嚴酷的工作環(huán)境。作為一個東北小伙,李成博對“抗凍”很有信心,然而,極端環(huán)境還是超乎他的想象。“采集數(shù)據(jù)時的溫度,也就零下三十多度吧,起風后,零下三十五度左右。女生(體重)輕一點站都站不穩(wěn)。”天氣冷,時間短,任務(wù)重,是三個難點,但是有趣的一點是,他們在圣誕老人家附近“上班”。
一、CSI技術(shù)的核心是什么?
可能連圣誕老人也不知道,數(shù)據(jù)科學家們正在進行著一項無比精細、復(fù)雜而宏大工程。這是一種模擬地震波傳播的方法,采用可控震源。通過震源持續(xù)震動,向下傳播的波遇到地下不同的巖層反射回地面接收信號的方式來進行勘探。由于可控震源振幅擾動較小,對生態(tài)環(huán)境非常友好。
值得讓人興奮的是,開發(fā)新的地震數(shù)據(jù)采集技術(shù)是一項前沿性挑戰(zhàn)。也就是說,接收到的信號,經(jīng)過數(shù)據(jù)中心的數(shù)字處理和地質(zhì)解釋,其成果成為判斷地下情況的重要依據(jù)。
李博士介紹,“簡單來說方法是,在地表放置檢波器和震源。通過某點激發(fā)一個震源,向地下傳波。遇到某一個比較強的反射層的時候,能量會通過強反射,反射回地表。這樣在地表就得到了一個響應(yīng)的效果,接受到信號。通過一組震源和一組檢波器,就可以采集到一個數(shù)據(jù)體。
在數(shù)據(jù)采集的時候,有上萬個檢波器同時工作。就形成了一個所謂的五維的數(shù)據(jù)體,進行地下情況的刻畫。說到底,這些接收到的信號,經(jīng)過數(shù)據(jù)處理和地質(zhì)解釋,其結(jié)果會成為判斷海底地質(zhì)結(jié)構(gòu)的重要依據(jù)。CSI技術(shù)的核心就是,如何最優(yōu)的放置這些檢波器點和震源點,在最小的代價下,最大化獲得地下信息。”
因為這項技術(shù)對自然環(huán)境的影響較小,所以得到了州政府的支持,否則,在圣誕老人的家門口人為的搞“小型地震”,他老人家未必愿意。
二、數(shù)據(jù)越來越受重視,數(shù)據(jù)獲取技術(shù)也在進步
經(jīng)過幾年艱苦的研發(fā),陸地上的第一次大規(guī)模實施,就是在阿拉斯加。所以,2015年的2月,即是李成博的第一次,也是該項技術(shù)落地實施的第一次。
李博士說,“作為主要的技術(shù)研發(fā)人員,到作業(yè)現(xiàn)場做調(diào)整是必須的。”新技術(shù)實施后,他收到了雙份的驚喜。
第一個是地震數(shù)據(jù)收集效率得到很大的提高,五到十倍的增長。
第二個驚喜則是這項采集工作進一步減少了采集工作對自然環(huán)境的影響,尤其是減少了對極地環(huán)境的人類腳印。對于這兩項成績,康菲公司內(nèi)部非常的振奮。
美國康菲石油公司除了與中國油氣行業(yè)的合作發(fā)展已經(jīng)超過三十七年,是中國油氣上游領(lǐng)域的重要外國投資商和生產(chǎn)商之外,非常有意思的一點是,康菲石油首席技術(shù)官Gregory P. Leveille在《中國能源報》的采訪中公開表示,“就大數(shù)據(jù)應(yīng)用方面,康菲石油主張讓專家和員工都進行實際操作,以提高工作效率。
目前,康菲石油1.1萬名員工中有4000名都可以接觸,并使用數(shù)據(jù)庫以及相關(guān)數(shù)據(jù)分析工具。”
他強調(diào),“一方面,不斷追求高端人工智能技術(shù)的研發(fā),同時鼓勵和敦促員工學習和應(yīng)用機器自動化;另一方面,將大數(shù)據(jù)技術(shù)適用于整條產(chǎn)業(yè)鏈,從鉆井到運營再到倉庫管理等所有領(lǐng)域。”
在另外一家外媒的采訪中,這位首席技術(shù)官還強調(diào),“石油和天然氣行業(yè)的發(fā)展方式日益要求員工利用前沿的數(shù)據(jù)分析技能。”
不得不說,數(shù)據(jù)驅(qū)動型文化正在全球領(lǐng)先的石油公司根植。
三、地球物理中,獲取數(shù)據(jù)有何“不易”?
李博士說,油氣勘探的技術(shù)正在不斷進化,行業(yè)的數(shù)據(jù)采集工作有兩個特點,
第一個是采集到的數(shù)據(jù)量巨大,
第二個是數(shù)據(jù)采集成本非常高昂。
他對“數(shù)據(jù)量的飛漲”進行了專門地強調(diào)。在采集地震數(shù)據(jù)的時候,數(shù)據(jù)量大概有多大呢?在一次數(shù)據(jù)采集周期,兩到三個月可以在陸地上可以采到Petabytes單位的數(shù)據(jù)量。數(shù)據(jù)已成為石氣勘探的重要資產(chǎn),數(shù)據(jù)在驅(qū)動油氣勘探技術(shù)創(chuàng)新。
李博士強調(diào),“采集地震數(shù)據(jù)量是巨大的,海量的,無論你用什么方法,必須要在海量的數(shù)據(jù)上有一個魯棒的表現(xiàn)。”
因為昂貴,所以省錢非常重要。
地震數(shù)據(jù)采集項目是非常花錢的工作,基本都是上億元人民幣起步。但是,如此巨資投入的情況下,數(shù)據(jù)的狀況還未必理想。一方面,利用地表的數(shù)據(jù),來刻畫地下的信息,并不是直接獲得數(shù)據(jù)的方式。另一方面,采集數(shù)據(jù)的時候,地表的情況也不容樂觀。以阿拉斯加北極圈內(nèi)的采集項目為例,地表經(jīng)常有非常嚴重的風噪音。因為采集到的數(shù)據(jù)的情況差,必須用一些技術(shù)手段把弱信號還原,包括機器學習的方法。
李博士說,“壓縮感知地震采集技術(shù),對解決采集成本高的難題有很大的幫助,可以通過一些不規(guī)則的采點方式收集地震數(shù)據(jù),在降低采集成本,及不受特定限制區(qū)域影響的同時,大大提高采集效率和成像分辨率。”
四、機器學習應(yīng)用的“難點”
“如何通過機器學習的方法把弱信號恢復(fù)過來?”對于這個問題,李博士這樣回答,“在一個弱信號、強噪音的情況下,處理這個問題的方法并不是技術(shù)發(fā)展到今天才出現(xiàn)的。過去幾十年,整個勘探地震學已經(jīng)想出了很多解決辦法,比如通過建立模型把信號提取出來。”
“這種方法在大多數(shù)的情況下(效果)還可以。如果只強調(diào)把比較強的信號提取出來的話,困難并不大。難度在于,如何能夠把最后的20%的非常弱的信號提取出來,這是地震處理中比較大的問題。在地震行業(yè),是沒有標注的數(shù)據(jù)。地震數(shù)據(jù)處理中,沒有辦法對海量的數(shù)據(jù)進行監(jiān)督學習技術(shù)處理,所以要用無監(jiān)督學習的方法來進行工作。
有一點很重要,在處理這些數(shù)據(jù)的時候,有很多經(jīng)典的、模型驅(qū)動的方法。應(yīng)該充分利用這些樣本,不是說有了機器學習技術(shù),其他的就不需要了。所以,第一步,我們需要在一個樣本中選取一個方法,建立一個合適的模型。比如說這個信號大致長什么樣子,可以把它估計出來。”
“利用一些傳統(tǒng)的方法把信號大致估計出來之后,雖然并不能做到百分之百,但是百分之五十非常迅速地可以做到。然后,通過深度學習的方法,確認這個地震信號到底在哪里?這個信號到底長什么樣?通過已有樣本,反演弱信號,高噪音情況下的反應(yīng)。一部分是信號,一部分是噪音,噪音是什么呢?噪音在我們看來也是信號。所以在工作的過程中,我們發(fā)現(xiàn)把噪音當成信號來處理,對于‘去噪’效果非常,把噪音和信號進行同步處理。說到底,機器學習在這個過程中起到了一個橋梁作用,將基于物理,數(shù)學的傳統(tǒng)方法和人工智能聯(lián)系起來”
同樣的觀點,也來自于全球領(lǐng)先的信息數(shù)據(jù)分析公司,愛思唯爾(Elsevier)的高級數(shù)據(jù)科學家沈澄,久居倫敦工作的他在英國天然氣勘探公司有著豐富的項目經(jīng)驗。他這樣告訴《親愛的數(shù)據(jù)》,打一個比喻,挑西瓜的時候,人們通過拍打西瓜聽聲音,推測西瓜是否成熟。在石油天然氣勘探領(lǐng)域,人們在地底下安裝很多震動的信號器,然后收集反射回來的聲波、頻率等信號。就好比能收集到很多很多個敲打西瓜的聲音。傳感器收集到的信息,作為深度學習輸入的數(shù)據(jù),從而得到石油儲量信息。
深度學習技術(shù)對于地球物理領(lǐng)域,有一個比較正面的影響,或者說,就是說一個比較大的作用就是,其實噪音里面包含了很多信息,以前沒有辦法從“噪聲”里找到的信息,這是我們沒有辦法,用好這個信息。現(xiàn)在這項技術(shù)能夠從“噪聲”中“榨取”更多有用的信息。
在地球物理領(lǐng)域,還有另一個難點。采樣率是比較低的。在使用機器學習技術(shù)分析圖像時,用低分辨率的照片來進行機器學習和高分辨率的照片進行機器學習,這是有很大很大的區(qū)別的。現(xiàn)在大家可以輕松地獲得高分辨率,比如,兩千像素乘兩千像素。在地球物理領(lǐng)域,幾十米的分辨率已經(jīng)很高了。畢竟是從地底下上萬米采集來的數(shù)據(jù)。
這種基于無監(jiān)督學習和反演強噪聲殘留地震信號恢復(fù)方法,可以應(yīng)用于不同領(lǐng)域和不同階段,以提高地震處理的質(zhì)量和效率。實測數(shù)據(jù)表明,該方法能夠較好地恢復(fù)40分貝以下噪聲里的微弱信號,或者從復(fù)雜的數(shù)據(jù)(儲集層、巖石)中提取特征。將機器學習與傳統(tǒng)方法相結(jié)合,成為解決地下問題提供了強有力的手段。
李博士強調(diào),“人工智能在油氣勘探領(lǐng)域已經(jīng)開始陸續(xù)應(yīng)用,曾經(jīng)需要幾十個人處理幾個月的數(shù)據(jù),用神經(jīng)網(wǎng)絡(luò)和人工智能的訓(xùn)練算法去處理,效率和有效性兩方面都有很大提高。”
最后,李博士補充道,在油氣領(lǐng)域,大數(shù)據(jù)與人工智能技術(shù)還可以用在很多環(huán)節(jié)。比如鉆井活動,可以通過大數(shù)據(jù)對老齡化油氣田進行分析和評估,盡可能延長其壽命。同時,還將其應(yīng)用于新井鉆探和開發(fā)。每一年,全球大型石油公司都會打很多井,大數(shù)據(jù)技術(shù)不僅有助于提高效率、減少支出,還能夠減少生產(chǎn)活動的作業(yè)面積,即有益于生態(tài)環(huán)境,又提高了工作的安全和可持續(xù)性。
歡脫的雪橇犬在雪地里留下一排小腳印,狐貍與駝鹿在樹林里捉迷藏,星星在深藍色的天空里眨眼,極光閃耀空中,北極大地平靜而廣袤,環(huán)境與未來在連接,新技術(shù)與古老能源在融合,人類探索自然與科技發(fā)展永不止步。
(完)
總結(jié)
以上是生活随笔為你收集整理的北极圈内收数据,圣诞老人不知情:AI油气勘探应用的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Mozilla 开启新实验 Firefo
- 下一篇: 陆奇:中国仍有很多创业机会 美国长不出美