礦床統(tǒng)計預測講義_第1頁
礦床統(tǒng)計預測講義_第2頁
礦床統(tǒng)計預測講義_第3頁
礦床統(tǒng)計預測講義_第4頁
礦床統(tǒng)計預測講義_第5頁
已閱讀5頁,還剩198頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

礦床統(tǒng)計預測資源勘查工程專業(yè)本科必修課程40學時(32+8)中國地質(zhì)大學(武漢)資源學院張振飛2012.11-2013.1第一頁,共二百零三頁。內(nèi)容1緒論2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征3礦床統(tǒng)計預測的基本理論方法4地質(zhì)變量5找礦信息量計算法6秩相關(guān)分析法7證據(jù)權(quán)法8回歸分析法9判別分析法10聚類分析法11特征分析法12地質(zhì)因素的因子分析13資源潛力估計14總結(jié)第二頁,共二百零三頁。成礦預測,是分析區(qū)域地質(zhì)背景,研究成礦規(guī)律,劃分成礦區(qū)帶,建立區(qū)域成礦模式或礦床模型,進行類比,圈定不同類別的遠景區(qū),預測不同級別的資源量,并提出地質(zhì)找礦工作部署建議的工作。(《固體礦產(chǎn)成礦預測基本要求》1990)1緒論礦床統(tǒng)計預測,是運用數(shù)學地質(zhì)的理論和方法進行礦產(chǎn)預測的科學和技術(shù)。1.1礦床統(tǒng)計預測有關(guān)的一些基本概念“礦產(chǎn)預測”較之“成礦預測”,對預測中地質(zhì)學研究有所淡化,概念的內(nèi)涵減少,故外延有所擴大。礦產(chǎn)預測與大家熟知的成礦預測幾乎是同義詞。第三頁,共二百零三頁。找礦遠景區(qū)、預測區(qū)、預測段、找礦靶區(qū)經(jīng)成礦預測工作所圈定的找礦有利地段稱找礦遠景區(qū);根據(jù)成礦條件有利程度、預測依據(jù)的充分程度、找礦標志的明顯程度、資源潛力大小以及開采條件,遠景區(qū)一般可分為A、B、C三類。成礦預測工作種類不同,遠景區(qū)有不同的尺度,可靠性和精度也有差別,故各有不同的名稱:名稱: 精度 遠景區(qū)尺度量級(粗略)預測區(qū)比例尺1/10萬幾十——200km2預測段比例尺為1/5萬<20km2找礦靶區(qū)比例尺1/2.5萬<2km2

1緒論1.1礦床統(tǒng)計預測有關(guān)的一些基本概念第四頁,共二百零三頁。資源量是指經(jīng)成礦預測或勘查工作所計算或估計的礦產(chǎn)資源的數(shù)量。根據(jù)地質(zhì)可靠程度和經(jīng)濟技術(shù)可行性,資源量分不同的級別??煽砍潭容^高、經(jīng)濟意義較大的資源量是儲量。1緒論1.1礦床統(tǒng)計預測有關(guān)的一些基本概念

查明礦產(chǎn)資源潛在礦產(chǎn)資源探明的控制的推斷的預測的經(jīng)濟的可采儲量(111)基礎(chǔ)儲量(111b)預可采儲量(121)預可采儲量(122)基礎(chǔ)儲量(121b)基礎(chǔ)儲量(122b)邊際經(jīng)濟的基礎(chǔ)儲量(2M11)基礎(chǔ)儲量(2M21)基礎(chǔ)儲量(2M22)次邊際經(jīng)濟的資源量(2S11)資源量(2S21)資源量(2S22)內(nèi)蘊經(jīng)濟的資源量(331)資源量(332)資源量(333)資源量(334)地質(zhì)可靠性經(jīng)濟意義我國現(xiàn)行礦產(chǎn)資源量(儲量)分級方案第五頁,共二百零三頁。數(shù)學地質(zhì),是地質(zhì)學的一個分支學科,是研究地質(zhì)體、地質(zhì)現(xiàn)象、地質(zhì)作用、地質(zhì)工作方法的最優(yōu)數(shù)學模型的科學。是以解決地質(zhì)問題為目標和出發(fā)點,以數(shù)學為工具,以計算機為手段,研究客觀世界規(guī)律性的科學。1緒論1.1礦床統(tǒng)計預測有關(guān)的一些基本概念根據(jù)前面“礦床統(tǒng)計預測”的定義可知,礦床統(tǒng)計預測是數(shù)學地質(zhì)理論方法在礦產(chǎn)預測中的具體應用,也可以說礦床統(tǒng)計預測是數(shù)學地質(zhì)的一個組成部分。因此,為了更好地了解“礦床統(tǒng)計預測”,有必要了解數(shù)學地質(zhì)。第六頁,共二百零三頁。現(xiàn)階段數(shù)學地質(zhì)學科的內(nèi)容大致可分為四個互相聯(lián)系的領(lǐng)域。1緒論1.2現(xiàn)階段數(shù)學地質(zhì)的主要內(nèi)容(1)應用多變量統(tǒng)計分析及類似方法(人工智能方法,數(shù)據(jù)控掘方法、機器學習方法)對地質(zhì)對象進行定量描述、分類、識別、預測、成因研究。比如,礦產(chǎn)預測(礦床統(tǒng)計預測)物、化探異常識別環(huán)境評價、地質(zhì)災害預測地質(zhì)過程(如沉積過程、火山活動過程)時間序列分析多變量系統(tǒng)的成因分析第七頁,共二百零三頁。(2)地質(zhì)作用過程的數(shù)值模擬。是將研究對象看作一個動力學系統(tǒng)(隨時間而變化的系統(tǒng)),根據(jù)系統(tǒng)的物理模型,運用數(shù)值計算的方法,借助于計算機,再現(xiàn)地質(zhì)作用過程的技術(shù)。這里所謂物理模型,是指地質(zhì)作用所涉及的各種物質(zhì)(或物體)成分、結(jié)構(gòu)、各種驅(qū)動力因素及其相互關(guān)系,以及它們隨時間而變化的規(guī)律。對所研究的系統(tǒng)一般要經(jīng)過適當?shù)暮喕?,其運動規(guī)律多數(shù)情況下可以用有關(guān)物理定律來描述。通過模擬,有助于深入理解所研究的對象,并可能對系統(tǒng)狀態(tài)進行預測。數(shù)值模擬適合于研究較為復雜的系統(tǒng)。四個互相聯(lián)系的領(lǐng)域:1緒論1.2現(xiàn)階段數(shù)學地質(zhì)的主要內(nèi)容第八頁,共二百零三頁。1緒論1.2現(xiàn)階段數(shù)學地質(zhì)的主要內(nèi)容(2)地質(zhì)作用過程的數(shù)值模擬,模擬的一般步驟可概括為:地質(zhì)作用過程的物理-數(shù)學模型給定模型有關(guān)參數(shù)和/或邊界條件用計算機模擬地質(zhì)作用過程比較模擬結(jié)果與實際觀測結(jié)果是否一致No調(diào)整參數(shù)和/或邊界條件Yes結(jié)束,獲得了對地質(zhì)作用過程的新認識第九頁,共二百零三頁。構(gòu)造應力場數(shù)值模擬熱液成礦系統(tǒng)的數(shù)值模擬巖漿作用過程數(shù)值模擬盆地沉積、成巖及油氣成藏過程數(shù)值模擬礦山開發(fā)、油田生產(chǎn)過程數(shù)值模擬地質(zhì)體特征的隨機模擬1緒論1.2現(xiàn)階段數(shù)學地質(zhì)的主要內(nèi)容(2)地質(zhì)作用過程的數(shù)值模擬。比如第十頁,共二百零三頁。1緒論1.2現(xiàn)階段數(shù)學地質(zhì)的主要內(nèi)容(3)地質(zhì)統(tǒng)計學。是運用隨機過程的理論和方法進行研究將地質(zhì)變量的空間分布變化規(guī)律并進行優(yōu)化估值、預測的科學技術(shù)。地質(zhì)統(tǒng)計學已發(fā)展成為獨立學科,已廣泛應用于許多領(lǐng)域,如礦產(chǎn)儲量計算、物化探異常識別、遙感圖像的紋理分析、地下水面估計等。第十一頁,共二百零三頁。1緒論1.2現(xiàn)階段數(shù)學地質(zhì)的主要內(nèi)容(4)地學(空間)數(shù)據(jù)庫及信息系統(tǒng)。研究對象是地學數(shù)據(jù)。研究任務是地質(zhì)或地學數(shù)據(jù)高效管理、可視化、數(shù)據(jù)挖掘,實現(xiàn)決策支持。研究內(nèi)容主要有地學數(shù)據(jù)模型:復雜、大量的數(shù)據(jù)如何有效存儲、管理、查詢、顯示、更新維護、安全保密。地理信息系統(tǒng):是實現(xiàn)空間數(shù)據(jù)高效管理的計算機系統(tǒng)。地學數(shù)據(jù)挖掘:如何從變化多端的大量數(shù)據(jù)中獲得有用的知識(或客觀對象的規(guī)律性)。第十二頁,共二百零三頁。1緒論1.3數(shù)學地質(zhì)的基本研究思路根據(jù)前述數(shù)學地質(zhì)的定義,可知數(shù)學地質(zhì)是地質(zhì)學與數(shù)學結(jié)合的邊緣學科。學習數(shù)學地質(zhì),應當有一定的地質(zhì)學基礎(chǔ),同時還要有一定的數(shù)學基礎(chǔ)。數(shù)學地質(zhì)研究各種問題的基本思路可概括為:地質(zhì)問題數(shù)學問題地質(zhì)解釋,或地質(zhì)模型數(shù)學模型地質(zhì)認識也就是說,首先要明確所需解決的地質(zhì)問題,將它轉(zhuǎn)化為一個數(shù)學問題,用數(shù)學方法加以分析研究。數(shù)學研究的結(jié)果要回歸地質(zhì),用地質(zhì)理論或知識說明它的意義。第十三頁,共二百零三頁。1緒論1.4數(shù)學地質(zhì)發(fā)展的必然性(1)地質(zhì)學的定量化需求,促進了數(shù)學地質(zhì)的發(fā)展。許多復雜的地質(zhì)作用系統(tǒng),使傳統(tǒng)的直觀觀察描述的研究方法變得無能為力,而需要數(shù)學工具。比如,熱液礦床的礦化往往受到巖石裂隙構(gòu)造的控制。在一定地區(qū)內(nèi)不可能直接觀察到全部的控礦裂隙,因而,用直觀觀察方法不可能查清楚礦化的分布規(guī)律。但構(gòu)造裂隙的發(fā)育和分布是受構(gòu)造應力場控制的。我們有可能通過構(gòu)造應力場的數(shù)值模擬來預測這些裂隙構(gòu)造的分布。這類數(shù)值模擬,常用的方法是“有限元法”。第十四頁,共二百零三頁。1緒論1.4數(shù)學地質(zhì)發(fā)展的必然性(2)地質(zhì)作用過程具有一定的隨機性。抽樣觀測是地質(zhì)學領(lǐng)域的基本工作方法。這使多變量統(tǒng)計分析及類似的數(shù)學方法能夠很好地發(fā)揮作用。比如,埋藏于地下的礦體是看不到的。對這些礦體需要通過諸如鉆探、坑探等手段進行觀測。這些手段使我們能夠觀察到礦體的一部分,進而通過推測來了解礦體的全體。這就是取樣觀測的工作方法。通過有關(guān)數(shù)學方法的應用,“推測”的過程和結(jié)果就可以高效和優(yōu)化。第十五頁,共二百零三頁。(3)地質(zhì)學中數(shù)據(jù)以空間數(shù)據(jù)為主的特點,以及數(shù)據(jù)的多源、異構(gòu)、海量、復雜性,促進了地質(zhì)統(tǒng)計學和地理信息系統(tǒng)應用的快速發(fā)展。1緒論1.4數(shù)學地質(zhì)發(fā)展的必然性空間數(shù)據(jù)是帶有空間坐標的數(shù)據(jù)。任何地質(zhì)體、地質(zhì)現(xiàn)象的空間結(jié)構(gòu)或空間分布特性,往往是最重要的需要查明的特性。不同的多個地質(zhì)體、多種地質(zhì)現(xiàn)象的相互關(guān)系,也往往是非常重要的需要很好地描述、分析的特征。地質(zhì)統(tǒng)計學是定量地、以數(shù)學最優(yōu)化原理研究變量空間變化性的學科;而地理信息系統(tǒng)是高效管理空間數(shù)據(jù)的計算機系統(tǒng)。它們在地質(zhì)學研究中的廣泛應用是必然的。第十六頁,共二百零三頁。(1)數(shù)學地質(zhì)正在逐步突破狹義的“數(shù)據(jù)處理”框架。過去很長時間內(nèi),數(shù)學地質(zhì)的有些領(lǐng)域,比如多元統(tǒng)計的應用,與狹義的“數(shù)據(jù)處理”沒有嚴格界線,數(shù)學地質(zhì)研究結(jié)果往往不能提供顯著獨立的新認識,而主要限于對地質(zhì)描述結(jié)果的定量化“改良”。這一定程度上影響了數(shù)學地質(zhì)作為獨立學科的認可度。隨著學科的發(fā)展,這種情況正在改善。1緒論1.5數(shù)學地質(zhì)和礦床統(tǒng)計預測的發(fā)展趨勢(2)計算機科學、信息科學和應用數(shù)學的發(fā)展,正在為數(shù)學地質(zhì)的成長提供越來越多的新營養(yǎng)?,F(xiàn)在,能夠應用于地質(zhì)學研究和礦產(chǎn)預測的數(shù)學方法和技術(shù)比一二十年前大大豐富而且正在快速發(fā)展。第十七頁,共二百零三頁。1緒論1.5數(shù)學地質(zhì)的發(fā)展趨勢(3)人們越來越認識到地質(zhì)作用過程及地質(zhì)現(xiàn)象中存在的復雜性和非線性的普遍性,因此非參數(shù)方法和非線性方法應用越來越廣。比如,用于描述自然現(xiàn)象非線性特征的分形理論,用于研究多元系統(tǒng)非線性相關(guān)關(guān)系的模式識別和分類方法如各種人工智能方法、支持向量機、獨立成分分析及非參數(shù)地質(zhì)統(tǒng)計學等在地質(zhì)學研究及礦產(chǎn)預測中的應用近年來逐步多見。(4)地質(zhì)學中多來源數(shù)據(jù)的積累已產(chǎn)生了數(shù)據(jù)的海洋,如何有效管理和利用這些數(shù)據(jù),已經(jīng)成為非常重要的研究課題。因此近年來地學數(shù)據(jù)模型、各類信息系統(tǒng)包括地理信息系統(tǒng)的研究和應用正在向深度和廣度發(fā)展。第十八頁,共二百零三頁。2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征2.1地質(zhì)數(shù)據(jù)數(shù)據(jù)是對客觀對象進行觀測的記錄,是有意義的符號組合。數(shù)據(jù)是信息的載體(而信息是數(shù)據(jù)的含義,是數(shù)據(jù)中包含的知識),是分析方法所操作的對象。地質(zhì)數(shù)據(jù)是對地質(zhì)體、地質(zhì)現(xiàn)象或地質(zhì)作用觀測研究而得到的數(shù)據(jù)。按照數(shù)據(jù)的表現(xiàn)形式及獲取數(shù)據(jù)的手段,地質(zhì)數(shù)據(jù)可分為以下種類。定量數(shù)據(jù)邏輯數(shù)據(jù)文本數(shù)據(jù)圖形數(shù)據(jù)圖像數(shù)據(jù)地質(zhì)、礦產(chǎn)調(diào)查、勘查物探化探遙感來源表現(xiàn)形式第十九頁,共二百零三頁。2.1地質(zhì)數(shù)據(jù)定量數(shù)據(jù),是指能夠提供量的信息、能夠互相比較大小、能夠進行算術(shù)運算的數(shù)據(jù)。2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征邏輯數(shù)據(jù),是一種定性數(shù)據(jù),指能夠提供“是、否”這樣的邏輯信息的數(shù)據(jù)。邏輯數(shù)據(jù)一般只需要兩個不同的符號1和0,分別表示“是”和“否”;有時需要三個符號-1,0,1。表示三種邏輯狀態(tài)。對邏輯數(shù)據(jù)可以進行邏輯運算。文本數(shù)據(jù),是一種定性數(shù)據(jù),是代表事物或概念的名稱、編號等的符號。不能進行算術(shù)運算或一般的邏輯運算,但可能用于“計數(shù)”,也可能用于排列順序。第二十頁,共二百零三頁。2.1地質(zhì)數(shù)據(jù)圖形數(shù)據(jù),是指用一系列空間坐標來表示的、能提供關(guān)于點或線或面或體對象位置、形狀、尺寸、空間關(guān)系等信息的數(shù)據(jù)。(在地理信息系統(tǒng)中,稱為矢量數(shù)據(jù)。2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征圖像數(shù)據(jù),比如一張照片,是由某種定量或定性數(shù)據(jù)充滿一個二維(或三維)空間而形成的數(shù)據(jù),一般能夠提供客觀對象的位置、形狀、尺寸、空間關(guān)系等信息。(在地理信息系統(tǒng)中稱為柵格數(shù)據(jù)。)針對前三類數(shù)據(jù)(定量數(shù)據(jù)、邏輯數(shù)據(jù)、文本數(shù)據(jù)),可以研究數(shù)據(jù)的統(tǒng)計分布特征。第二十一頁,共二百零三頁。2.2統(tǒng)計分布及其分析方法在統(tǒng)計學及礦床統(tǒng)計預測中,數(shù)據(jù)看作是隨機試驗的試驗結(jié)果,即對隨機變量的抽樣觀測結(jié)果。數(shù)據(jù)的統(tǒng)計分布,又稱經(jīng)驗分布,對應于隨機變量的概率分布。隨機變量的概率分布函數(shù)和概率密度反映該變量取不同值的概率。相應地,數(shù)據(jù)的統(tǒng)計分布反映一批數(shù)據(jù)出現(xiàn)不同值的頻率。一個隨機變量可能取值的全體稱為一個總體或母體;對隨機變量進行有限次觀測得到的數(shù)據(jù)集合稱為一個樣本。一次觀測的結(jié)果稱為一個樣品。2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征第二十二頁,共二百零三頁??梢酝ㄟ^以下途徑研究一組數(shù)據(jù)的統(tǒng)計分布:(1)計算統(tǒng)計特征值,如平均值、方差、標準差、變異系數(shù)等,定量表達數(shù)據(jù)取值的集中性、離散性等特點。2.2統(tǒng)計分布及其分析方法2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征平均值:方差:標準差:變異系數(shù):以上各式中,表示數(shù)據(jù),n為數(shù)據(jù)個數(shù)。Eq2-1Eq2-2Eq2-3Eq2-4眾數(shù)也較常用,指出現(xiàn)頻率最高的數(shù)值或數(shù)值區(qū)間。第二十三頁,共二百零三頁。(2)作頻率分布直方圖和/或累計頻率分布直方圖(或曲線),直觀反映數(shù)據(jù)的頻率分布情況。2.2統(tǒng)計分布及其分析方法2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征1)將一組數(shù)據(jù)的值的范圍分為多個區(qū)間(一般為等長區(qū)間);2)統(tǒng)計每個區(qū)間內(nèi)數(shù)據(jù)的個數(shù),稱頻數(shù);3)頻數(shù)除以數(shù)據(jù)總個數(shù),得到各區(qū)間的頻率。4)以數(shù)據(jù)的值為橫坐標,以頻率(或頻數(shù))為縱坐標,對應于每個區(qū)間畫一矩形,其寬度為區(qū)間寬度,高度表示頻率(數(shù))值。各區(qū)間頻率值由小到大順序累加可以得到累計頻率曲線。作直方圖的方法:第二十四頁,共二百零三頁。2.2統(tǒng)計分布及其分析方法2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征3)通過將直方圖與某種概率分布理論模型進行比較,選擇合適的概率分布模型表征所研究的對象,可用于數(shù)據(jù)解釋和必要的推斷或估計。比如,右圖是某地區(qū)區(qū)域化探數(shù)據(jù)中Mn含量的直方圖,說明該元素含量非常接近于正態(tài)分布。頻數(shù)Mn含量(ppm)第二十五頁,共二百零三頁。2.3研究數(shù)據(jù)統(tǒng)計分布的意義2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征(1)統(tǒng)計分布特征是地質(zhì)現(xiàn)象的重要數(shù)學特征之一,往往具有鑒別和成因意義(不同成因的地質(zhì)現(xiàn)象或地質(zhì)體,往往表現(xiàn)出不同的統(tǒng)計分布特征)。(2)查明統(tǒng)計分布特征,常是對數(shù)據(jù)做進一步統(tǒng)計分析的基礎(chǔ)。比如有些方法要求數(shù)據(jù)服從某種特定的分布才能使用。若數(shù)據(jù)不符合這種要求,就要進行必要的變換。(3)根據(jù)數(shù)據(jù)的統(tǒng)計分布特征,選擇合適的概率分布模型進行擬合,就可以進行必要的統(tǒng)計推斷或估計。比如,若能夠確認某個變量服從某個正態(tài)分布,就可以根據(jù)正態(tài)分布模型推斷該變量取某值域的概率。第二十六頁,共二百零三頁。平均數(shù)(或稱數(shù)學期望),表征分布的集中性;2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征(1)正態(tài)分布(也稱高斯分布):是連續(xù)型隨機變量的一種最常見最重要的概率分布模型。概率密度:分布函數(shù):正態(tài)分布有兩個參數(shù):標準差,表征分布的分散性(即相對于的偏離程度)。Eq2-5Eq2-6第二十七頁,共二百零三頁。2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征(1)正態(tài)分布,的正態(tài)分布稱為標準正態(tài)分布。“隨機變量X服從參數(shù)為和的正態(tài)分布”,常記作或參數(shù)標準正態(tài)分布第二十八頁,共二百零三頁。中心極限定理指出,有任意概率分布的無窮多個獨立隨機變量的和趨向于正態(tài)分布。因此,在成因研究方面,若一個地質(zhì)變量服從正態(tài)分布,則可能說明它是由許多微小部分累加或微小因素共同作用的結(jié)果。此外,正態(tài)分布是許多領(lǐng)域(包括地質(zhì)學)的統(tǒng)計學研究中最常見和常用的分布模型,它是許多統(tǒng)計學理論的基礎(chǔ)。2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征正態(tài)分布在地質(zhì)研究中的意義第二十九頁,共二百零三頁。其中2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征(2)對數(shù)正態(tài)分布:也是連續(xù)型隨機變量的一種較常見的概率分布模型。若隨機變量X取對數(shù)后服從正態(tài)分布,則稱該變量X服從對數(shù)正態(tài)分布。對數(shù)正態(tài)分布的概率密度為分別為和的平均值和標準差。對數(shù)正態(tài)密度曲線是左偏(正偏)的,即平均數(shù)大于眾數(shù)。對數(shù)正態(tài)分布說明一個變量可能受到少數(shù)或個別突出因素的影響,從而偏離正態(tài)。巖(礦)石中微量元素含量常服從這種分布。Eq2-7第三十頁,共二百零三頁。其中2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征(3)二項分布:是離散型隨機變量的一種較常用的概率分布模型。若一隨機試驗只有兩種可能結(jié)果,記為和。的次數(shù)k是隨機變量。它的分布律是正好是二項式系數(shù)。二項分布的平均數(shù)是設(shè),。則在n次試驗中結(jié)果A出現(xiàn),方差是。二項分布可以用來評價勘探工程布置方案,見教材中的例子。Eq2-8第三十一頁,共二百零三頁。泊松分布常用于描述“稀有事件”,比如,在一定地區(qū)內(nèi)可能找到的隕石的塊數(shù)。保持不變的情況下,k服從泊松分布。可推出泊松分布律為(4)泊松分布:也是離散型隨機變量的一種較常用的概率分布模型。在二項分布的參數(shù),,但2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征泊松分布只有一個參數(shù)泊松分布可用于推斷一定地區(qū)的找礦潛力,見教材中的例子。,它既是平均數(shù)也是方差。Eq2-9第三十二頁,共二百零三頁。(5)混合分布:兩個或多個不同的隨機變量的加權(quán)和的概率分布稱為一個混合分布。比如,設(shè)X和Y是隨機變量,則2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征也是隨機變量,其中這時我們說Z服從成分總體為X和Y的混合分布。表示權(quán)系數(shù)。第三十三頁,共二百零三頁。平均值和方差為以上公式可推廣到任意多個成分總體組合而成的混合分布?;旌戏植糧

的概率密度和概率分布函數(shù)為:2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征Eq2-10Eq2-11Eq2-12Eq2-13第三十四頁,共二百零三頁?;旌戏植嫉拿芏群瘮?shù)(或其樣本數(shù)據(jù)的頻率分布)常呈現(xiàn)多峰狀,稱為多峰型混合分布;也可能呈偏倚的單峰狀,如果是正偏(左偏)的,則稱為對數(shù)正態(tài)型混合分布(注意這不等于對數(shù)正態(tài)分布)。多峰型混合分布的例子頻率對數(shù)正態(tài)型混合分布的例子頻率xx2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征第三十五頁,共二百零三頁?;旌戏植嫉囊饬x在于,它可能反映多種成因或多次作用過程的疊加。比如一個礦床中兩期或多期強度不同的礦化作用相互疊加,可能造成礦石品位空間分布的不均勻,從而品位測量數(shù)據(jù)可能呈現(xiàn)某種混合分布。因此,有時為了深入研究地質(zhì)體(如巖體、礦體)的成因或形成過程,需要從混合分布的樣本數(shù)據(jù)中將各成分總體分離出來(或估計出來),并對成分總體的有關(guān)參數(shù)進行估計。這個過程稱為混合分布的篩分。2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征第三十六頁,共二百零三頁?;旌峡傮w篩分的方法2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征混合總體的篩分雖然一百多年前就已有人研究,但直到近年來仍是多個領(lǐng)域(如地質(zhì)學、經(jīng)濟學)受重視的課題。混合總體的篩分方法可分為三類:解析法:屬于應用數(shù)學,需要對成分總體做較多的假設(shè)。數(shù)值法:是近年來的主流方法,運用各種數(shù)學最優(yōu)化理論方法(如最小二乘法、最大似然法等)進行總體的篩分。圖解法:是歷史悠久的傳統(tǒng)方法。適于手工作業(yè),需要并能夠促進對篩分過程的充分理解。第三十七頁,共二百零三頁?;旌峡傮w篩分的方法——圖解法2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征圖解法是通過在概率格紙上作圖進行混合總體篩分的方法。概率格紙是畫有坐標網(wǎng)格線的圖紙,其一個坐標軸為標準正態(tài)概率分布函數(shù)值,另一坐標軸為等間距刻度(這時稱算術(shù)概率格紙)或?qū)?shù)刻度(這時稱對數(shù)概率格紙)。正態(tài)分布函數(shù)在算術(shù)概率格紙上的圖形是一條直線,對應于累積概率0.5橫坐標值為平均值,直線斜率反映方差的大?。ǚ讲钤酱?,對于一定的概率區(qū)間,直線所跨過的數(shù)值刻度范圍越大)。第三十八頁,共二百零三頁。2.4幾種…2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征右圖:3個正態(tài)分布在概率紙上的圖形的例子平均值:分布曲線(直線)與累積概率=50%的坐標線交點處對應的數(shù)值。標準差:平均值±標準差的值對應累積概率31.74%或68.26%;平均值±2倍標準差對應5%或95%。在圖上估計第三十九頁,共二百零三頁?;旌峡傮w篩分的方法——圖解法2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征假設(shè)兩個成分總體

A

B

都是正態(tài)分布,它們形成一個雙峰型混合分布C。篩分方法是:1)在算術(shù)概率格紙上畫出

C

的累積概率分布曲線。2)在C

的分布曲線上找到拐點,讀出拐點對應的累積概率值

fA

。將fA看作成分

A

在混合總體中所占的比例(權(quán))。于是成分B所占比例應為。二階導數(shù)為0的點第四十頁,共二百零三頁?;旌峡傮w篩分的方法——圖解法2.4幾種重要的概率分布模型2地質(zhì)勘探數(shù)據(jù)的統(tǒng)計分布特征3)從C的數(shù)據(jù)中去掉下部(累積概率<fA)的數(shù)據(jù),用剩下的數(shù)據(jù)在同一張概率紙上重新作圖。具體做法是在C曲線上取若干(3-4個)點,按下式重新計算累積概率:。結(jié)果應是一條直線。該直線代表成分總體A。4)在C

曲線的下部(累積概率<fA)取若干(3-4個)點,按下式重新計算累積概率:。這些點也應能連成一條直線。該直線代表成分B。于是混合總體C被分解為成分總體A和B。第四十一頁,共二百零三頁。混合總體篩分的方法——圖解法混合總體C拐點(在20%處)成分總體A0.05/0.2=0.250.07/0.2=0.350.02/0.2=0.1成分總體B1-(1-0.7)/0.8=0.6251-(1-0.5)/0.8=0.3751-(1-0.97)/0.8=0.9625橫坐標為概率,縱坐標為數(shù)值第四十二頁,共二百零三頁。(1)礦產(chǎn)資源的地質(zhì)與技術(shù)經(jīng)濟兩重性3.1礦床統(tǒng)計預測的基本理論要點3礦床統(tǒng)計預測的基本理論方法礦產(chǎn)資源是地質(zhì)體,是地質(zhì)作用的產(chǎn)物,其形成和分布受地質(zhì)成礦規(guī)律所制約。因此,成礦預測應以地質(zhì)成礦規(guī)律研究為基礎(chǔ)。同時,礦產(chǎn)資源有很強的經(jīng)濟、技術(shù)屬性。一定的地質(zhì)體,是不是礦產(chǎn),能否開發(fā)利用,在很大程度上取決于當時的經(jīng)濟技術(shù)條件。礦產(chǎn)預測及礦床統(tǒng)計預測,應受到當前及未來一定時間內(nèi)的經(jīng)濟技術(shù)環(huán)境的制約。第四十三頁,共二百零三頁。(2)礦產(chǎn)資源分布的不均勻性礦產(chǎn)資源的種類(礦種)、類型、礦產(chǎn)質(zhì)量和數(shù)量在地球上的空間分布,以及在地質(zhì)歷史上的時間分布,在各種不同尺度上來看都是不均勻的和稀少的。空間分布的不均勻性主要表現(xiàn)為不同尺度的成礦區(qū)帶的存在。成礦區(qū)帶內(nèi)礦產(chǎn)分布也有叢集性。含有礦床的地段相對于成礦區(qū)帶規(guī)模而言是微小的。礦床是一種“稀有地質(zhì)體”。時間分布的不均勻性表現(xiàn)為與構(gòu)造運動有關(guān)的成礦期。在一個大的成礦期(如加里東期)內(nèi),成礦作用也并非連續(xù)不斷。3.1礦床統(tǒng)計預測的基本理論要點3礦床統(tǒng)計預測的基本理論方法礦產(chǎn)資源分布的不均勻性決定了礦產(chǎn)預測的必要性。第四十四頁,共二百零三頁。(3)地質(zhì)-成礦作用過程具有確定性和隨機性兩重性地質(zhì)-成礦作用過程具有一定程度的確定性,成礦規(guī)律是存在的。這已經(jīng)為長期以來的生產(chǎn)實踐和科學研究所證明。但由于這些過程可能涉及多種動力、漫長的時間、巨大的空間、復雜的物質(zhì)成分組合,因而表現(xiàn)得十分復雜以至規(guī)律性不明顯或表現(xiàn)為統(tǒng)計規(guī)律,從而接近于隨機過程。地質(zhì)成礦作用過程的這種兩重性,決定了礦產(chǎn)預測的可能性,以及采用礦床統(tǒng)計預測方法的必要性。3.1礦床統(tǒng)計預測的基本理論要點3礦床統(tǒng)計預測的基本理論方法第四十五頁,共二百零三頁。(4)相似類比和綜合信息理論相似類比是過去和目前成礦預測的最基本思路和方法。相似類比是基于這樣的觀點:“相似的地質(zhì)環(huán)境中可能有相似的礦產(chǎn)存在”。目前礦床統(tǒng)計預測的基本思路也沒有突破該框架。在礦床統(tǒng)計預測中,一般都采用“建?!馔啤钡姆椒ㄋ悸?,實質(zhì)上是相似類比。綜合信息礦產(chǎn)預測理論,強調(diào)多種找礦信息(地物化遙)的相互關(guān)聯(lián)和綜合解釋,以便更好更多地提取隱蔽的、微弱的、深部的找礦信息,提高礦產(chǎn)預測效果。這正是礦床統(tǒng)計預測中常用的多變量統(tǒng)計分析方法的核心和優(yōu)勢。3.1礦床統(tǒng)計預測的基本理論要點3礦床統(tǒng)計預測的基本理論方法第四十六頁,共二百零三頁。(1)以地質(zhì)-成礦規(guī)律研究為基礎(chǔ)的原則研究區(qū)內(nèi)的地質(zhì)資料、對研究區(qū)內(nèi)礦床的地質(zhì)認識,是礦產(chǎn)預測的最主要依據(jù)。這是由礦產(chǎn)資源的地質(zhì)屬性所決定的。預測結(jié)果要進行地質(zhì)解釋,就是要分析預測模型及預測結(jié)果的地質(zhì)意義,分析和發(fā)現(xiàn)預測模型和預測結(jié)果可能提供的新的地質(zhì)信息。地質(zhì)解釋是礦床統(tǒng)計預測工作的必要環(huán)節(jié)。3.2礦床統(tǒng)計預測的基本原則3礦床統(tǒng)計預測的基本理論方法第四十七頁,共二百零三頁。(2)尺度一致原則尺度一致原則是指,在礦產(chǎn)預測及礦床統(tǒng)計預測中,應力求做到以下三個方面:1)工作精度(比例尺)與研究區(qū)的大小及預測資源量級別相適應;2)預測結(jié)果精度與所用資料的精度相適應;3)所用的地質(zhì)變量(各種控礦因素、找礦標志)的空間尺度與工作精度(比例尺)相適應。3.2礦床統(tǒng)計預測的基本原則3礦床統(tǒng)計預測的基本理論方法第四十八頁,共二百零三頁。(4)綜合信息原則要求盡量全面收集已有的各種有關(guān)資料,注重研究各種變量之間的相互關(guān)系,建立最優(yōu)化的預測模型,最充分地利用各種相互獨立的預測依據(jù)信息。(3)循序漸進原則在一定地區(qū)內(nèi),礦產(chǎn)預測及礦床統(tǒng)計預測工作應當有系統(tǒng)性,多次工作一般應符合比例尺由小到大、研究范圍及預測遠景區(qū)逐步縮小的順序。3.2礦床統(tǒng)計預測的基本原則3礦床統(tǒng)計預測的基本理論方法第四十九頁,共二百零三頁。3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容3礦床統(tǒng)計預測的基本理論方法(1)明確任務,工作設(shè)計(2)收集資料(3)劃分基本單元(4)選擇控制區(qū)(5)研究地質(zhì)變量(6)建立預測模型(7)模型檢驗、外推預測,成果表達、解釋(8)提出地勘工作部署建議一般程序第五十頁,共二百零三頁。(1)明確任務,工作設(shè)計:確定研究范圍(含深度)、礦種、礦床類型、工作比例尺、成果內(nèi)容。設(shè)計的一般內(nèi)容:工作任務、設(shè)計依據(jù)、方法手段、預期成果、進度計劃、經(jīng)費、隊伍組成,等。(2)收集資料:盡量全面地收集研究區(qū)內(nèi)地質(zhì)、礦產(chǎn)、物探、化探、遙感資料。根據(jù)需要和可能性,編制研究區(qū)的“研究程度圖”。3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容3礦床統(tǒng)計預測的基本理論方法第五十一頁,共二百零三頁。(3)劃分基本單元:是指將整個研究區(qū)劃分為許多小地段或小單位(稱為基本單元,簡稱單元),從而將一個連續(xù)的研究區(qū)離散化,能夠運用統(tǒng)計的方法。單元劃分有二類方法:1)幾何單元劃分:將研究區(qū)劃分為等面積正方形網(wǎng)格,(有時可采用長方形網(wǎng)格)。2)地質(zhì)單元劃分:以地質(zhì)體(廣義)為單元,如巖體、地層、斷裂帶、化探異常區(qū)、匯水盆地等。地質(zhì)體的形狀和大小一般來說變化很大。以地質(zhì)體為單元進行統(tǒng)計分析,需要注意所劃分的地質(zhì)單元在空間尺度上有可比性,在屬性上能夠看作是同一總體的樣本。3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容3礦床統(tǒng)計預測的基本理論方法第五十二頁,共二百零三頁。對單元的進一步說明單元是統(tǒng)計分析的樣品,一組或全部單元看作一個樣本。在每個單元中,每個地質(zhì)變量最多可以取一個值。因此,從空間分析的角度來看,單元被當作點;從屬性分析的角度看來,單元是樣品或“個體”。影響幾何單元(網(wǎng)格)的大小的因素:工作比例尺、研究區(qū)地質(zhì)復雜程度、研究范圍大小、礦床(點)的空間分布情況、可獲取數(shù)據(jù)的密集程度等。3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容3礦床統(tǒng)計預測的基本理論方法第五十三頁,共二百零三頁。(4)選擇控制區(qū):控制區(qū)是指研究程度較高、資料較充分、認識程度較高的局部地段(一批單元),用于建立模型。研究區(qū)內(nèi)除控制區(qū)之外的其他地區(qū)有時稱為未知區(qū)或待預測區(qū)。構(gòu)成控制區(qū)的單元稱為控制單元或稱模型單元。研究區(qū)內(nèi)除控制單元之外的其它單元都稱為未知單元或待預測單元,有時稱為待評價單元??刂茀^(qū)要對整個研究區(qū)在地質(zhì)、礦產(chǎn)方面有代表性。因此,有時根據(jù)方法需要,控制單元應包括有礦單元、無礦單元等分別代表不同礦化程度的已知單元。在有些情況(如數(shù)據(jù)稀少)下,控制區(qū)可以位于研究區(qū)之外。根據(jù)用途,控制區(qū)可以(但非必須)包括兩類:建模區(qū)、檢驗區(qū),前者用于建立預測模型,后者用于對預測結(jié)果進行檢驗。3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容3礦床統(tǒng)計預測的基本理論方法第五十四頁,共二百零三頁。(5)研究地質(zhì)變量:根據(jù)已有資料,研究控礦條件、找礦標志和成礦規(guī)律,形成研究區(qū)內(nèi)礦產(chǎn)資源體的地質(zhì)概念模型(即地質(zhì)認識)。在地質(zhì)認識的指導下提取地質(zhì)變量(地、物、化、遙變量),獲取其數(shù)據(jù),進行必要的變量選擇、數(shù)據(jù)變換等準備工作。關(guān)于地質(zhì)變量的研究內(nèi)容和方法,后面還將介紹。3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容3礦床統(tǒng)計預測的基本理論方法第五十五頁,共二百零三頁。(6)建立預測模型。預測模型,這里是指礦產(chǎn)預測的數(shù)學模型,是用數(shù)學語言表達的礦產(chǎn)資源數(shù)量、質(zhì)量、空間位置與各種地質(zhì)變量的定量關(guān)系。建立預測模型,就是要根據(jù)已有的數(shù)據(jù)情況和預測任務要求,選擇運用合適的數(shù)學方法,研究和表達礦產(chǎn)資源產(chǎn)出的規(guī)律性。這些規(guī)律性表現(xiàn)為礦產(chǎn)資源體(礦田、礦床、礦體)與地物化遙變量之間的數(shù)量關(guān)系和空間關(guān)系。模型是對客觀事物的認識的概括性表達,是對未知對象進行預測、評價的手段。比如,以礦床規(guī)模為因變量,以地層巖石類型、化探異常強度等為自變量的回歸模型,就有描述和預測的功能。3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容3礦床統(tǒng)計預測的基本理論方法第五十六頁,共二百零三頁。(7)模型檢驗、外推預測,成果表達、解釋:模型檢驗,是指按照統(tǒng)計檢驗的理論方法(如F-檢驗),或根據(jù)預測結(jié)果與實驗觀測結(jié)果的符合程度,對模型的有效性和可靠性進行評價。模型外推就是將研究范圍內(nèi)未知區(qū)的數(shù)據(jù)代入模型,算出結(jié)果,從而評價這些未知地段。比如,可能計算出未知地段含有礦床的可能性(概率)、含礦的可能數(shù)量、種類等,達到預測的目的。預測結(jié)果可包括預測有利單元分布圖、找礦遠景區(qū)劃分圖、潛在資源量概率分布等。預測結(jié)果應“回歸地質(zhì)”,即一方面應根據(jù)已有地質(zhì)認識,說明預測結(jié)果的地質(zhì)合理性;另一方面應對模型及預測結(jié)果進行分析,發(fā)現(xiàn)其與現(xiàn)有地質(zhì)認識的差異,探討是否提供了新的信息,對原有地質(zhì)認識是否有所發(fā)展。3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容3礦床統(tǒng)計預測的基本理論方法第五十七頁,共二百零三頁。(8)提出地勘工作部署建議是指根據(jù)預測結(jié)果,提出在所預測的各類(級)遠景地段內(nèi),進一步安排地質(zhì)勘查工作的建議。提出建議是必不可少的最后環(huán)節(jié),是礦產(chǎn)預測及礦床統(tǒng)計預測工作實際意義的集中體現(xiàn)。建議的內(nèi)容,主要包括工作的空間范圍、工作種類、比例尺、優(yōu)先程度等。一般來說,下一步勘查工作應優(yōu)先布置于所預測的最有找礦遠景的地段(找礦遠景區(qū))內(nèi)。工作的比例尺應大于現(xiàn)有資料的比例尺,工作的種類、內(nèi)容要與自然、地質(zhì)條件相適應。3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容3礦床統(tǒng)計預測的基本理論方法第五十八頁,共二百零三頁。礦床統(tǒng)計預測例:新疆巴侖臺-庫什地區(qū)銅多金屬礦產(chǎn)預測3礦床統(tǒng)計預測的基本理論方法3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容巖體圖層地層圖層該例僅用于示意性地說明礦床統(tǒng)計預測工作的過程第五十九頁,共二百零三頁。斷層圖層礦床統(tǒng)計預測例:新疆巴侖臺-庫什地區(qū)銅多金屬礦產(chǎn)預測3礦床統(tǒng)計預測的基本理論方法3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容航磁ΔT值等值線圖層以上4個圖層及其它一些圖層(未列出)是預測所用的地質(zhì)變量第六十頁,共二百零三頁。巴侖臺-庫米什地區(qū)礦床(點)分布圖1-酸性火山巖中塊狀硫化物礦床;2-細碧角斑巖系黃鐵礦型礦床;3-層控型礦床;4-石英斑巖型礦床;5-巖漿熱液型礦床;6-構(gòu)造蝕變巖型礦床;7-沉積型礦床礦床統(tǒng)計預測例:新疆巴侖臺-庫什地區(qū)銅多金屬礦產(chǎn)預測3礦床統(tǒng)計預測的基本理論方法3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容第六十一頁,共二百零三頁。單元劃分及控制單元選擇(深色者為控制單元)礦床統(tǒng)計預測例:新疆巴侖臺-庫什地區(qū)銅多金屬礦產(chǎn)預測3礦床統(tǒng)計預測的基本理論方法3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容第六十二頁,共二百零三頁。銅礦找礦有利性指標等值線圖等值線相對低凹處為有利地段)鉛鋅礦找礦有利性指標等值線(等值線相對低凹處為有利地段)礦床統(tǒng)計預測例:新疆巴侖臺-庫什地區(qū)銅多金屬礦產(chǎn)預測3礦床統(tǒng)計預測的基本理論方法3.3礦床統(tǒng)計預測的一般程序和工作內(nèi)容Eigenface法的預測結(jié)果第六十三頁,共二百零三頁。4.1地質(zhì)變量的概念和種類4地質(zhì)變量地質(zhì)變量是指表示地質(zhì)現(xiàn)象隨空間位置不同而取不同值的變量。這里“地質(zhì)現(xiàn)象”是廣義的,可以包括地物化遙各方面的實際現(xiàn)象或概念。一般(或大多數(shù)情況下),地質(zhì)變量是空間位置的函數(shù)。在礦床統(tǒng)計預測中,地質(zhì)變量在一個空間點上的取值常被認為是隨機變量,因而地質(zhì)變量是一種隨機函數(shù)(即空間域上無窮多個隨機變量的集合)。地質(zhì)變量的值,可以是定量數(shù)據(jù)或定性數(shù)據(jù)。以下是一些地質(zhì)變量的例子:“斷層”,是地質(zhì)現(xiàn)象,可以取邏輯值,如表示“有/無”等;“斷層產(chǎn)狀”,是一個概念,可以取定量值或文本值(如“陡”)。“銅豐度”,概念,可取定量值或文本值;“銅豐度高”,是概念或現(xiàn)象,可取邏輯值表示“是/否”。第六十四頁,共二百零三頁。地質(zhì)變量按取值方法可分為2類:1)觀測變量,其值為直接測量的數(shù)據(jù)。如地層厚度。2)綜合變量,其值為原始觀測值的某種有意義的計算結(jié)果,如比值、乘積等)。例如化探研究中有時可定義如下邏輯變量4.1地質(zhì)變量的概念和種類4地質(zhì)變量表示“金、銅豐度高同時鋅豐度低”,是一個綜合變量。第六十五頁,共二百零三頁。它是一個綜合變量,表示一個單元內(nèi)巖性的變異度或不確定性程度,也間接表示了局部地質(zhì)作用的復雜程度。其中pi表示單元中觀測得到的某種巖性所占的比例,作為該巖性出現(xiàn)概率的估計;n為單元中巖性種類數(shù)。4.1地質(zhì)變量的概念和種類在礦床統(tǒng)計預測中,有時可用單元巖性熵作為預測變量之一:有時為消除巖性種類數(shù)目n的影響,可計算相對熵:熵是信息論中的重要概念,在地質(zhì)學中有許多應用。4.1地質(zhì)變量的概念和種類4地質(zhì)變量Eq4-1Eq4-2第六十六頁,共二百零三頁。地質(zhì)變量按其取值的數(shù)據(jù)類型,可分為定量變量:值為定量數(shù)據(jù)。邏輯變量:又稱布爾(boolean)變量,值為邏輯數(shù)據(jù)。文本(或字符(串))變量:值為文本數(shù)據(jù)。定量變量根據(jù)數(shù)據(jù)類型可分為 連續(xù)變量:取實數(shù)值。 離散變量:取整數(shù)值。邏輯變量和文本變量是離散變量。4.1地質(zhì)變量的概念和種類4地質(zhì)變量4.1地質(zhì)變量的概念和種類4地質(zhì)變量第六十七頁,共二百零三頁。地質(zhì)變量構(gòu)置(或稱提?。┦侵付男┑刭|(zhì)現(xiàn)象或概念為地質(zhì)變量的過程,是初步確定礦產(chǎn)預測中所使用的變量集合,并獲取其數(shù)據(jù),為預測建模作準備。以下各類因素或標志都可作為變量:(1)各種控礦因素、找礦標志。(2)各種對礦化有破壞或排斥作用(與礦化強度負相關(guān))的因素或標志。(3)各種與礦床的關(guān)系雖不直觀,但通過統(tǒng)計分析有可能查明其與礦床關(guān)系的因素或標志。(4)綜合變量4.2地質(zhì)變量構(gòu)置4地質(zhì)變量第六十八頁,共二百零三頁。提取變量時應注意:(1)地質(zhì)概念模型及勘查工作成果是重要依據(jù)。同時還要利用有關(guān)專業(yè)知識、發(fā)揮想象力,提取盡可能多的變量。(2)變量所代表的地質(zhì)現(xiàn)象或概念在空間尺度上與單元的尺度具有可比性,從而一個變量在研究范圍內(nèi)不同位置上可能得到不同的值。(3)盡量提取定量變量。這是因為通過某些變換,定量變量可以變?yōu)槎ㄐ宰兞?,但反過來卻不易。(4)已查明與礦化無任何關(guān)系的因素或標志,不應提取。(實際工作中往往難以確認某種地質(zhì)因素與礦化之間無任何關(guān)系。因地質(zhì)作用常有某種繼承性,故即使是成礦后的某些現(xiàn)象也可能與成礦有某種間接關(guān)系。因此,經(jīng)常需要借助統(tǒng)計分析方法判斷這些關(guān)系。)4.2地質(zhì)變量構(gòu)置4地質(zhì)變量第六十九頁,共二百零三頁。4.3地質(zhì)變量的變換4地質(zhì)變量地質(zhì)變量的變換,是指通過一定方法來改變變量的類型,或頻率分布形式,或量綱,或相互關(guān)系,或空間分布形式等,從而滿足特定方法的需要,或提取、表達特定的信息。常用的變換方法:(1)布爾轉(zhuǎn)換將定量變量變?yōu)椴紶栕兞浚ㄟ壿嬜兞浚R话惴椒ㄊ?,在定量變量的值域?nèi)取一個適當?shù)拈y值,根據(jù)該閥值將變量的值分為兩類,將兩類值分別變?yōu)?和1,從而得到一個邏輯變量。閥值一般是一個常量,有時也可以是空間位置的函數(shù)。第七十頁,共二百零三頁。(2)離散化是指將連續(xù)變量變?yōu)殡x散變量。一般方法是,在連續(xù)變量的值域中取一個或多個閥值,從而將該值域劃分為多個區(qū)間,使每個區(qū)間對應一個整數(shù)值,或文本值,或邏輯值,從而得到一個新的離散變量。布爾轉(zhuǎn)換是一種離散化。又如,化學元素含量是連續(xù)變量(值域為0-100%)。選擇適當閥值可將它變?yōu)橐粋€取三個可能值的離散變量,如取值為“高”、“中”、“低”。4.3地質(zhì)變量的變換4地質(zhì)變量第七十一頁,共二百零三頁。(3)網(wǎng)格化是指將二維(或三維)空間上不規(guī)則分布的定量數(shù)據(jù)變?yōu)榘匆?guī)則網(wǎng)格分布的數(shù)據(jù)。一般方法是1)將原始數(shù)據(jù)分布的空間范圍劃分為網(wǎng)格;2)計算每個網(wǎng)格中原始數(shù)據(jù)的平均數(shù),作為對應于該網(wǎng)格的新數(shù)據(jù)。如果一個網(wǎng)格中沒有原始數(shù)據(jù),可用該網(wǎng)格周圍一定范圍內(nèi)的相鄰網(wǎng)格的原始數(shù)據(jù)平均值作為該網(wǎng)格對應的新數(shù)據(jù)。計算這種平均值而生成新數(shù)據(jù)的過程稱為內(nèi)插。計算算術(shù)平均值是最簡單的一種內(nèi)插方法。除此外還有多種加權(quán)平均的內(nèi)插方法,如距離倒數(shù)加權(quán)、克立格估值等。通過網(wǎng)格化,可以生成按規(guī)則網(wǎng)格分布的新數(shù)據(jù),便于分析和作圖。4.3地質(zhì)變量的變換4地質(zhì)變量第七十二頁,共二百零三頁。(4)標準化是將隨機變量的平均值變?yōu)?,標準差變?yōu)?的一種線性變換。設(shè)原始數(shù)據(jù)為,n為數(shù)據(jù)個數(shù)。4.3地質(zhì)變量的變換4地質(zhì)變量則標準化變換后得到的新數(shù)據(jù)為其中和S分別為原始數(shù)據(jù)的平均值和標準差(見Eq2-1,2-3)。如果原變量服從正態(tài)分布,則新數(shù)據(jù)將服從標準正態(tài)分布。標準化變換也能起到消除量綱的作用,使不同的變量在數(shù)量上有可比性,從而利于統(tǒng)一分析。Eq4-3第七十三頁,共二百零三頁。(5)規(guī)格化是改變變量的值域,從而使不同變量統(tǒng)一量綱的線性變換。一般公式為:4.3地質(zhì)變量的變換4地質(zhì)變量式中yi是變換得到的新數(shù)據(jù),xi是原始數(shù)據(jù),xmin和xmax是原始數(shù)據(jù)中的最小和最大值,a,b是任意常數(shù)。變換得到的新數(shù)據(jù)介于區(qū)間[a,b]。最常用的是令a=0,b=1,公式Eq4-4簡化為,這時變換后的數(shù)據(jù)介于區(qū)間[0,1]。Eq4-4Eq4-5第七十四頁,共二百零三頁。式中C

是適當?shù)某?shù),用以避免分母為0等情況。(6)均勻化也是一種消除量綱的線性變換。一般公式為:4.3地質(zhì)變量的變換4地質(zhì)變量對多個變量作均勻化,可使它們平均值相同從而互有可比性。Eq4-6(7)歸一化是使一組數(shù)據(jù)的總和變?yōu)?的線性變換:Eq4-7如果數(shù)據(jù)非負,歸一化后可能作為概率來使用。第七十五頁,共二百零三頁。式中C是適當?shù)某?shù),用于使對數(shù)存在。(8)對數(shù)變換是將原始數(shù)據(jù)取對數(shù),從而使服從對數(shù)正態(tài)分布的數(shù)據(jù)服從正態(tài)分布,或使某種正偏態(tài)分布的數(shù)據(jù)接近于正態(tài)分布。一般公式為:4.3地質(zhì)變量的變換4地質(zhì)變量Eq4-8(9)線性化是將一個變成另一個變量,以使它與另一變量之間的關(guān)系由非線性變?yōu)榫€性。比如,設(shè)有兩個變量具有非線性關(guān)系令一新變量,從而成為一種線性關(guān)系。第七十六頁,共二百零三頁。(10)劃分是通過對值域的劃分,將一個變量變成多個不同的其它變量,以便于研究的深入。比如,4.3地質(zhì)變量的變換4地質(zhì)變量將一個連續(xù)變量變?yōu)槿齻€邏輯變量?!伴W長巖出露面積比”“閃長巖出露面積比=0~30%”“閃長巖出露面積比=30~70%”“閃長巖出露面積比=70~100%”注意劃分不同于離散化(離散化是一個連續(xù)變量變?yōu)橐粋€離散變量)。(“劃分”是將一個集合分為不重疊且無縫隙的多個子集。)“火成巖”“閃長巖”、“英安巖”、“輝綠巖”“下石炭統(tǒng)”“甘草湖組”、“馬鞍橋組”、“小熱泉子組”、“雅滿蘇組”(11)概化是與劃分相反的變換,指將多個變量合并為一個更有概括性的變量,以便使數(shù)據(jù)的意義更清晰,或用于壓縮(減少)數(shù)據(jù),或改變分析精度。比如,第七十七頁,共二百零三頁。4.4地質(zhì)變量的選擇4地質(zhì)變量地質(zhì)變量的選擇,是指從多個地質(zhì)變量中剔除那些對于礦產(chǎn)預測不重要的或不獨立的變量,篩選出精煉的變量組合。變量選擇方法分為兩大類:(1)直接方法:根據(jù)地質(zhì)學相關(guān)專業(yè)知識選擇;(2)統(tǒng)計方法:通過統(tǒng)計分析進行變量選擇。用統(tǒng)計方法選擇變量,通??紤]兩方面依據(jù):(1)變量與礦床值之間的相關(guān)關(guān)系(關(guān)系密切的入選)。礦床值,是指表征礦產(chǎn)資源數(shù)量、質(zhì)量、單元找礦有利程度或可能性等屬性的一類特殊地質(zhì)變量。在礦床統(tǒng)計預測中,礦床值往往作為因變量,而其它地質(zhì)變量為自變量。(2)不同變量的相關(guān)關(guān)系(非獨立的變量被剔除)。第七十八頁,共二百零三頁。選擇變量的具體統(tǒng)計分析方法有許多種。(1)散點圖法將樣品點(比如單元)投于變量坐標系中,根據(jù)點的分布情況直觀考察變量的重要性。例如設(shè)y為礦床值,x為任一地質(zhì)變量,下列散點圖可用于變量選擇。4.4地質(zhì)變量的選擇4地質(zhì)變量yxx2x1y=“有礦”y=“無礦”x2x1第七十九頁,共二百零三頁。(2)相關(guān)系數(shù)法根據(jù)一個變量與礦床值的相關(guān)系數(shù)大小來判斷變量的重要性;或根據(jù)兩個變量的相關(guān)系數(shù)大小來判斷其是否相互線性獨立。相關(guān)系數(shù)計算公式為4.4地質(zhì)變量的選擇4地質(zhì)變量相關(guān)系數(shù)接近于0表示兩個變量不相關(guān)或線性獨立??梢詸z驗相關(guān)系數(shù)的顯著性:取一置信水平,自由度為f=n-2,查相關(guān)系數(shù)檢驗表,若所計算的相關(guān)系數(shù)大于表列值,表示顯著。Eq4-9第八十頁,共二百零三頁。(3)秩相關(guān)系數(shù)法根據(jù)一個變量與礦床值的秩相關(guān)系數(shù)大小來判斷變量的重要性。所謂秩是指數(shù)據(jù)按大小排序后的序號。秩相關(guān)系數(shù)的計算方法:4.4地質(zhì)變量的選擇4地質(zhì)變量設(shè)和是兩組數(shù)據(jù)。將兩組數(shù)據(jù)中的數(shù)值用各自的秩來代替,得到兩個序號序列。兩序號序列相減,得到一個“序差”序列,其中元素記為

di。于是秩相關(guān)系數(shù)為秩相關(guān)系數(shù)的意義與相關(guān)系數(shù)類似,但較粗略,計算較簡便。Eq4-10第八十一頁,共二百零三頁。(4)秩和檢驗法用于判斷某一變量在兩個不同的總體(比如“有礦單元”和“無礦單元”)中取值是否有顯著差異。設(shè)變量為x,兩總體的樣品數(shù)分別為n1和n2,并設(shè)n1<n2。兩總體樣品混合起來,樣品總數(shù)為n1+n2。1)將全部樣品按x從大到小順序排列。各樣品的序號稱“秩”。2)將第一總體的n1個樣品的秩求和,得T。3)給定信度(如=0.05),查“秩和檢驗表”,得秩和的上下限(T1,T2)。4)判斷:若T落在區(qū)間(T1,T2)之外,表示變量x在兩總體中取值有顯著差別。4.4地質(zhì)變量的選擇4地質(zhì)變量第八十二頁,共二百零三頁。4.4地質(zhì)變量的選擇4地質(zhì)變量例如,判斷某地控礦斷裂傾角與礦化強度關(guān)系是否密切。共10個控制單元,4個礦化好,6個礦化差。用x代表斷裂傾角。單元號礦化情況x秩1好25102好4083好5264好7325差3696差4877差6058差6849差72310差801n1

n2=0.05=0.10T1T2T1T2………………441224……451327……461430……………………秩和檢驗表T=26落在(T1,T2)區(qū)間(14,30)內(nèi),說明在0.05置信水平上,斷層傾角對礦化優(yōu)劣無區(qū)分意義。第八十三頁,共二百零三頁。4.4地質(zhì)變量的選擇4地質(zhì)變量(5)其它方法

除上述幾種方法外,還有許多方法可用于地質(zhì)變量的選擇。許多預測建模方法本身包含了變量選擇的環(huán)節(jié),或具有評價變量重要性的功能。在這些方法中,要么是直接剔除不重要的變量,要么是用不同的權(quán)值來區(qū)別變量的重要性。這些方法將結(jié)合預測建模方法進行介紹。第八十四頁,共二百零三頁。以前(第4.1節(jié))講過熵的概念,指出熵是反映地質(zhì)變量(看作隨機事件)不確定性或變異程度的量。熵的概念來源于對隨機試驗的研究。找礦信息量計算法,是通過計算各種地質(zhì)變量所提供的關(guān)于礦床存在的信息量,來評價變量的重要性、評價各個單元的找礦有利程度,進行找礦遠景區(qū)預測的統(tǒng)計分析方法。信息量又稱為熵差,是信息論中的重要概念。為了理解該方法,有必要先了解熵、信息和信息量的概念。5.1預備知識:熵和信息的概念5找礦信息量計算法第八十五頁,共二百零三頁。我們把地質(zhì)變量的取值看作隨機試驗。隨機試驗出現(xiàn)什么結(jié)果不可預知,因此說它有不確定性。它的某個結(jié)果是否出現(xiàn),也不可預知,所以可以說每個結(jié)果都有不確定性。不同的隨機試驗有不同的不確定性。為了比較不同的試驗,需要一個量來衡量這種不確定性的大小。這個量稱為熵。雖然隨機試驗出現(xiàn)何種結(jié)果不可預知,但我們假設(shè)它可能出現(xiàn)哪些結(jié)果及各個結(jié)果的概率是知道的,這樣有利于找到一個計算熵的公式。5.1預備知識:熵和信息的概念5找礦信息量計算法第八十六頁,共二百零三頁。假設(shè)一個隨機試驗有k個可能的結(jié)果,各結(jié)果都有概率1/k。我們要找到一個熵的表達式,使它滿足下列4個條件:2)當k=1時,應有1)它應是k的某個函數(shù):即只有一個可能結(jié)果的試驗其不確定性為應為0。5.1預備知識:熵和信息的概念5找礦信息量計算法第八十七頁,共二百零三頁。5.1預備知識:熵和信息的概念5找礦信息量計算法3)如果由兩步完成,第一步有n個可能結(jié)果,第二步有m個可能結(jié)果,總的可能結(jié)果數(shù)為nm個。這時,我們要求即兩步試驗總的不確定性應為各步驟不確定性的和。4)f(k)應為k的單調(diào)增函數(shù),因為可能結(jié)果的數(shù)目越多,試驗的不確定性應當越大。第八十八頁,共二百零三頁。5.1預備知識:熵和信息的概念5找礦信息量計算法符合上述4個條件的函數(shù)是(是k的單調(diào)增函數(shù),且因此得到一個結(jié)論:具有k個等概結(jié)果的隨機試驗的熵可以表示為)Eq5-1第八十九頁,共二百零三頁。有k個等概結(jié)果。既然5.1預備知識:熵和信息的概念5找礦信息量計算法繼續(xù)假設(shè),可以自然地設(shè)想,該試驗的每個可能結(jié)的不確定性為果的不確定性為。注意1/k正是每個可能結(jié)果的概率,可記為因此每個結(jié)果的不確定性可寫為于是得到用概率表示的試驗的熵的表達式:,Eq5-2(=Eq4-1)第九十頁,共二百零三頁。5.1預備知識:熵和信息的概念5找礦信息量計算法在上述熵的公式中,并未規(guī)定對數(shù)的底,因此計算對數(shù)時可以自由選擇底,比如自然對數(shù)、常用對數(shù)等。信息論中常采用以2為底的對數(shù),這時熵的單位為“比特”(bit)。在地質(zhì)學研究中常用自然對數(shù)或常用對數(shù)。但是在信息論中,得到公式Eq5-2之后就直接“拋棄”了該假設(shè)條件,即,即使試驗的可能結(jié)果不是等概的,其信息熵的計算也用同樣的公式。后來證明這是可行的。上面關(guān)于試驗的熵假設(shè)了具有等概結(jié)果。第九十一頁,共二百零三頁。5.1預備知識:熵和信息的概念5找礦信息量計算法考慮兩個試驗條件熵如果和有。個可能結(jié)果:有個可能結(jié)果:和不是互相獨立,則一個試驗的實現(xiàn)將影響另一個試驗的熵。,概率為第九十二頁,共二百零三頁。5.1預備知識:熵和信息的概念5找礦信息量計算法條件熵令為當試驗出現(xiàn)結(jié)果時試驗的熵。式中為出現(xiàn)結(jié)果時出現(xiàn)的根據(jù)熵的公式Eq5-2,條件概率。第九十三頁,共二百零三頁。5.1預備知識:熵和信息的概念5找礦信息量計算法條件熵共有個,其概率分別為,可算出個的平均值,記為:稱為實現(xiàn)后的條件熵。Eq5-3第九十四頁,共二百零三頁。5.1預備知識:熵和信息的概念5找礦信息量計算法即如果兩個試驗不是互相獨立,則一個試驗的實現(xiàn)會使另一個試驗的熵減少。這一減少的量記為稱為試驗可以證明條件熵有以下重要不等式:信息量:對試驗提供的信息量。顯然如果兩個試驗互相獨立,則一個對另一個提供的信息量為0,因為這時條件熵和“無條件熵”一樣。Eq5-4Eq5-5第九十五頁,共二百零三頁?,F(xiàn)在假設(shè)B表示“單元中有礦”這一事件。用A表示事件“單元中有地質(zhì)因素A”,它的自信息量為5.2找礦信息量計算法原理5找礦信息量計算法一個隨機事件B的熵可用它的發(fā)生概率表示,在信息論中也稱為該事件的自信息量:Eq5-6用B/A表示事件“在單元中有A的條件下有礦”,它的概率是條件概率P(B|A),它的自信息量為第九十六頁,共二百零三頁。5.2找礦信息量計算法原理5找礦信息量計算法于是A所提供的關(guān)于B的信息量為(根據(jù)Eq5-5)根據(jù)貝葉斯定理,所以,Eq5-7第九十七頁,共二百零三頁。式中,S為控制單元總數(shù),SA為有標志A的控制單元數(shù);N為控制單元中含礦單元數(shù),NA為有標志A的含礦單元數(shù)。計算出各個地質(zhì)變量的找礦信息量后,可算出各單元所有地質(zhì)變量找礦信息量的總和,稱單元的信息總量,記為It。5.2原理5找礦信息量計算法用頻率估計概率,采用自然對數(shù),由Eq5-7可得Eq5-8上式中是第j變量的找礦信息量,p是變量數(shù)。根據(jù)信息總量大小,可評價各單元找礦有利程度,圈定找礦遠景區(qū)。Eq5-9第九十八頁,共二百零三頁。5.3找礦信息量計算法的實施步驟(1)提取地質(zhì)變量,劃分單元,選擇控制單元。(控制單元既要有含礦單元,也有無礦單元)。(2)若變量不是二態(tài)邏輯變量,則進行布爾轉(zhuǎn)換或劃分。(3)計算每個變量的找礦信息量(按Eq5-8)。(4)計算各單元找礦信息總量(It)(按Eq5-9)。(5)按照找礦信息總量大小,確定單元的找礦有利性,劃分遠景區(qū)。5找礦信息量計算法第九十九頁,共二百零三頁。以上程序中最后一步(根據(jù)找礦信息總量確定單元找礦有利性并圈定遠景區(qū)),需要確定指示有礦的信息總量下限。該下限可選用以下3種方法來確定:5.3找礦信息量計算法的實施步驟單元找礦信息總量頻率(1)若控制單元數(shù)目較多,可試作含礦控制單元和無礦控制單元的信息總量頻率分布直方圖并進行比較。若呈類似于右圖的情況,則易于找到一個區(qū)分有礦與無礦單元的信息總量下限。頻率無礦單元有礦單元有礦下限5找礦信息量計算法第一百頁,共二百零三頁。5.3找礦信息量計算法的實施步驟確定區(qū)分有礦與無礦單元信息總量下限的方法(2)在研究區(qū)范圍內(nèi)(包括所有單元),作單元信息總量等值線圖。將圈入大多數(shù)礦床點的一條等值線值作為區(qū)分有礦與無礦的閥值。如右圖,信息總量=1.5可以作為指示有礦的下限。0.50-0.51.01.52.01.00.505找礦信息量計算法第一百零一頁,共二百零三頁。5.3找礦信息量計算法的實施步驟確定區(qū)分有礦與無礦單元信息總量下限的方法(3)將所有的含礦控制單元按找礦信息總量從大到小排列并累計單元個數(shù),當累計頻率達到80%時所對應的信息總量值為較好的閥值。100%80%閥值累積頻率曲線小含礦控制單元找礦信息總量大頻率5找礦信息量計算法第一百零二頁,共二百零三頁。5.4找礦信息量計算法應用中需注意的問題(1)該方法使用邏輯數(shù)據(jù)。若現(xiàn)有數(shù)據(jù)是定量數(shù)據(jù),則需要進行布爾轉(zhuǎn)換或劃分。劃分時如何選擇閥值,沒有固定的方法,需根據(jù)試驗或經(jīng)驗選擇較好的劃分方案。(2)該方法屬單變量統(tǒng)計方法,變量之間的相互關(guān)系未考慮。因此,為了使方法更加有效、可靠,應使用其它方法對變量進行選擇。(3)要求有較多的控制單元數(shù)目,且需要有“有礦”、“無礦”兩類控制單元。5找礦信息量計算法第一百零三頁,共二百零三頁。6.1原理6秩相關(guān)分析法所謂找礦的有利標志,是指通過統(tǒng)計分析得到的地質(zhì)變量最有利于成礦,或?qū)φ业V具有最大指示意義的數(shù)值區(qū)間,這時也稱找礦的統(tǒng)計標志。也可以說有利標志是指地質(zhì)變量通過劃分獲得的對找礦具有最大指示意義的新變量。后一說法不需要限制地質(zhì)變量為定量變量。(請復習劃分的概念。)秩相關(guān)分析法,是通過計算礦床值與地質(zhì)因素或標志之間的秩相關(guān)系數(shù),選擇找礦的有利標志,然后根據(jù)單元中的有利標志計數(shù)評價單元找礦有利性,進行找礦遠景區(qū)預測的方法。秩相關(guān)系數(shù)用公式Eq4-10計算。第一百零四頁,共二百零三頁。例如,控礦斷層可能當傾角為20-40°時最利于成礦,則“斷層傾角=20-40°”是一個有利標志,它可認為是對斷層傾角劃分后得到一個新變量。又如,某地區(qū)通過統(tǒng)計分析,發(fā)現(xiàn)中酸性巖漿巖中的石英二長巖較有利于成礦,于是“石英二長巖”是一個有利標志,它可認為由“中酸性巖”劃分而得到。通過計算找礦信息量,可以獲得有利標志。通過秩相關(guān)分析也可以找到有利標志。6.1原理6秩相關(guān)分析法第一百零五頁,共二百零三頁。6.2實施過程6秩相關(guān)分析法秩相關(guān)分析進行找礦遠景區(qū)預測的實施過程為:(1)準備工作。主要包括提取地質(zhì)變量、劃分基本單元、選擇控制區(qū)。要求控制單元數(shù)目較多,并且包含有不同礦化程度的單元,即某個礦床值可以在多個單元中取到不同的值,從而能夠形成一個按大小順序排列的序列。比如,“含大中型礦床單元”——“含小型礦床單元”——“只含礦點或礦化點單元”——“無礦單元”,是一個按礦床規(guī)模從大到小排列的序列。(2)形成礦床值序列。將一種礦床值(比如單元礦床或礦點數(shù)、單元礦產(chǎn)儲量、單元最大礦床規(guī)模等)分為若干級別,按一定順序排列。第一百零六頁,共二百零三頁。(3)對變量進行劃分。一方面是對定量變量進行劃分,由每個定量變量獲得多個新的邏輯變量。比如“閃長巖出露面積比”,可以將其值域劃分為不同的區(qū)間從而得到多個邏輯變量。另一方面如果有一些可能進行劃分的定性變量,也應劃分。比如,原變量為邏輯變量“中酸性巖體”,在可能(有足夠數(shù)據(jù))的情況下,可以劃分為諸如“閃長巖體”、“石英閃長巖體”、“二長巖體”、“花崗閃長巖體”、“花崗巖體”等,從而得到多個新的邏輯變量。6.2實施過程6秩相關(guān)分析法第一百零七頁,共二百零三頁。(4)頻率統(tǒng)計。在控制單元的集合中,統(tǒng)計出劃分得到的各新變量對應于每個礦床值級別的單元頻率。比如,“單元礦點數(shù)=3”的控制單元共有N個,其中有n個出現(xiàn)新變量“閃長巖出露面積比=20-30%”,則新變量對應于該礦床值級別的頻率=n/N。(5)計算秩相關(guān)系數(shù)。計算礦床值序列與每個新變量的頻率序列的秩相關(guān)系數(shù)。頻率序列是指對頻率的排序,應與礦床值序列的排列方式一致(比如礦床值從大到小,則頻率也從大到?。?。(6)篩選有利標志。找出秩相關(guān)系數(shù)最大的新變量,即為有利標志。所以,對應于每個原始變量,可能會得到一個或多于一個有利標志,有利標志的總數(shù)可能等于或大于原始變量的總數(shù)。6.2實施過程6秩相關(guān)分析法第一百零八頁,共二百零三頁。(7)計算單元統(tǒng)計標志數(shù)。對于每個單元,包括控制單元和未知單元,統(tǒng)計其中有幾個有利標志出現(xiàn),稱為單元有利標志數(shù)。(8)檢驗、預測。將單元有利標志數(shù)作為找礦有利性指標,檢驗控制單元的回判情況。如果礦床值較高的控制單元具有較多的有利標志而礦床值較小的控制單元具有較少的有利標志數(shù),說明單元有利標志數(shù)作為找礦有利性指標是可行的。這種情況下,就可用單元有利指標數(shù)來評價未知單元找礦有利性,篩選遠景單元,圈定遠景區(qū)。6.2實施過程6秩相關(guān)分析法第一百零九頁,共二百零三頁。6.3應用示例6秩相關(guān)分析法寧蕪盆地鐵銅成礦帶(趙鵬大等,1984)。計算閃長巖出露面積比有利標志如下表單元礦點數(shù)閃長巖出露面積比(%)00-1010-2020-3030-40>400460(92.3%)14(6.15%)41(1.53%)20(0.0%)40(0.0%)20(0.0%)3134(19.10%)311(52.4%)21(4.75%)12(9.5%)32(9.5%)11(4.75%)2223(42.9%)22(28.6%)30(0.0%)31(14.3%)20(0.0%)31(14.3%)1310(0.0%)42(66.8%)10(0.0%)41(33.2%)10(0.0%)40(0.0%)4-0.80.8-0.61-0.80.4礦床值=“單元礦點數(shù)”;紅色數(shù)字表示秩;括號中數(shù)字是一個標志在同一礦床值級別內(nèi)的單元頻率(同一行的和為1);最下面一行是秩相關(guān)系數(shù)。可見,閃長巖出露面積比=20-30%是一個有利標志。用類似方法可以考察其它地質(zhì)變量,如單元的巖性熵、單元中心到某類斷裂的距離等,找到更多的有利標志。第一百一十頁,共二百零三頁。1)對控制單元的數(shù)目和類別要求較高。2)原始變量如何劃分,沒有固定規(guī)則??煽紤]進行多方案試驗。3)是比較粗略的方法,自變量之間的相關(guān)性未考慮。單元號有利標志號有利標志數(shù)12345671423314452………………………6.3應用示例6秩相關(guān)分析法有利標志數(shù)用于預測,與找礦信息總量用法類似。6.4應用中應注意的問題第一百一十一頁,共二百零三頁。7證據(jù)權(quán)法7.1證據(jù)權(quán)法概述證據(jù)權(quán)法是1980年代產(chǎn)生的多變量統(tǒng)計分析方法,最初用于醫(yī)療診斷,后來隨著GIS的應用,證據(jù)權(quán)法開始用于礦產(chǎn)預測。證據(jù)權(quán)法是通過計算和利用各種不同證據(jù)的權(quán)重(即相對重要性)并將多種證據(jù)結(jié)合起來,預測某個事件是否會發(fā)生的一種方法。在礦產(chǎn)預測中,需要預測的是,在一定地點,比如一個單元中,“有某類礦床存在”這件事是否會發(fā)生。所使用的證據(jù)就是多個地質(zhì)變量。每個地質(zhì)變量稱為一個證據(jù)層,許多層按照各自的權(quán)系數(shù)進行疊加,最后獲得每個單元的“有礦”概率,形成一張單元含礦概率空間分布圖,作為預測結(jié)果。第一百一十二頁,共二百零三頁。證據(jù)權(quán)法以概率論中的貝葉斯定理為基礎(chǔ)。設(shè)D表示“單元中有礦”這一隨機事件。用P(D)表示事件D的概率,即單元的有礦概率。假設(shè)P(D)事先已經(jīng)知道,即它是先驗概率(先驗概率是在開始研究之前已經(jīng)知道的概率)。于是單元的無礦概率可表示為定義7證據(jù)權(quán)法7.2證據(jù)權(quán)法原理稱為事件D的優(yōu)勢率(Oddsratio),它能更好地表示事件D發(fā)生的可能性大小。類似地可以定義任何其它事件的優(yōu)勢率。Eq7-1Eq7-2第一百一十三頁,共二百零三頁。表示與D有關(guān)的p個證據(jù),并設(shè)各Xi都是邏輯變量。用D/X表示“單元中存在X的情況下有礦”這一事件。該事件的概率是條件概率,稱后驗概率(后驗概率是獲得有關(guān)信息后對先驗概率修正后的概率)。依貝葉斯定理,用集合7證據(jù)權(quán)法7.2證據(jù)權(quán)法原理以上兩式相除可算出優(yōu)勢率:Eq7-4Eq7-3第一百一十四頁,共二百零三頁。假設(shè)相互條件獨立,從而7證據(jù)權(quán)法7.2證據(jù)權(quán)法原理令Eq7-5取對數(shù):,則Eq7-4成為Eq7-7Eq7-8Eq7-6第一百一十五頁,共二百零三頁。事件D/X的優(yōu)勢率為(Eq7-6、7-7、7-9)7.2證據(jù)權(quán)法原理7證據(jù)權(quán)法后驗概率為Eq7-10假設(shè)w0在所有單元中為常數(shù)。因此,忽略w0將不影響單元之間的相互比較。因此,Eq7-6簡化為Eq7-9該后驗概率就是預測結(jié)果,若它較大,說明單元有利于找礦。第一百一十六頁,共二百零三頁。7證據(jù)權(quán)法7.2證據(jù)權(quán)法原理方程式

Eq7-5

所定義的

稱為證據(jù)Xi的證據(jù)權(quán),反映Xi的存在對于D的重要性。類似地,我們可以計算當Xi不存在時的證據(jù)權(quán),記為,稱為負權(quán),計算公式類似于Eq7-7:Eq7-11相應地,可換個符號來表示當Xi=1時的證據(jù)權(quán),稱正權(quán):Eq7-12=Eq7-7定義Eq7-13稱為Xi的襯度系數(shù)或?qū)Ρ榷认禂?shù)(contrast),它可以用來綜合評價Xi的重要性。第一百一十七頁,共二百零三頁。7證據(jù)權(quán)法7.2證據(jù)權(quán)法原理對于任何一個未知單元來說,其中證據(jù)Xi可能存在(=1)也可能不存在(=0)。對任一未知單元,令然后使用Eq7-9~Eq7-10計算后驗概率,作為預測結(jié)果。既考慮正權(quán)也考慮負權(quán)的預測結(jié)果將比單獨考慮正權(quán)的結(jié)果提高“分辨率”,不同單元的后驗概率差別拉開。

Eq7-14第一百一十八頁,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論