




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第六數據分析(優(yōu)選)第六數據分析關系運算符的運算法則當兩個比較量是標量時,直接比較兩數的大小。若關系成立,關系表達式結果為1,否則為0。當參與比較的量是兩個維數相同的矩陣時,比較是對兩矩陣相同位置的元素按標量關系運算規(guī)則逐個進行,并給出元素比較結果。最終的關系運算的結果是一個維數與原矩陣相同的矩陣,它的元素由0或1組成。關系運算符的運算法則(3)當參與比較的一個是標量,而另一個是矩陣時,則把標量與矩陣的每一個元素按標量關系運算規(guī)則逐個比較,并給出元素比較結果。最終的關系運算的結果是一個維數與原矩陣相同的矩陣,它的元素由0或1組成。邏輯運算MATLAB提供3種邏輯運算符:&(與)、|(或)和~(非)。邏輯運算的運算法則為:
(1)在邏輯運算中,確認非零元素為真,用1表示,零元素為假,用0表示。
(2)設參與邏輯運算的是兩個標量a和b,那么,
a&ba,b全為非零時,運算結果為1,否則為0。
a|ba,b中只要有一個非零,運算結果為1。
~a當a是零時,運算結果為1;當a非零時,運算結果為0。邏輯運算(3)若參與邏輯運算的是兩個同維矩陣,那么運算將對矩陣相同位置上的元素按標量規(guī)則逐個進行。最終運算結果是一個與原矩陣同維的矩陣,其元素由1或0組成。(4)若參與邏輯運算的一個是標量,一個是矩陣,那么運算將在標量與矩陣中的每個元素之間按標量規(guī)則逐個進行。最終運算結果是一個與矩陣同維的矩陣,其元素由1或0組成。邏輯運算(5)邏輯非是單目運算符,也服從矩陣運算規(guī)則。(6)在算術、關系、邏輯運算中,算術運算優(yōu)先級最高,邏輯運算優(yōu)先級最低。多項式及運算多項式的MATLAB表示法:如:P=S3+2S2+3S+4MATLAB可表示為系數向量
P=[1234]多項式的生成直接輸入系數向量
>>p=[1234] P=S3+2S2+3S+4*
求多項式的根,可用函數roots(P)【例】r=roots(P)
ans=-1.6506-0.1747+1.5469i-0.1747-1.5469i若已知多項式根向量,可用poly(P)生成多項式【例】已知P1(s)=(s+1)(s+2)(s+3)的根為:-1-2-3
則編寫:P1=poly([-1,-2,-3])
運行后,得
P1=
16116
表示已生成多項式為:P=s3+6s2+11s+6多項式的生成多項式運算1.求多項式值polyval(p,x0)V=polyval(P1,1)V=242.多項式加、減:
*階次相同,低階缺項系數必須補0【例】:(s2+2s+1)+2s2P1=[121];
P2=[200];
P=P1+P2》P=321多項式運算3.多項式乘法conv.(卷積)
(s+1)(s3+6s2+11s+6)P1=[11];P2=[16116];P3=conv(P1,P2)》P3=1717176→P3=s4+7s3+17s2+17s+6多項式運算4.多項式除運算deconva=[123];c=[413282718]d=deconv(c,a)c=413282718[d,r]=deconv(c,a)余數c除a后的整數多項式運算5.部分分式展開式residue[r,p,k]=residue(b,a)
b(s)r(1)
r(2)
r(n)----=--------+--------+...+--------+k(s)a(s)s-p(1)s-p(2)s-p(n)
p=[p(1),p(2),…p(n)]r=[r(1),r)2),….r(n)].k(s)直接項多項式運算6.多項式微分運算polyder【例】f(x)=2x5+5x4+4x2+x+4 p=[250414];h=polyder(p)
》h=1020081練習例:x1+2x2=82x1+3x2=13
=方程ax=ba=[12;23];b=[8;13];x=inv(a)*b
x=a\bx=x=2.002.003.003.00多項式擬合與插值在分析試驗數據中,常常要面臨將試驗數據作解析描述的任務,這個問題有曲線擬合和插值兩種方法。在曲線擬合中,假定已知曲線的規(guī)律,作曲線的最佳逼近,但不需要經過所有的數據點;在插值中,認為數據是準確的,求取其中描述點之間的數據。多項式擬合多項式的最小二乘曲線擬合使用polyfit,它需要曲線的x、y值,以及曲線的階數。曲線的階數:如果曲線的階數選擇的過小,擬合效果不好;如果曲線的階數過高,雖然數據點上看到效果好,數據點之間會出現有數據振蕩的問題,階數不宜過高,一般小于5階。靈活使用擬合插值插值函數1、曲線插值函數interp1方法t=interp1(x,y,x0,’method’)x、y:原始數據點,x0為進行插值的數組,method為插值算法:線性插值('linear'),三次樣條插值('spline'),三次多項式插值(‘cubic’).如果x0出界,則對應值為NaN三次樣條插值對于給定的離散的測量數據x,y(稱為斷點),要尋找一個三項多項式y(tǒng)=p(x),以逼近每對數據(x,y)點間的曲線。過兩點(xi,yi)和(xi+1,yi+1)只能確定一條直線,而通過一點的三次多項式曲線有無窮多條。為使通過中間斷點的三次多項式曲線具有唯一性,要增加兩個條件(因為三次多項式有4個系數): 1.三次多項式在點(xi,yi)處有:pi′(xi)=pi〞(xi); 2.三次多項式在點(xi+1,yi+1)處有:
pi′(xi+1)=pi〞(xi+1); 3.p(x)在點(xi,yi)處的斜率是連續(xù)的(為了使三次多項式具有良好的解析性,加上的條件); 4.p(x)在點(xi,yi)處的曲率是連續(xù)的;曲面(二維)插值插值函數:interp2,基本形式:zi=interp2(x,y,z,xi,yi,method)method包括linear:線性cubic:三次多項式nearest:粗略估計數據集中趨勢的測定在統(tǒng)計研究中,需要搜集大量數據并對其進行加工整理,對這些數據進行整理之后發(fā)現:大多數情況下數據都會呈現出一種鐘形分布,即各個變量值與中間位置的距離越近,出現的次數越多;與中間位置距離越遠,出現的次數越少,從而形成了一種以中間值為中心的集中趨勢。這個集中趨勢是現象共性的特征,是現象規(guī)律性的數量表現。數據特征設是取自總體X的一個簡單隨機樣本,在n次抽樣以后得到樣本的一組觀測值我們通過對數據的分析研究可以得到總體X的有關信息,在MATLAB中有專門的函數分析數據特征,如下表所示.位置特征MATLAB函數變異特征MATLAB函數算術平均mean極差range中位數median方差var切尾平均trimmean標準差std幾何平均geomean四分位極差iqr調和平均harmmean平均絕對偏差mad集中趨勢的描述1.均值函數(1)算術平均數(2)調和平均數 數值倒數的平均數的倒數。(3)幾何平均數
n個觀察值連乘積的n次方根。集中趨勢的描述2.中位數(中位次數)函數中位數是指全體數值按大小排列后位于中間的數值。 如果參數集合中包含有偶數個數字,中位數函數將返回位于中間的兩個數的平均值。集中趨勢的描述3.眾數函數眾數是一組數列中出現次數最多的數值,眾數函數返回某一數組或數據區(qū)域中出現頻率最多的數值。4.最大(?。┲岛瘮底畲螅ㄐ。┲岛瘮悼梢苑祷財祿械淖畲螅ㄐ。抵?。三種平均數的特點眾數是一組數據中出現次數最多的變量值,它用于對分類數據的概括性度量,其特點是不受極端值的影響,但它沒有利用全部數據信息,而且還具有不惟一性。一組數據可能有眾數,也可能沒有眾數;可能有一個眾數,也可能有多個眾數。中位數是一組數據按大小順序排序后處于中間位置上的變量,它主要用于對順序數據的概括性度量。均值是一組數據的算術平均,它利用了全部數據信息,是概括一組數據最常用的一個值。表示變異程度的統(tǒng)計量標準差:它是各個數據與均值偏離程度的度量.方差:標準差的平方.在樣本容量相同的情況下,方差越大,說明數據的波動越大,越不穩(wěn)定。極差:樣本中最大值與最小值之差.四分位數四分位數是將中值的前后兩部分數值再等分為二,以數值小的一端算起,前半部的分區(qū)點稱為第1四分位數,后半部的分區(qū)點稱為第3四分位數,而中值即為第2四分位數。四分位數通常用于在銷售額和測量值數據集中對總體進行分組。數據特征示例一例4.已知數據:a=[4593626245425095844337488155056124524349826407425657065936809266531644877346084281153593844527552513781474388824538862659775859755649697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851];計算該數據特征.數據特征示例二已知數據:1,1,1,1,1,1,100;計算其數據特征,由此你有何發(fā)現?計算結果為:y=15.14311.93071.16471991400.137.418024.245如果本例的數據全部為1,則各種平均值都應等于1,所有的變異特征全部為零,由于有一個異常值100,于是導致上述的一些特征受影響(不穩(wěn)?。侵形粩?、切尾平均與四分位極差沒有改變,它們對異常值是穩(wěn)健的.異常值的判別在探索性數據分析時,有一種判別異常值的簡單方法,首先計算數據的下、上截斷點,數據中小于下截斷點的數據為特小值,大于上截斷點的數據為特大值,二者都是異常值.數據的下、上截斷點計算上、下截斷點的公式如下:其中,R為四分位極差,分別稱為下四分位數與上四分位數.注:Q1=prctile(w,25);
Q3=prctile(w,75);
prctile()函數實現計算樣本的百分位數功能
位于以外的點若數據服從正態(tài)分布,則稱位于以外的點為異常點.分布形態(tài)的測定只用集中趨勢和離中趨勢來表示所有數據,難免不夠準確。分析總體次數的分布形態(tài)有助于識別整個總體的數量特征??傮w的分布形態(tài)可以從兩個角度考慮,一是分布的對稱程度,另一個是分布的高低。前者的測定參數稱為偏度或偏斜度,后者的測定參數稱為峰度。峰度是掌握分布形態(tài)的另一指標,它能描述分布的平緩或陡峭程度。如果峰度數值等于零,說明分布為正態(tài);如果峰度數值大于零,說明分布呈陡峭狀態(tài);如果峰度數值小于零,說明分布形態(tài)趨于平緩。偏度函數偏度函數返回分布的偏斜度。偏斜度反映以平均值為中心的分布的不對稱程度。正偏斜度表示不對稱邊的分布更趨向正值,負偏斜度表示不對稱邊的分布更趨向負值。其計算公式為峰度函數峰度函數返回數據集的峰值,表示次數分布高峰的起伏狀態(tài)。峰值反映與正態(tài)分布相比某一分布的尖銳度或平坦度。正峰值表示相對尖銳的分布,負峰值表示相對平坦的分布。其計算公式為表示分布形狀的統(tǒng)計量 偏度反映分布的對稱性,g1>0稱為右偏態(tài),此時數據位于均值右邊的比位于左邊的多;g1<0稱為左偏態(tài),情況相反;而g1接近0 則可認為分布是對稱的.
峰度是分布形狀的另一種度量,正態(tài)分布的峰度為3,若g2比3大很多,表示分布有沉重的尾巴,說明樣本中含有較多遠離均值的數據,因而峰度可用作衡量偏離正態(tài)分布的尺度之一.隨機變量名稱MATLAB密度函數隨機變量名稱MATLAB密度函數Beta分布betapdf標準正態(tài)分布normpdf二項分布binopdf泊松分布poisspdf卡方分布chi2pdf瑞利分布raylpdf指數分布exppdfT分布tpdfF分布fpdf均勻分布unifpdf伽馬分布gampdfWeibull分布weibpdf幾何分布geopdf非中心F分布ncfpdf超幾何分布hygepdf非中心T分布nctpdf對數正態(tài)分布lognpdf非中心卡方布ncx2pdf
如果將上述命令中的后綴pdf分別改為cdf,inv,rnd,stat就得到相應的隨機變量的分布函數、分位數、隨機數的生成以及均值與方差.隨機變量與分布Matlab工具箱對每一種分布都提供五類函數,其命令字符為: 概率密度:pdf概率分布:cdf
逆概率分布:inv均值與方差:stat
隨機數生成:rnd頻數表和直方圖一組數據(樣本)往往是雜亂無章的,作出它的頻數表和直方圖,可以看作是對這組數據的一個初步整理和直觀描述。將數據的取值范圍劃分為若干個區(qū)間,然后統(tǒng)計這組數據在每個區(qū)間中出現的次數,稱為頻數,由此得到一個頻數表。以數據的取值為橫坐標,頻數為縱坐標,畫出一個階梯形的圖,稱為直方圖,或頻數分布圖。若樣本容量不大,能夠手工作出頻數表和直方圖,當樣本容量較大時則可以借助MATLAB這樣的軟件了。1.大樣本h=jbtest(x),h=0,接受正態(tài)分布,h=1拒絕正態(tài)分布2.小樣本h=lillietest(x),h=0,接受正態(tài)分布,h=1拒絕正態(tài)分布正態(tài)分布的檢驗假設檢驗在總體服從正態(tài)分布的情況下,可用以下命令進行假設檢驗.1、總體方差sigma2已知時,總體均值的檢驗使用z-檢驗2、總體方差sigma2未知時,總體均值的檢驗使用t-檢驗3、兩總體均值的假設檢驗使用t-檢驗4、非參數檢驗:總體分布的檢驗5、假設檢驗1、總體方差sigma2已知時,總體均值的檢驗使用z-檢驗
[h,sig,ci]=ztest(x,m,sigma,alpha,tail)檢驗數據x的關于均值的某一假設是否成立,其中sigma為已知方差,alpha為顯著性水平,究竟檢驗什么假設取決于tail的取值:tail=0,檢驗假設“x的均值等于m”tail=1,檢驗假設“x的均值大于m”tail=-1,檢驗假設“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設,h=0表示不可以拒絕假設,sig為假設成立的概率,ci為均值的1-alpha置信區(qū)間.2、總體方差sigma2未知時,總體均值的檢驗使用t-檢驗
[h,sig,ci]=ttest(x,m,alpha,tail)檢驗數據x的關于均值的某一假設是否成立,其中alpha為顯著性水平,究竟檢驗什么假設取決于tail的取值:tail=0,檢驗假設“x的均值等于m”tail=1,檢驗假設“x的均值大于m”tail=-1,檢驗假設“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設,h=0表示不可以拒絕假設,sig為假設成立的概率,ci為均值的1-alpha置信區(qū)間.3、兩總體均值的假設檢驗使用t-檢驗
[h,sig,ci]=ttest2(x,y,alpha,tail)檢驗數據x,y的關于均值的某一假設是否成立,其中alpha為顯著性水平,究竟檢驗什么假設取決于tail的取值:tail=0,檢驗假設“x的均值等于y的均值”tail=1,檢驗假設“x的均值大于y的均值”tail=-1,檢驗假設“x的均值小于y的均值”tail的缺省值為0,alpha的缺省值為0.05.返回值h為一個布爾值,h=1表示可以拒絕假設,h=0表示不可以拒絕假設,sig為假設成立的概率,ci為與x與y均值差的的1-alpha置信區(qū)間.相關問題示例Matlab統(tǒng)計工具箱中的數據文件gas.mat.中提供了美國1993年一月份和二月份的汽油平均價格(price1,price2分別是一,二月份的油價,單位為美分),它是容量為20的雙樣本. 1、假設一月份油價的標準偏差是一加侖四分幣(
=4),試檢驗一月份油價的均值是否等于115. 2、試檢驗二月份油價Price2的均值是否等于115. 3、試檢驗一月份油價Price1與二月份的油價Price2均值是否相同.
例1Matlab統(tǒng)計工具箱中的數據文件gas.mat.中提供了美國1993年一月份和二月份的汽油平均價格(price1,price2分別是一,二月份的油價,單位為美分),它是容量為20的雙樣本.假設一月份油價的標準偏差是一加侖四分幣(=4),試檢驗一月份油價的均值是否等于115.解作假設:m=115.首先取出數據,用以下命令:
loadgas然后用以下命令檢驗
[h,sig,ci]=ztest(price1,115,4)返回:h=0,sig=0.8668,ci=[113.3970116.9030].檢驗結果:1.布爾變量h=0,表示不拒絕零假設.說明提出的假設均值115
是合理的.2.sig-值為0.8668,遠超過0.5,不能拒絕零假設
3.95%的置信區(qū)間為[113.4,116.9],它完全包括115,且精度很高..
返回:h=1,sig=4.9517e-004,ci=[116.8120.2].檢驗結果:1.布爾變量h=1,表示拒絕零假設.說明提出的假設油價均值115是不合理的.2.95%的置信區(qū)間為[116.8120.2],它不包括
115,故不能接受假設.3.sig-值為4.9517e-004,遠小于0.5,不能接受零假設.例2試檢驗例8中二月份油價Price2的均值是否等于115.解作假設:m=115,price2為二月份的油價,不知其方差,故用以下命令檢驗[h,sig,ci]=ttest(price2,115)返回:h=1,sig=0.0083,ci=[-5.8,-0.9].檢驗結果:1.布爾變量h=1,表示拒絕零假設.說明提出的假設“油價均值相同”是不合理的.
2.95%的置信區(qū)間為[-5.8,-0.9],說明一月份油價比二月份油價約低1至6分.
3.sig-值為0.0083,遠小于0.5,不能接受“油價均相同”假設.例3試檢驗例8中一月份油價Price1與二月份的油價Price2均值是否相同.解用以下命令檢驗[h,sig,ci]=ttest2(price1,price2)假設檢驗習題1、某車間用一臺包裝機包裝糖果。包得的袋裝糖重是一個隨機變量,它服從正態(tài)分布。當機器正常時,其均值為0.5公斤,標準差為0.015公斤。某日開工后為檢驗包裝機是否正常,隨機地抽取它所包裝的糖9袋,稱得凈重為(公斤):0.4970.5060.5180.5240.4980.5110.5200.5150.512,問機器是否正常?解:x=[0.4970.5060.5180.5240.498...0.5110.5200.5150.512]; [h,p,ci]=ztest(x,0.5,0.015)2、某種電子元件的壽命x(以小時計)服從正態(tài)分布,μ,σ2均未知.現得16只元件的壽命如下: 159280101212224379179264 222362168250149260485170 問是否有理由認為元件的平均壽命大于225(小時)?解:x=[159280101212224379179264... 222362168250149260485170]; [h,p,ci]=ttest(x,225,0.05,1)3、在平爐上進行一項試驗以確定改變操作方法的建議是否會增加鋼的得率,試驗是在同一平爐上進行的。每煉一爐鋼時除操作方法外,其它條件都可能做到相同。先用標準方法煉一爐,然后用建議的新方法煉一爐,以后交換進行,各煉了10爐,其得率分別為 a)標準方法 78.172.476.274.377.478.476.075.676.777.3 b)新方法 79.181.077.379.180.079.179.177.380.282.1 設這兩個樣本相互獨立且分別來自正態(tài)總體N(μ1,σ2)和N(μ2,σ2),μ1,μ2,σ2均未知,問建議的新方法能否提高得率?(取α=0.05)解: x=[78.172.476.274.377.478.476.075.676.7 77.3]; y=[79.181.077.379.180.079.179.177.380.2 82.1]; [h,p,ci]=ttest2(x,y,0.05,-1)4、非參數檢驗:總體分布的檢驗Matlab工具箱提供了兩個對總體分布進行檢驗的命令:(1)h=normplot(x)(2)h=weibplot(x)此命令顯示數據矩陣x的正態(tài)概率圖.如果數據來自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數顯示出曲線形態(tài).此命令顯示數據矩陣x的Weibull概率圖.如果數據來自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數將顯示出曲線形態(tài).協(xié)方差在概率論和統(tǒng)計學中,協(xié)方差用于衡量兩個變量的總體誤差。而方差是協(xié)方差的一種特殊情況,即當兩個變量是相同的情況。直觀上來看,協(xié)方差表示的是兩個變量總體的誤差,這與只表示一個變量誤差的方差不同。
1.如果兩個變量的變化趨勢一致,也就是說如果其中一個大于自身的期望值,另外一個也大于自身的期望值,那么兩個變量之間的協(xié)方差就是正值。
2.如果兩個變量的變化趨勢相反,即其中一個大于自身的期望值,另外一個卻小于自身的期望值,那么兩個變量之間的協(xié)方差就是負值。
3.如果X與Y是統(tǒng)計獨立的,那么二者之間的協(xié)方差就是0。但是,反過來并不成立。即如果X與Y的協(xié)方差為0,二者并不一定是統(tǒng)計獨立的。一元函數的數值積分一、函數:quad、quadl、quad8(P230)quad函數功能數值定積分,自適應Simpleson積分法。格式q=quad(fun,a,b)%近似地從a到b計算函數fun的數值積分,誤差為10-6。若給fun輸入向量x,應返回向量y,即fun是一單值函數。q=quad(fun,a,b,tol)%用指定的絕對誤差tol代替缺省誤差。tol越大,函數計算的次數越
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025債務轉讓合同協(xié)議范本
- 2025企業(yè)內部餐廳升級改造工程合同 施工合同協(xié)議書
- 2025二手設備轉讓合同的樣本
- 2025租賃合同印花稅計算方法探析
- 2025年食品安全試題
- 【清華大學】2024中國煤炭城市公正轉型調研報告基于兩個案例的研究報告
- 人教版八年級物理質量與密度基礎知識點歸納總結模版
- 教師參加心理健康培訓心得體會模版
- 廣西項目可行性研究報告
- 專題八房地產金融融資方式與工具創(chuàng)新
- 企業(yè)安全生產風險辨識評估管控指導手冊-危險貨物儲罐倉儲
- 大病歷體格檢查-系統(tǒng)回顧(精簡版)
- 濟南出入境檢驗檢疫局國際旅行衛(wèi)生保健中心
- 黑土地知識科學普及-黑土地保護法宣貫課件
- 毛尖茶葉批生產記錄匯總
- 維修電工求職簡歷
- 蘇教版小學數學二年級下冊課件:數據的收集和整理
- PCBA工藝介紹完整版-課件
- 衛(wèi)生管理初中級職稱大綱
- 部編本六年級下冊語文課件古詩詞誦讀
- 智能割草機器人外文文獻翻譯、中英文翻譯、外文翻譯
評論
0/150
提交評論