




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
Python基礎(chǔ)Python自然語言處理第二章CONTENT目錄
01Python開發(fā)環(huán)境的搭建02正則表達(dá)式在自然語言處理中的應(yīng)用03Numpy的詳細(xì)使用方法課前回顧匹配字符串使用轉(zhuǎn)義符抽取文本中的數(shù)字
Numpy的詳細(xì)使用方法03創(chuàng)建數(shù)組ndarray作為Numpy當(dāng)中最為核心的數(shù)據(jù)結(jié)構(gòu),代表的是多維數(shù)組,數(shù)組指的是數(shù)據(jù)的集合。#(1)導(dǎo)入numpy包as為其取一個別名npimportnumpyasnpvector=np.array([20152011,20152012,20152013,20152014])matrix=np.array([[20152011,'Jill'],[20152012,'Amy'],[20152013,'Ada'],[20152014,'Lucy']])#(2)使用Numpy庫當(dāng)中的array()方法,可以實(shí)現(xiàn)向量的直接導(dǎo)入#(3)使用numpy.array方法,也可以實(shí)現(xiàn)矩陣的直接導(dǎo)入[['20152011''Jill']['20152012''Amy']['20152013''Ada']['20152014''Lucy']]獲取Numpy中數(shù)組的維度Numpy中的一個方法arange(n),其功能是生成一個0到n-1的數(shù)組。在此基礎(chǔ)上使用Numpy中的reshape(row,column)方法,自動構(gòu)架一個多行多列的array對象。importnumpyasnpdata=np.arange(16).reshape(4,4)#代表4行4列print(data)print(data.shape)[[0123][4567][891011][12131415]](4,4)獲取本地數(shù)據(jù)使用Numpy中提供的genfromtxt()方法來讀取本地的數(shù)據(jù)集importnumpyasnpnf1=np.genfromtxt("/home/ubuntu/crimeRatesByState2005.csv",delimiter=",")print(nf1)在Numpy數(shù)組中的數(shù)據(jù)必須是相同的數(shù)據(jù)類型,例如整型(int)、字符串類型(string)、布爾類型(bool)以及浮點(diǎn)型(float)。Numpy具備自動識別數(shù)組內(nèi)對象類型的功能,也可以使用Numpy數(shù)組所提供的dtype屬性來獲取對應(yīng)數(shù)據(jù)的類型。正確讀取數(shù)據(jù)對于數(shù)據(jù)類型轉(zhuǎn)換的出現(xiàn)的錯誤,可以使用Numpy中提供的genfromtxt()方法來實(shí)現(xiàn)數(shù)據(jù)類型的轉(zhuǎn)換,對于genfromtxt()的參數(shù)做一下解釋:1.dtype關(guān)鍵字的值要設(shè)定為‘U75’,代表每個值都是75byte的unicode。2.skip_header關(guān)鍵字的值可以設(shè)置為整數(shù),這個參數(shù)的功能是跳過文件開頭對應(yīng)的行數(shù)之后執(zhí)行任何其他操作。importnumpyasnpnfl=np.genfromtxt("/home/ubuntu/crimeRatesByState2005.csv",dtype='U75',skip_header=1,delimiter=",")print(nfl)Numpy數(shù)組索引importnumpyasnpmatrix=np.array([[4,5,6],[7,8,9]])print(matrix[1,2])。與list相類似,Numpy同樣支持相關(guān)的定位操作。切片importnumpyasnpmatrix=np.array([[10,20,30],[40,50,60],[70,80,90]])print(matrix[:,1])print(matrix[:,0:2])print(matrix[1:3,:])print(matrix[1:3,0:2])與list相類似,Numpy同樣支持切片操作[205080][[1020][4050][7080]][[405060][708090]][[4050][7080]]數(shù)組比較Numpy也提供了較為強(qiáng)大的矩陣和數(shù)組比較功能,對于數(shù)據(jù)的比較,最終輸出的結(jié)果為boolean值。importnumpyasnpmatrix=np.array([[10,20,30],[40,50,60],[70,80,90]])second_column_50=(matrix[:,1]==50)print(second_column_50)print(matrix[second_column_50,:])[[FalseFalseFalse][FalseTrueFalse][FalseFalseFalse]][[FalseFalseFalse][FalseTrueFalse][FalseFalseFalse]]importnumpyasnpmatrix=np.array([[10,20,30],[40,50,60],[70,80,90]])m=(matrix==50)print(m)替代值我們先創(chuàng)立數(shù)組matrix。將matrix的第二列和50比較,得到一個布爾值數(shù)組。second_column_50將matrix第二列值為50的替換為20。importnumpyvector=numpy.array([10,20,30,40])equal_to_ten_or_five=(vector==20)|(vector==20)vector[equal_to_ten_or_five]=200print(vector)[[FalseFalseFalse][FalseTrueFalse][FalseFalseFalse]]importnumpymatrix=numpy.array([[10,20,30],[40,50,60],[70,80,90]])second_column_50=matrix[:,1]==50matrix[second_column_50,1]=20print(matrix)[[102030][402060][708090]]在數(shù)組中:在矩陣中:替代值把空值替換為“0”的操作。importnumpyasnpmatrix=np.array([['10','20','30'],['40','50','60'],['70','80','']])second_column_50=(matrix[:,2]=='')matrix[second_column_50,2]='0'print(matrix)數(shù)據(jù)類型轉(zhuǎn)換使用astype()方法對數(shù)據(jù)類型進(jìn)行轉(zhuǎn)換時,其結(jié)果是一個新的數(shù)組,可以理解為對原始數(shù)據(jù)的一份復(fù)制,但不同的是數(shù)據(jù)的數(shù)據(jù)類型。比如,把String轉(zhuǎn)換成float。如下:importnumpyvector=numpy.array(["22","33","44"])vector=vector.astype(float)print(vector)在以上的Python代碼中,假如在字符串中含有非數(shù)字類型的對象,string轉(zhuǎn)化為float就會報錯。Numpy的統(tǒng)計計算方法重要的統(tǒng)計方法1.max():用于統(tǒng)計計算出數(shù)組元素當(dāng)中的最大值;對于矩陣計算結(jié)果為一個一維數(shù)組,需要指定行或者列。2.mean():用于統(tǒng)計計算數(shù)組元素當(dāng)中的平均值;對于矩陣計算結(jié)果為一個一維數(shù)組,需要指定行或者列。3.sum():用于統(tǒng)計計算數(shù)組元素當(dāng)中的和;對于矩陣計算結(jié)果為一個一維數(shù)組,需要指定行或者列。數(shù)值類型必須是int或者float。Numpy的統(tǒng)計計算方法數(shù)組例子:importnumpyvector=numpy.array([10,20,30,40])print(vector.sum())矩陣?yán)樱篿mportnumpyasnpmatrix=np.array([[10,20,30],[40,50,60],[70,80,90]])print(matrix.sum(axis=1))print(np.array([5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 油煙凈化安裝協(xié)議書
- 夢見簽訂賠償協(xié)議書
- 材料節(jié)超獎罰協(xié)議書
- 大班幼兒近視預(yù)防教育指南
- 火焰及其燃燒現(xiàn)象的探究教學(xué)課件
- 三下語文第四單元課件
- 高中數(shù)學(xué)數(shù)列復(fù)習(xí)課件及教案
- 行政管理的經(jīng)典試題及答案探討
- 市政學(xué)研究方法與考試題及答案
- 行政管理專科學(xué)生的市政學(xué)試題及答案
- 2025團(tuán)員考試試題及答案
- 2025年全國防災(zāi)減災(zāi)日專題培訓(xùn)課件
- 2025年中考語文二輪復(fù)習(xí):說明文閱讀 測試卷(含答案解析)
- 視頻監(jiān)控介紹課件
- 統(tǒng)計學(xué)試題及答案解析
- 2025年北京市豐臺區(qū)九年級初三一模道德與法治試卷(含答案)
- 快遞員(初級)模擬試題含答案
- 《建筑工程設(shè)計文件編制深度規(guī)定(2016版)》
- 土地政策學(xué)終結(jié)性考核-國開(SC)-參考資料
- JT-T 1495-2024 公路水運(yùn)危險性較大工程專項(xiàng)施工方案編制審查規(guī)程
- 2017版銀皮書(中英文完整版)FIDIC設(shè)計采購施工交鑰匙項(xiàng)目合同條件
評論
0/150
提交評論