




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第python爬蟲urllib中的異常模塊處理目錄urllib中的異常處理url的組成部分URLErrorHTTPError簡介Urllib.error模塊異常處理
urllib中的異常處理
在我們寫爬蟲程序時,若出現(xiàn)url中的錯誤,那么我們就無法爬取我們想要的內(nèi)容,對此,我們引入了urllib中的異常處理。
url的組成部分
URL由6個部分組成:eg:
/swd=易烊千璽
協(xié)議(http/https)主機()端口號(80/443)路徑(s)參數(shù)(wd=易烊千璽)錨點
常見的端口號:
http(80)https(443)mysql(3306)oracle(1521)redis(6379)mongodb(27017)
URLError
通常來說,URLError報錯通常為url地址中主機部分的錯誤:
實例:
url='1/'
運行結(jié)果:
urllib.error.URLError:urlopenerror[Errno11001]getaddrinfofailed
HTTPError
這個異常的通常是url地址中參數(shù)或是路徑的錯誤。
實例:
url='/p/3388cf148dba1'
運行結(jié)果:
urllib.error.HTTPError:HTTPError404:NotFound
簡介
HTTPError類是URLError類的子類導(dǎo)入的包urllib.error.HTTPError/urllib.error.URLErrorhttp錯誤:http錯誤是針對瀏覽器無法連接到服務(wù)器而增加的出來的錯誤提示,引導(dǎo)并告訴瀏覽者該頁是出了什么問題。通過urllib發(fā)送請求的時候,有可能會發(fā)送失敗,這個時候如果想讓你的代碼更健壯,可以通過try-except進行捕獲異常。
Urllib.error模塊
urllib.error模塊為urllib.request所引發(fā)的異常定義了異常類,基礎(chǔ)異常類是URLError。
urllib.error包含了兩個方法,URLError和HTTPError。
URLError是OSError的一個子類,用于處理程序在遇到問題時會引發(fā)此異常(或其派生的異常)。
HTTPError是URLError的一個子類,用于處理特殊HTTP錯誤例如作為認證請求的時候,包含的屬性code為HTTP的狀態(tài)碼,reason為引發(fā)異常的原因,headers為導(dǎo)致HTTPError的特定HTTP請求的HTTP響應(yīng)頭。
異常處理
用tryexcept語句塊捕獲并處理異常,其基本語法結(jié)構(gòu)如下所示:
try:可能產(chǎn)生異常的代碼塊
except[(Error1,Error2,)[ase]]:處理異常的代碼塊1
except[(Error3,Error4,)[ase]]:處理異常的代碼塊2
except[Exception]:處理其它異常
實例:
原url=/p/3388cf148dba
源碼:
importurllib.request
importurllib.error
url='1/p/3388cf148dba'
#url的組成eg:/swd=易烊千璽
#1.協(xié)議(http/https)2.主機()3.端口號(80/443)4.路徑(s)5.參數(shù)(wd=易烊千璽)6.錨點
#常見的端口號
#http(80)https(443)mysql(3306)oracle(1521)redis(6379)mongodb(27017)
headers={
'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/98.0.4758.102Safari/537.36'
request=urllib.request.Request(url=url,headers=headers)
response=urllib.request.urlopen(request)
content=response.read().decode('utf8')
print(content)
excepturllib.error.HTTPError:
print('HTTP異常,請稍后!')
excepturllib.error.URLError:
print('URL異常,請稍后!')
1.URLError
url=1/p/3388cf148dba
運行結(jié)果:
2.HTTPError
url=/p/3388cf148dba111
運行結(jié)果:
由于HTTPRError
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 場地接待活動安全保障方案
- 剪輯教程入門培訓(xùn)
- 保安違反合同協(xié)議書
- 盈利分紅合同協(xié)議書
- 雞蛋供貨合同協(xié)議書
- 公司解聘合同協(xié)議書
- 提成合同協(xié)議書范本
- 廣告合同協(xié)議書樣板
- 合同代租協(xié)議書范本
- 房產(chǎn)質(zhì)押合同協(xié)議書
- 糖尿病健康教育預(yù)防糖尿病課件
- 小班健康教案及教學(xué)反思《疊衣服》
- DB34∕T 3269-2018 高聚物注漿技術(shù)在高速公路養(yǎng)護工程中的應(yīng)用實施指南
- 家裝設(shè)計師個人簡介范文
- 神經(jīng)介入圍手術(shù)期管理
- 南華大學(xué)學(xué)生手冊
- DL∕T 5210.6-2019 電力建設(shè)施工質(zhì)量驗收規(guī)程 第6部分:調(diào)整試驗
- 3.2.2新能源汽車電機控制器結(jié)構(gòu)及工作原理課件講解
- 我國水上運輸行業(yè)政策
- 安全員安全生產(chǎn)管理人員考試培訓(xùn)題庫
- 木工支模承包合同版
評論
0/150
提交評論