




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、拿答案:1144766066答案來源:雅寶題庫網(wǎng)()-南開大學(本部)20 秋學期(1709、1803、1809、1903、1909、2003、2009)網(wǎng)絡爬蟲與信息提取在線作業(yè)試卷總分:100 得分:100第 1 題,()是 Scrapy 官方開發(fā)的,用來部署、運行和管理 Scrapy 爬蟲的工具A、ScrapydB、ScrapyDeployC、DeployDScrapy_Deploy 正確答案:第 2 題,當爬蟲創(chuàng)建好了之后,可以使用scrapy()”命令運行爬蟲。A、startupB、starwarC、drawlDcrawl 正確答案:第 3 題,在 Scrapy 的目錄下,哪個文件負
2、責存放爬蟲的各種配置信息?()A、spiders 文件夾B、item.pyC、pipeline.pyDsettings.py 正確答案:第 4 題,使用 UIAutomatorr 根據(jù)坐標來滑動桌面的操作是得到相應控件后使用命令()A、swipeB、moveC、scrollDsfly 正確答案:答案來源:雅寶題庫網(wǎng)(),windows 中創(chuàng)建定時任務的命令為A、 taskB、schtasksC、createtasksDmaketasks:第 6 題,MongoDB 中數(shù)據(jù)存儲的形式類似于()AB、C、D、正確答案:第 7 題,requests 中 post 請求方法的使用為 requests.
3、post (data 為 ()A、B、C、D、正確答案:第 8 題,Python 中把列表轉(zhuǎn)換為集合需要使用#函數(shù)A、setB、listC、convertDchange正確答案:第 9 題, 使用了 RedisSpider 作為爬蟲的父類以后, 爬蟲會直接監(jiān)控()中的數(shù)據(jù), 并不讀取 start_urls中的數(shù)據(jù)。A、RedisB、RedisSpiderC、SpiderD.MongoDB正確答案:表組典合列元字集網(wǎng)址,data=data)中的表組典合列元字集答案來源:雅寶題庫網(wǎng)(),在 MacOS 下安裝 MongoDB用命令()installmongodbA、brewB、apt-getC、s
4、udoDapt正確答案:第 11 題,當需要把 Python 里面的數(shù)據(jù)發(fā)送給網(wǎng)頁時,應先將其轉(zhuǎn)換成()AJson 字符串B、GETC、POSTDRequest正確答案:答案來源:雅寶題庫網(wǎng)(),服務器端記錄信息確定用戶身份的數(shù)據(jù)是A、sessionB、cookiesC、moonpiesDlocalstorage正確答案:第 13 題,下列說法錯誤的是()A、小程序的請求極其簡單,基本上沒有驗證信息B、 用 Python 來請求小程序的后臺接口從而獲取數(shù)據(jù), 比請求異步加載網(wǎng)頁的后臺接口要復雜很多。C、如果目標網(wǎng)站有小程序,那么一定要優(yōu)先調(diào)查能否通過小程序的接口來抓取數(shù)據(jù)。Dk 小程序的反爬蟲
5、能力比網(wǎng)頁版的低很多。使用小程序的接口來爬數(shù)據(jù),能極大提高爬蟲的開發(fā)效率。正確答案:第 14 題,下面 Python 代碼輸出為():defdefault_para_trap(para=口,value=0):para.append(value)returnparaprint(第步:.format(default_para_trap(value=100)print(第二步:。.format(default_para_trap(value=50)A 第一步:100第二步:100,50B、第一步:100第二步:50C、第一步:100第二步:口DK 第一步:100第二步:100正確答案:答案來源:雅寶
6、題庫網(wǎng)(),在 Scrapy 的目錄下,哪個文件負責存放爬蟲文件?()A、spiders 文件夾B、item.pyC、pipeline.pyDsettings.py正確答案:第 16 題,xpath 中 extractA方法返回值類型是()B、C、D表組典合列元字集正確答案:第 17 題,參數(shù) headers=(),把請求頭添加到 Scrapy 請求中, 使爬蟲的請求看起來像是從瀏覽器發(fā)起的。AHEADERB、HEADERSC、HEADDBODY正確答案:第 18 題,Python 中 Object=(1,2,3,4,5),A、B、C、D則 Objcet 是()表組典合列元字集正確答案:第 1
7、9 題,在 Scrapy 的目錄下,哪個文件負責定義需要爬取的數(shù)據(jù)?()A、spiders 文件夾B、item.pyC、pipeline.pyDsettings.py正確答案:答案來源: 雅寶題庫網(wǎng)(以()形式生成AB、C、D.表組典合列元字集正確答案:),Scrapy 中使用 Xpath 狄得的結果調(diào)用了.extract 方法,結果第 21 題,Python 中的容器有()A、B、C、D.表組典合列元字集正確答案:,B,C,D第 22 題,使用 Selennium 狄取網(wǎng)頁中元素的方法有A、find_element_by_nameB、find_element_by_idC、find_elem
8、ents_by_nameDfind_elements_by_id正確答案:,B,C,D第 23 題,一個可行的自動更換代理的爬蟲系統(tǒng),應該下列哪些功能?A、有一個小爬蟲 ProxySpider 去各大代理網(wǎng)站爬取免費代理并驗證,將可以使用的代理 IP保存到數(shù)據(jù)庫中B、在發(fā)現(xiàn)某個請求已經(jīng)被設置過代理后,什么也不做,直接返回C、在 ProxyMiddlerware 的 process_request 中,每次從數(shù)據(jù)庫里面隨機選擇一條代理地址使用DK 周期性驗證數(shù)據(jù)庫中的無效代理,及時將其刪除正確答案:,C,D第 24 題,下列關于在 IOS 上配置 Charles 的說法正確的是()A、不同 io
9、s 設備之間會有比較大的差別,所以配置的時候需要找到對應的安裝證書的入口。B、手機和電腦需要在同一個局域網(wǎng)下。C、HTTP 代理可以使用自動選項。D 安裝好證書以后,打開 iOS 設備上的任何一個 App,可以看到 Charles 中有數(shù)據(jù)包在流動正確答案:,D答案來源:雅寶題庫網(wǎng)(),下列說法錯誤的是()A、mitmproxy 的強大之處在于它還自帶一個 mitmdump 命令。這個命令可以用來運行符合一定規(guī)則的 Python 腳本,并在 Python 腳本里面直接操作 HTT可口 HTTPS 勺請求,以及返回的數(shù)據(jù)包。B、命令行中執(zhí)行 mitmdump-sparse_request.py
10、即可運行 python 腳本C、使用 python 可以自定義返回的數(shù)據(jù)包,如 response.headers,就是返回的頭部信息 Dk 如果返回的是 JSONI 型的字符串,python 無法進行解析。正確答案:第 26 題,以下 HTTP 狀態(tài)碼表示服務器本身發(fā)生錯誤的是A、400B、503C、302DK500正確答案:,D第 27 題,Python 中哪種容器生成后可以修改內(nèi)容A 列表B、元組C、字典D集合正確答案:,C,DIP第 28 題,以下 HTTP 狀態(tài)碼表示服務器沒有正常返回結果的是A、200B、301C、404D.500正確答案:,C,D第 29 題,如果目標網(wǎng)站有反爬蟲聲
11、明,那么對方在被爬蟲爬取以后,可以據(jù)()來起訴使用爬蟲的公司A、服務器日志B、數(shù)據(jù)庫日志記錄C、程序日志記錄Dk 服務器監(jiān)控正確答案:,B,C,D答案來源:雅寶題庫網(wǎng)(),requests 中 post 請求方法的第二個參數(shù)可以為()A、字典B、列表C、json 數(shù)據(jù)D 字符串正確答案:,C第 31 題,process_spider_output(response,result,output)是在下載器中間件處理完成后,馬上要進入某個回調(diào)函數(shù) parse_xxx()前調(diào)用T、對F、錯正確答案:F第 32 題,需要登錄的網(wǎng)站一般通過 GET 請求就可以實現(xiàn)登錄。T、對F、錯第 33 題,Pyth
12、on 中相比于 findall 方法,search 方法對于從超級大的文本里面只找第 1 個數(shù)據(jù)特別有用,可以大大提高程序的運行效率。T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 34 題,UIAutomatorViewer 與 Pythonuiautomator 可以同時使用T、對F、錯正確答案:F第 35 題,device.sleep()方法是使用 UIAutomatorr 關閉屏幕的命令T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 36 題,在發(fā)送請求時需要注意 requests 提交的請求頭不能與瀏覽器的請求頭一致,因為這樣才能隱藏好自己達到獲取數(shù)據(jù)的目的T、對F、錯正確答案:F第 37
13、題,mitmproxy 的強大之處在于它還自帶一個 mitmdump 命令。這個命令可以用來運行符合一定規(guī)則的 Python 腳本T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 38 題,MongoDB 是一個關系數(shù)據(jù)庫產(chǎn)品T、對F、錯第 39 題,Python 正則表達式中.*?”是非貪婪模式,獲取最短的能滿足條件的字符串T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 40 題,Charles 能截獲 HTT 評口 HTTPS 勺數(shù)據(jù)包,如果網(wǎng)站使用 websocket 就可以截獲T、對F、錯正確答案:F第 41 題,Charles 和 Chrome 開發(fā)者工具相比,只是多了一個搜索功能T、對F、錯
14、正確答案:第 42 題,爬蟲中間件的激活需要另外寫一個文件來進行T、對F、錯正確答案:F第 43 題,Cookies 一般包含在請求頭 Headers 中T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 44 題,已經(jīng)創(chuàng)建好的 Scrapy 爬蟲*py 文件可以直接通過 Python 來運行T、對F、錯正確答案:F第 45 題,如果目標網(wǎng)站本身就是提供公眾查詢服務的網(wǎng)站,那么使用爬蟲是合法合規(guī)的T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 46 題,Redis 中使用 Irange 讀取數(shù)據(jù)后數(shù)據(jù)也會刪除T、對F、錯正確答案:第 47 題,開源庫 pytesseract 的作用是將圖像中文字轉(zhuǎn)換為文本T、對F、錯更多答案下載:雅寶題庫網(wǎng)()第 48 題,Scrapy 每一次發(fā)起請求之前都會在這里檢查網(wǎng)址是否重復
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 黑龍江省甘南縣聯(lián)考2024年化學九上期末復習檢測模擬試題含解析
- 遼寧省朝陽市名校2024年八上物理期末質(zhì)量跟蹤監(jiān)視試題含解析
- 廣東省湛江市雷州市2024年化學九上期末監(jiān)測試題含解析
- 分公司合作成立及地方市場拓展運營合同
- 餐飲行業(yè)食品安全風險評估與監(jiān)管合同
- 未來企業(yè)中的領導力趨勢與挑戰(zhàn)
- 2025年紀檢監(jiān)察知識試題庫(含答案)
- 高分子材料在航空航天領域的應用研究
- 算力倉儲行業(yè)租賃服務解析
- 2025至2030中國鹽酸美西律片行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報告
- 清廉講堂活動方案
- 2025年醫(yī)保知識考試題庫及答案:醫(yī)保信息化建設應用法律法規(guī)試題
- 環(huán)境現(xiàn)場采樣培訓
- 陜西省專業(yè)技術人員繼續(xù)教育2025公需課《黨的二十屆三中全會精神解讀與高質(zhì)量發(fā)展》20學時題庫及答案
- 2024-2025學年人教版數(shù)學五年級下學期期末試卷(含答案)
- 環(huán)保設施安全風險評估報告
- 食品工程原理(李云飛)第二章ppt 傳熱
- 二氧化碳氣體保護焊.ppt
- 儀表工程質(zhì)量控制點等級劃分表
- 廣東某高層小區(qū)屋面飄板模板工程專項施工方案
- IPC-A-610F通用焊接標準(經(jīng)典實用)
評論
0/150
提交評論