數(shù)據(jù)采集1+x初級(jí)題庫(kù)+參考答案_第1頁(yè)
數(shù)據(jù)采集1+x初級(jí)題庫(kù)+參考答案_第2頁(yè)
數(shù)據(jù)采集1+x初級(jí)題庫(kù)+參考答案_第3頁(yè)
數(shù)據(jù)采集1+x初級(jí)題庫(kù)+參考答案_第4頁(yè)
數(shù)據(jù)采集1+x初級(jí)題庫(kù)+參考答案_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)據(jù)采集1+x初級(jí)題庫(kù)+參考答案一、單選題(共41題,每題1分,共41分)1.XPath是一門在()文檔中查找信息的語(yǔ)言?A、HTMLB、JAVAC、ORACLED、XML正確答案:D2.以下xpath代碼中,能夠獲取頁(yè)面中title標(biāo)簽的內(nèi)容的是()。A、//title/@text()B、//title/textC、//title/@textD、//title/text()正確答案:D3.Tomcat默認(rèn)發(fā)布項(xiàng)目的位置為()A、appsB、webappsC、WEB-INFD、classes正確答案:B4.明知他人從事危害網(wǎng)絡(luò)安全的活動(dòng)的,不得為其提供廣告推廣、支付結(jié)算和()等幫助。A、拓展服務(wù)B、技術(shù)支持C、網(wǎng)絡(luò)推廣D、使用服務(wù)正確答案:B5.下列不屬于操作系統(tǒng)類型的是()。A、分時(shí)系統(tǒng)B、批處理系統(tǒng)C、模擬系統(tǒng)D、實(shí)時(shí)系統(tǒng)正確答案:C6.使用httpd命令查看Apache軟件的安裝版本信息,命令為()A、httpd-vB、httpd-versionC、httpdD、http正確答案:A7."<inputid="jq1"type="text"/>以下哪種可以隱藏該屬性()"A、$(#jq1).remove();B、$("jq1").hide();C、$("#jq1").hide();D、$("#jq1").remove();正確答案:C8.“內(nèi)容為一個(gè)URL,標(biāo)識(shí)用戶從該URL代表的頁(yè)面出發(fā)訪問(wèn)當(dāng)前請(qǐng)求的頁(yè)面”以上描述所指的消息頭是()。A、AcceptB、RefererC、User-AgentD、Connection正確答案:B9.HTTPS協(xié)議的默認(rèn)端口號(hào)是A、8080B、443C、88D、80正確答案:B10.刪除數(shù)據(jù)表文件的命令是()A、DELETETABLEB、DROPTABLEC、DROPD、DELETE正確答案:B11.服務(wù)器端響應(yīng)狀態(tài)碼中,表示“NOTMODIFIED文檔未修改”的是A、302B、404C、304D、200正確答案:C12.以下選項(xiàng)中符合Python語(yǔ)言變量命名規(guī)則的是A、*iB、3_1C、AI!D、Templist正確答案:D13.在學(xué)生管理數(shù)據(jù)庫(kù)中,查詢所有姓“李”的學(xué)生信息,可使用()命令。A、select*fromstudentwherename='李_';B、select*fromstudentwherenamelike'李%';C、select*fromstudentwherenamelike'%李';D、select*fromstudentwherenamein'李%';正確答案:B14.按企業(yè)編號(hào)bno分組統(tǒng)計(jì)出“staff”表中各企業(yè)人數(shù)大于1的企業(yè)編號(hào)和企業(yè)人數(shù)的SQL命令()。A、SELECTbno.COUNT(sno)FROMstaffGROUPBYbnoWHERECOUNT(sno)>1;B、SELECTbno.COUNT(sno)FROMstaffGROUPBYbnoHAVINGSUM(sno)>1;C、SELECTbno.COUNT(sno)FROMstaffGROUPBYbnoHAVINGCOUNT(sno)>1;D、SELECTbno.COUNT(sno)FROMstaffORDERBYbnoHAVING正確答案:C15.關(guān)于數(shù)據(jù)采集的描述不正確的是()A、數(shù)據(jù)采集不在于掌握龐大的的數(shù)據(jù)信息,而在于對(duì)數(shù)據(jù)的智能處理,挖掘出有價(jià)值的信息B、數(shù)據(jù)采集來(lái)源廣泛,類型也豐富多樣,很看重?cái)?shù)據(jù)處理的高效性和實(shí)時(shí)性C、數(shù)據(jù)采集,要注重?cái)?shù)據(jù)質(zhì)量和數(shù)據(jù)采集性能提升,為數(shù)據(jù)的準(zhǔn)確分析打下基礎(chǔ)D、以上描述都不正確正確答案:D16.CSS中通過(guò)哪個(gè)屬性設(shè)定元素的背景顏色()。A、background-colorB、background-imageC、back-colorD、bg-color正確答案:A17.Scrapy中,用于自定義所有Scrapy組件的行為的是()。A、ItemB、piplineC、settingsD、Spider正確答案:C18.通過(guò)在路徑表達(dá)式中使用()運(yùn)算符,您可以選取若干個(gè)路徑?A、空白B、.C、/D、|正確答案:C19.半結(jié)構(gòu)數(shù)據(jù),是介于結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化之間的數(shù)據(jù),下面不屬于半結(jié)構(gòu)化數(shù)據(jù)的是()A、JSONB、HTMLC、MPEG-1D、XML正確答案:C20.()是進(jìn)行數(shù)據(jù)清洗的工具。A、logstashB、apacheC、tomcatD、filebeat正確答案:A21.數(shù)據(jù)庫(kù)管理系統(tǒng)能實(shí)現(xiàn)建立數(shù)據(jù)庫(kù)、建立表等操作的數(shù)據(jù)庫(kù)語(yǔ)言稱為(),其主要包括CREATEDATABASE、CREATETABLE等。A、DML(數(shù)據(jù)操縱語(yǔ)言)B、DDL(數(shù)據(jù)定義語(yǔ)言)C、DQL(數(shù)據(jù)查詢語(yǔ)言)D、DCL(數(shù)據(jù)控制語(yǔ)言)正確答案:B22.Apache服務(wù)器是實(shí)現(xiàn)()網(wǎng)絡(luò)協(xié)議的服務(wù)器。A、FTPB、DHCPC、HTTPDD、HTTP正確答案:D23.HTML中用于標(biāo)記表單的是標(biāo)簽是()A、<tab>B、<table>C、<frame>D、<form>正確答案:D24.每一個(gè)表只能擁有一個(gè)()索引。A、主B、候選C、普通D、唯一正確答案:A25.CSS選擇器中,()前面以“#”號(hào)來(lái)標(biāo)志,根據(jù)元素ID來(lái)選擇元素,具有唯一性。A、類選擇器B、ID選擇器C、后代選擇器D、標(biāo)簽選擇器正確答案:B26.以下關(guān)于對(duì)數(shù)據(jù)采集要求的描述,不正確的是A、高效性B、全面性C、多維性D、非及時(shí)性正確答案:D27.以下屬于傳輸層協(xié)議的是()。A、FTPB、TCPC、HTTPD、IP正確答案:B28.Python文件的后綴名是()。A、doB、phpC、goD、py正確答案:D29.下列哪個(gè)命令用來(lái)測(cè)試網(wǎng)絡(luò)連通性()A、IpconfigB、pingC、dosD、netstat正確答案:B30.Logstash的INPUT數(shù)據(jù)輸入配置中用于開(kāi)發(fā)人員進(jìn)行測(cè)試的方式是哪一種A、filebeatB、kafkaC、fileD、stdin正確答案:D31.random庫(kù)中,用于生成隨機(jī)小數(shù)的函數(shù)是()A、random()B、randrange()C、getrandbits()D、randint()正確答案:A32.下列表達(dá)式的值為True的是()A、(3.2)<("a"."b")B、5+4j>2-3jC、"abc">"xyz"D、3>2>2正確答案:A33.re模塊的常用方法中按照能夠匹配的字符串作為分隔符,將字符串分割后返回一個(gè)列表的是()。A、compileB、searchC、matchD、split正確答案:D34.python編寫(xiě)爬蟲(chóng)過(guò)程中,需要將爬取的網(wǎng)頁(yè)內(nèi)容轉(zhuǎn)換為哪種類型的對(duì)象才可以使用etree模塊的xpath方法()A、DOMB、HTMLC、ElementD、Response正確答案:C35.進(jìn)行數(shù)據(jù)采集的工具為()A、filebeatB、apacheC、javaD、tomcat正確答案:A36.以下哪種類型的網(wǎng)絡(luò)容易遭受攻擊()。A、寬帶網(wǎng)絡(luò)B、無(wú)線網(wǎng)絡(luò)C、租用專線網(wǎng)絡(luò)D、撥號(hào)網(wǎng)絡(luò)正確答案:B37.Elasticsearch是一個(gè)構(gòu)建在()之上分布式可擴(kuò)展的實(shí)時(shí)搜索和分析引擎。A、ApacheLuceneB、HDFSC、HadoopD、Hbase正確答案:A38.Linux操作系統(tǒng)的創(chuàng)始人是()A、LunixB、LinusC、LinuxD、Lunis正確答案:B39.基本的Python內(nèi)置函數(shù)eval(x)的作用是()A、將x轉(zhuǎn)換成浮點(diǎn)數(shù)B、去掉字符串x最外側(cè)引號(hào),當(dāng)作Python表達(dá)式評(píng)估返回其值C、計(jì)算字符串x作為Python語(yǔ)句的值D、將整數(shù)x轉(zhuǎn)換為十六進(jìn)制字符串正確答案:B40.()不是用來(lái)查詢、添加、修改和刪除數(shù)據(jù)庫(kù)中數(shù)據(jù)的語(yǔ)句A、SELECTB、INSERTC、UPDATED、DROP正確答案:D41.下列哪些屬于()規(guī)范數(shù)據(jù)信息收集的方式與要求A、自然人的個(gè)人信息受法律保護(hù)B、未經(jīng)用戶同意,電信業(yè)務(wù)經(jīng)營(yíng)者、互聯(lián)網(wǎng)信息服務(wù)提供者不得收集、使用用戶個(gè)人信息C、發(fā)現(xiàn)網(wǎng)絡(luò)運(yùn)營(yíng)者收集、存儲(chǔ)的其個(gè)人信息有錯(cuò)誤的,有權(quán)要求網(wǎng)絡(luò)運(yùn)營(yíng)者予以更正D、網(wǎng)絡(luò)運(yùn)營(yíng)者應(yīng)當(dāng)對(duì)其收集的用戶信息嚴(yán)格保密,并建立健全用戶信息保護(hù)制度正確答案:A二、多選題(共21題,每題1分,共21分)1.Xpath表達(dá)式的返回值可以返回什么類型?A、布爾類型B、數(shù)字C、字符串D、節(jié)點(diǎn)值正確答案:ABCD2.關(guān)于Python注釋,以下選項(xiàng)中描述正確的是()A、注釋可以輔助程序調(diào)試B、注釋可用于標(biāo)明作者和版權(quán)信息C、注釋用于解釋代碼原理或者用途D、Python注釋語(yǔ)句不被解釋器過(guò)濾掉,也不被執(zhí)行正確答案:ABC3.requests庫(kù)發(fā)送請(qǐng)求的方法包括()等。A、GETB、POSTC、DELETED、PUT正確答案:ABCD4.以下屬于常用的日志框架的是()。A、Log4jB、Slf4jC、LogbackD、VUE正確答案:ABC5.Xpath的內(nèi)建函數(shù)可用于處理()A、日期B、比較C、數(shù)值D、字符串值正確答案:ABCD6.Scrapy架構(gòu)中,中間件包括()。A、DownloaderMiddlewaresB、SchedulerMiddlewaresC、SpiderMiddlewaresD、PipelineMiddlewares正確答案:AC7.《中華人民共和國(guó)網(wǎng)絡(luò)安全法》中規(guī)定()A、任何個(gè)人和組織不得從事非法侵入他人網(wǎng)絡(luò)、干擾他人網(wǎng)絡(luò)正常功能、竊取網(wǎng)絡(luò)數(shù)據(jù)等危害網(wǎng)絡(luò)安全的活動(dòng)B、可以提供危害網(wǎng)絡(luò)安全活動(dòng)的程序、工具C、明知他人從事危害網(wǎng)絡(luò)安全的活動(dòng)的,不得為其提供技術(shù)支持、廣告推廣、支付結(jié)算等幫助D、不得提供專門用于從事侵入網(wǎng)絡(luò)、干擾網(wǎng)絡(luò)正常功能及防護(hù)措施、竊取網(wǎng)絡(luò)數(shù)據(jù)等危害網(wǎng)絡(luò)安全活動(dòng)的程序、工具正確答案:ACD8.以下屬于CSS選擇器的是()A、ID選擇器B、標(biāo)簽選擇器C、類選擇器D、偽類選擇器正確答案:ABCD9.以下屬于jQuery特點(diǎn)的是()A、可以方便的為網(wǎng)站提供ajax交互B、是一個(gè)輕量級(jí)JavaScript庫(kù)C、容易擴(kuò)展,插件豐富D、兼容各種瀏覽器正確答案:ABCD10.以下對(duì)網(wǎng)站排名有較大影響的因素是()A、服務(wù)器穩(wěn)定性B、網(wǎng)站內(nèi)容C、Title標(biāo)簽D、Keywords標(biāo)簽正確答案:ABC11.網(wǎng)絡(luò)爬蟲(chóng)按照系統(tǒng)結(jié)構(gòu)和實(shí)現(xiàn)技術(shù),可以有以下類型()。A、聚焦網(wǎng)絡(luò)爬蟲(chóng)B、深層頁(yè)面爬蟲(chóng)C、通用網(wǎng)絡(luò)爬蟲(chóng)D、增量式網(wǎng)絡(luò)爬蟲(chóng)正確答案:ABCD12.Scrapy架構(gòu)中,中間件包括()A、DownloaderMiddlewaresB、SchedulerMiddlewaresC、SpiderMiddlewaresD、PipelineMiddlewares正確答案:AC13.以下屬于常用爬蟲(chóng)框架的是()。A、Spring框架B、Scrapy框架C、Pyspider框架D、CoB框架正確答案:BCD14.以下屬于表單<form>常用屬性的是()A、nameB、actionC、sizeD、method正確答案:ABD15.以下CSS中,屬于font屬性的是()。A、font-sizeB、font-weightC、sizeD、font-style正確答案:ABD16.以下選項(xiàng)中,()是Python語(yǔ)言的特點(diǎn)。A、變量聲明:Python語(yǔ)言具有使用變量需要先定義后使用的特點(diǎn)B、面向?qū)ο螅篜ython具有多態(tài)、運(yùn)算符重載、繼承和多重繼承等面向?qū)ο缶幊痰闹饕卣鰿、平臺(tái)無(wú)關(guān):Python程序可以在任何安裝了解釋器的操作系統(tǒng)環(huán)境中執(zhí)行D、強(qiáng)制可讀:Python語(yǔ)言通過(guò)強(qiáng)制縮進(jìn)來(lái)體現(xiàn)語(yǔ)句間的邏輯關(guān)系正確答案:BCD17.現(xiàn)在將/目錄下的www文件權(quán)限改為只有主用戶有執(zhí)行的權(quán)限,其他用戶沒(méi)有執(zhí)行權(quán)限()A、chmodu+x.g-x.o-x/wwwB、chmodo-x.g-x.u-x/wwwC、chmod001/wwwD、chmod100/www正確答案:AD18.sql語(yǔ)言分為以下()幾類A、DCLB、DDLC、DMLD、DQL正確答案:ABCD19.以下關(guān)于索引的說(shuō)法正確的是()。A、可以加快數(shù)據(jù)的檢索速度B、唯一性索引可以保證數(shù)據(jù)記錄的唯一性C、可以加快表與表之間的連接D、索引不需要花費(fèi)代價(jià)占用存儲(chǔ)空間就可以實(shí)現(xiàn)檢索速度的提高正確答案:ABC20.數(shù)據(jù)采集,從網(wǎng)頁(yè)或各業(yè)務(wù)系統(tǒng)中來(lái)抽取數(shù)據(jù),并進(jìn)行本地存儲(chǔ),其具體步驟包括()。A、存儲(chǔ)數(shù)據(jù)B、分析數(shù)據(jù)C、清洗數(shù)據(jù)D、采集數(shù)據(jù)正確答案:ACD21.BeautifulSoup支持Python標(biāo)準(zhǔn)庫(kù)中的HTML解析器以及一些第三方的解析器,常見(jiàn)的解析器有()。A、Python標(biāo)準(zhǔn)庫(kù)B、lxmlHTML解析器C、lxmlXML解析器D、html5lib正確答案:ABCD三、判斷題(共37題,每題1分,共37分)1.進(jìn)程具備多種特性,如:動(dòng)態(tài)性、順序性、獨(dú)立性和同步性A、正確B、錯(cuò)誤正確答案:B2.vi命令模式中a是從光標(biāo)所在位置后面開(kāi)始新增內(nèi)容。A、正確B、錯(cuò)誤正確答案:A3.Robots協(xié)議全稱是“網(wǎng)絡(luò)爬蟲(chóng)排除標(biāo)準(zhǔn)”,網(wǎng)站通過(guò)Robots協(xié)議告訴搜索引擎哪些頁(yè)面可以抓取,哪些頁(yè)面不能抓取。A、正確B、錯(cuò)誤正確答案:A4.tomcat不是web容器A、正確B、錯(cuò)誤正確答案:B5.域名是個(gè)邏輯概念,一般指向計(jì)算機(jī)所在的物理地點(diǎn)。A、正確B、錯(cuò)誤正確答案:B6.不經(jīng)用戶同意,電信業(yè)務(wù)經(jīng)營(yíng)者、互聯(lián)網(wǎng)信息服務(wù)提供者可以收集、使用用戶個(gè)人信息A、正確B、錯(cuò)誤正確答案:B7.Linux中終止進(jìn)程的命令可以用kill。A、正確B、錯(cuò)誤正確答案:A8.Python語(yǔ)言是腳本語(yǔ)言A、正確B、錯(cuò)誤正確答案:A9.tomcat也叫servlet容器。A、正確B、錯(cuò)誤正確答案:A10.文件共享是指系統(tǒng)允許多個(gè)用戶或者進(jìn)程去共享同一個(gè)文件,文件共享只限于系統(tǒng)內(nèi)共享。A、正確B、錯(cuò)誤正確答案:B11.GET是最常用的請(qǐng)求方式,數(shù)據(jù)安全性和保密性比較低;POST請(qǐng)求方式可以將傳輸?shù)臄?shù)據(jù)封裝在報(bào)文的請(qǐng)求中,對(duì)傳輸大小存在限制。A、正確B、錯(cuò)誤正確答案:B12.Python標(biāo)準(zhǔn)庫(kù)中的re模塊提供正則表達(dá)式的全部功能,可以直接引入。A、正確B、錯(cuò)誤正確答案:A13.關(guān)系模型就是一張二維表,一個(gè)關(guān)系型數(shù)據(jù)庫(kù)就是若干個(gè)二維表的集合。A、正確B、錯(cuò)誤正確答案:A14.<head>和</head>分別表示文檔的開(kāi)始和結(jié)束,用于告知瀏覽器其自身是一個(gè)HTML文檔。A、正確B、錯(cuò)誤正確答案:B15.關(guān)鍵詞需要考慮密度,不能堆積A、正確B、錯(cuò)誤正確答案:A16.堆疊是用專用的端口把交換機(jī)連接起來(lái),當(dāng)作一個(gè)交換機(jī)使用。A、正確B、錯(cuò)誤正確答案:A17.在TCP/IP協(xié)議中,TCP提供可靠的面向連接服務(wù),UDP提供簡(jiǎn)單的無(wú)連接服務(wù)A、正確B、錯(cuò)誤正確答案:A18.防火墻可以完全控制外部用戶對(duì)Intranet的入侵與破壞A、正確B、錯(cuò)誤正確答案:B19.JavaScript中標(biāo)識(shí)符首字母不能為數(shù)字A、正確B、錯(cuò)誤正確答案:A20.傳輸層是通過(guò)建立物理連接來(lái)進(jìn)行數(shù)據(jù)傳輸?shù)腁、正確B、錯(cuò)誤正確答案:B21.HTTP的head消息“referer”的作用是告知服務(wù)器是從哪個(gè)資源轉(zhuǎn)到當(dāng)前資源上來(lái)的。A、正確B、錯(cuò)誤正確答案:A22.訪問(wèn)某個(gè)網(wǎng)站,可以直接通過(guò)域名或服務(wù)的URL進(jìn)行訪問(wèn)A、正確B、錯(cuò)誤正確答案:A23.在關(guān)系型數(shù)據(jù)庫(kù)中,數(shù)據(jù)元素是最基本的數(shù)據(jù)單元,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論