2025春國開《電子商務(wù)數(shù)據(jù)分析與應(yīng)用》形考任務(wù)1-5答案_第1頁
2025春國開《電子商務(wù)數(shù)據(jù)分析與應(yīng)用》形考任務(wù)1-5答案_第2頁
2025春國開《電子商務(wù)數(shù)據(jù)分析與應(yīng)用》形考任務(wù)1-5答案_第3頁
2025春國開《電子商務(wù)數(shù)據(jù)分析與應(yīng)用》形考任務(wù)1-5答案_第4頁
2025春國開《電子商務(wù)數(shù)據(jù)分析與應(yīng)用》形考任務(wù)1-5答案_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

2025春國開《電子商務(wù)數(shù)據(jù)分析與應(yīng)用》形考任務(wù)1答案一、單選題1、電子商務(wù)數(shù)據(jù)的獲取途徑不包括()A.產(chǎn)品自有數(shù)據(jù)B.調(diào)查問卷C.互聯(lián)網(wǎng)數(shù)據(jù)導(dǎo)入D.從別人數(shù)據(jù)庫竊取2、請判斷下面各項數(shù)據(jù)的結(jié)構(gòu)化類型:()A.結(jié)構(gòu)化數(shù)據(jù)B.半結(jié)構(gòu)化數(shù)據(jù)C.非結(jié)構(gòu)化數(shù)據(jù)D.以上都不對3、請判斷下面各項數(shù)據(jù)的結(jié)構(gòu)化類型:()A.結(jié)構(gòu)化數(shù)據(jù)B.半結(jié)構(gòu)化數(shù)據(jù)C.非結(jié)構(gòu)化數(shù)據(jù)D.以上都不對4、請判斷下面各項數(shù)據(jù)的結(jié)構(gòu)化類型:A.結(jié)構(gòu)化數(shù)據(jù)B.半結(jié)構(gòu)化數(shù)據(jù)C.非結(jié)構(gòu)化數(shù)據(jù)D.以上都不對5、請判斷下面各項數(shù)據(jù)的結(jié)構(gòu)化類型:A.結(jié)構(gòu)化數(shù)據(jù)B.半結(jié)構(gòu)化數(shù)據(jù)C.非結(jié)構(gòu)化數(shù)據(jù)D.以上都不對6、請判斷下面各項數(shù)據(jù)的結(jié)構(gòu)化類型:A.結(jié)構(gòu)化數(shù)據(jù)B.半結(jié)構(gòu)化數(shù)據(jù)C.非結(jié)構(gòu)化數(shù)據(jù)D.以上都不對7、請判斷下面各項數(shù)據(jù)的結(jié)構(gòu)化類型:A.結(jié)構(gòu)化數(shù)據(jù)B.半結(jié)構(gòu)化數(shù)據(jù)C.非結(jié)構(gòu)化數(shù)據(jù)D.以上都不對8、以下哪個不是基于電商平臺的基礎(chǔ)數(shù)據(jù)?A.商品數(shù)據(jù)B.客戶基本信息數(shù)據(jù)C.客戶評價數(shù)據(jù)D.互聯(lián)網(wǎng)金融數(shù)據(jù)9、隨著電子商務(wù)的發(fā)展,國內(nèi)電子商務(wù)研究性網(wǎng)站也隨著增多,比較典型的有()A.中國電子商務(wù)研究中心B.阿里研究院C.艾瑞咨詢D.以上全部10、下列可以導(dǎo)入Python模塊的語句是A.importmoduleB.inputmoduleC.printmoduleD.defmodule11、以下屬于內(nèi)部數(shù)據(jù)獲取渠道的是A.多多參謀B.店偵探C.百度統(tǒng)計D.店數(shù)據(jù)12、數(shù)據(jù)采集的基本方法包括()、網(wǎng)絡(luò)數(shù)據(jù)采集法和其他數(shù)據(jù)采集法。A.數(shù)據(jù)庫采集法B.訪問記錄采集法C.數(shù)據(jù)目錄采集法D.系統(tǒng)日志采集法13、商務(wù)數(shù)據(jù)包括()A.電子商務(wù)平臺的基礎(chǔ)數(shù)據(jù)B.電子商務(wù)專業(yè)網(wǎng)站的研究數(shù)據(jù)C.電子商務(wù)媒體報道D.以上全部14、以下關(guān)于數(shù)據(jù)采集說法正確的是()A.爬蟲類采集工具可以采集所有類型的數(shù)據(jù)B.淘寶網(wǎng)店的運營數(shù)據(jù)可以通過使用友盟等統(tǒng)計工具進行采集C.第三方電商網(wǎng)站可以使用百度統(tǒng)計采集店鋪運營數(shù)據(jù)D.店偵探可以獲取店鋪的詳細銷售數(shù)據(jù)15、電子商務(wù)數(shù)據(jù)的主要來源包括()A.電子商務(wù)平臺B.社交電商平臺C.O2O數(shù)據(jù)D.以上全部16、()指企業(yè)針對個人開展電子商務(wù)活動的平臺,如企業(yè)通過平臺為個人提供在線醫(yī)療咨詢、在線商品購買等服務(wù)。企業(yè)或商家機構(gòu)通過平臺不消費者進行各種商務(wù)活動、交易活動、金融活動和綜合服務(wù)活動,是消費者利用互聯(lián)網(wǎng)直接參與經(jīng)濟活動的形式。A.B2B平臺B.社交零售電商C.B2C平臺D.C2C平臺17、數(shù)據(jù)處理一般指對數(shù)據(jù)進行()、()、()、和()的過程。A.采集、分析、分析、可視化表達B.整理、采集、分析、可視化表達C.采集、整理、分析、可視化表達D.整理、可視化表達、分析、采集18、數(shù)據(jù)采集可為數(shù)據(jù)處理()的數(shù)據(jù)。A.準(zhǔn)備必要B.整理必要C.分析必要D.匯報必要19、以下關(guān)于數(shù)據(jù)采集說法正確的()A.同一數(shù)據(jù)如果有多個來源途徑,可以選擇其中的任一個來源進行采集B.數(shù)據(jù)采集人員需要針對數(shù)據(jù)采集需求、背景等對數(shù)據(jù)采集渠道進行可信度劃分,優(yōu)先選擇可信度更高的數(shù)據(jù)采集渠道C.數(shù)據(jù)采集渠道可信度與數(shù)據(jù)采集的背景和指標(biāo)無關(guān),屬于獨立的體系D.數(shù)據(jù)采集渠道無所謂優(yōu)劣,主要看能否獲取到所需數(shù)據(jù)20、以下屬于客戶流量屬性的是()A.來源頁面B.常用設(shè)備C.客戶下載D.客戶性別21、下列數(shù)據(jù)指標(biāo)中不屬于客戶行為的是()。A.購買時間B.瀏覽路徑C.支付金額D.收貨地址22、某網(wǎng)店準(zhǔn)備按照店鋪產(chǎn)品的引流能力及盈利能力兩項數(shù)據(jù)分別對產(chǎn)品進行排序,將兩項數(shù)據(jù)指標(biāo)排名均靠后的5款產(chǎn)品進行下架處理。根據(jù)以上情景可確定數(shù)據(jù)分析目標(biāo)為()A.分析店鋪商品的引流能力和盈利能力B.分店鋪商品中能夠穩(wěn)定獲利的商品C.分析店鋪商品的展現(xiàn)量D.分析店鋪商品的推廣效果23、在數(shù)據(jù)采集過程中并非所有需要的數(shù)據(jù)指標(biāo)都可以采集到,在這種情況下以下做法正確的是()。A.可以使用能夠反映該指標(biāo)的其他數(shù)據(jù)替代B.不需要采集C.想盡一切辦法尋找可以采集到該指標(biāo)的數(shù)據(jù)數(shù)據(jù)渠道D.忽略該數(shù)據(jù)的采集任務(wù)24、選項中關(guān)于爬蟲知識的說法錯誤的是:A.爬蟲是一個獲取網(wǎng)頁數(shù)據(jù),并提取、保存信息的自動化程序B.爬蟲工作通常分為三步:獲取網(wǎng)頁-解析網(wǎng)頁-存儲數(shù)據(jù)C.使用爬蟲時應(yīng)遵循Robots協(xié)議D.爬蟲可以隨意抓取Robots協(xié)議中標(biāo)注Disallow的數(shù)據(jù)二、判斷題1、電子商務(wù)數(shù)據(jù)是對電子商務(wù)活動中客觀事物的邏輯歸納,可以用符號和字母等方式對客觀事物進行直觀描述。A.是B.否2、評論數(shù)據(jù)主要以圖片形式出現(xiàn)。A.是B.否3、通過大數(shù)據(jù)進行維度分析展現(xiàn)品牌印象關(guān)鍵詞,和產(chǎn)品的運營方式,幫助企業(yè)更好的掌握發(fā)展趨勢。A.是B.否4、通過大數(shù)據(jù)技術(shù),可以實現(xiàn)企業(yè)的客戶資源進行精準(zhǔn)鎖定,在企業(yè)在運營過程中,客戶資源的挖掘方式、具體情況和分布情況等,企業(yè)都可以進行搜集分析,形成基于企業(yè)的資源分布可視圖,就如同“電子地圖”一般。A.是B.否5、數(shù)據(jù)采集時需要數(shù)據(jù)采集人員不惜任何手段獲取所有需要的數(shù)據(jù)。A.是B.否6、在分析全店某段時間內(nèi)的客單價時,需要采集的數(shù)據(jù)指標(biāo)有該段時間內(nèi)店鋪成交客戶數(shù)及成交總額。A.是B.否7、某網(wǎng)店準(zhǔn)備分析一段時間內(nèi)的全店轉(zhuǎn)化率,需要采集的數(shù)據(jù)指標(biāo)有該段時間內(nèi)的店鋪訪客數(shù)及成交訪客數(shù)。A.是B.否8、在數(shù)據(jù)采集工具選擇過程中需要注意工具的功能及適用范圍。A.是B.否9、電子商務(wù)數(shù)據(jù)采集時對于一些無法使用采集工具采集的數(shù)據(jù),可以對其進行摘錄。A.是B.否10、電子商務(wù)數(shù)據(jù)采集渠道包含權(quán)威網(wǎng)站、數(shù)據(jù)機構(gòu)、個人網(wǎng)站。A.是B.否11、價格會或價格決策關(guān)系到企業(yè)的利潤、成本補償、以及是否有利于產(chǎn)品銷售、促銷等問題,可以說價格在一定程度上影響著產(chǎn)品的生命力。A.是B.否12、把實際完成值與目標(biāo)值進行對比,屬于縱比。A.是B.否13、企業(yè)與行業(yè)中的標(biāo)桿企業(yè)、競爭對手或行業(yè)平均水平進行對比,這屬于橫比。A.是B.否14、AB測試是指設(shè)計兩個版本(A和B),A為目前的版本,B是猜想更好的版本或者新的版本。然后,通過測試比較這兩個版本之間你所關(guān)心的數(shù)據(jù),最后選擇效果最好的版本。A.是B.否15、杜邦分析法利用幾種主要的財務(wù)比率之間的關(guān)系綜合地分析企業(yè)的財務(wù)狀況。具體來說,它是一種用來評價公司盈利能力和股東權(quán)益回報水平,從財務(wù)角度評價企業(yè)績效的經(jīng)典方法。A.是B.否16、對比分析法在做淘寶數(shù)據(jù)分析過程中是常用的,例如競爭對手分析通過把我們的實際數(shù)據(jù)和競爭對手的數(shù)據(jù)進行比較,了解之間的差異并分析原因。A.是B.否17、用漏斗圖分析法不能直觀地看到每個環(huán)節(jié)的情況,不能看到每個環(huán)節(jié)的轉(zhuǎn)化情況、流失情況。A.是B.否18、問題樹分析法是將問題的所有子問題分層羅列,從最高層開始,并逐步向下擴展,把一個已知問題當(dāng)成樹干,然后開始考慮這個問題和哪些相關(guān)問題或者子任務(wù)有關(guān)。每想到一點,就給這個問題(也就是樹干)加一個“樹枝”,并標(biāo)明這個“樹枝”代表什么問題。一個大的“樹枝”上還可以有小的“樹枝”,以此類推,找出問題的所有相關(guān)聯(lián)項目。A.是B.否19、像賬號密碼這種私密的信息,網(wǎng)站基本不會使用GET請求去處理,而更多會使用POST請求去提交這些數(shù)據(jù)。GET請求更多用于獲取網(wǎng)頁內(nèi)容。A.是B.否20、requests庫主要作用是從網(wǎng)站服務(wù)器獲取請求的數(shù)據(jù),requests庫可直接使用,無需進行任何安裝A.是B.否21、是誰來做屬于5W2H中why的范疇。A.是B.否22、下列選項中,與目標(biāo)對比、行業(yè)內(nèi)對比、不同時期對比、活動效果對比屬于對比分析法分析維度。A.是B.否23、想要采集某獨立商城上行業(yè)竟品商品銷售價格,可以使用百度指數(shù)數(shù)據(jù)采集工具進行采集。A.是B.否24、數(shù)據(jù)分析的方法有AB測試法、杜邦分析法、對比分析法、5W2H分析法。A.是B.否25、數(shù)據(jù)分析中市場類指標(biāo)主要用于描述行業(yè)情況和企業(yè)在行業(yè)中的發(fā)展情況,平均購買次數(shù)、活躍客戶比率屬于市場類指標(biāo)。A.是B.否26、下列選項中,哪些屬于5W2H中Howmuch的范疇()?A.是誰來做?B.做到什么程度?C.在哪里做?D.是什么時候做?

2025春國開《電子商務(wù)數(shù)據(jù)分析與應(yīng)用》形考任務(wù)2答案單選題1、下列關(guān)于為什么要做數(shù)據(jù)清理描述錯誤的是()A.數(shù)據(jù)有重復(fù)B.數(shù)據(jù)有錯誤C.數(shù)據(jù)有缺失D.數(shù)據(jù)量太大2、下列關(guān)于數(shù)據(jù)清理描述錯誤的是()A.數(shù)據(jù)清理能完全解決數(shù)據(jù)質(zhì)量差的問題B.數(shù)據(jù)清理在數(shù)據(jù)分析過程中是不可或缺的一個環(huán)節(jié)C.數(shù)據(jù)清理的目的是提高數(shù)據(jù)質(zhì)量D.可以借助Kettle來完成大量的數(shù)據(jù)清理工作3、下列關(guān)于使用參照表清洗數(shù)據(jù)說法錯誤的是()A.有些數(shù)據(jù)無法從內(nèi)部發(fā)現(xiàn)錯誤,需要結(jié)合外部的數(shù)據(jù)進行參照B.只要方法得當(dāng),數(shù)據(jù)內(nèi)部是可以發(fā)現(xiàn)錯誤的,不需要借助參照表C.使用參數(shù)表可以校驗數(shù)據(jù)的準(zhǔn)確性D、使用參照表可以處理數(shù)據(jù)的一致性4、某店鋪2019年度會員信息表中,某會員的出生年份是1990年,但年齡卻記錄為25歲,此類錯誤需要進行()。A.缺失值清洗B.重復(fù)值清洗C.邏輯值清洗D.無價值數(shù)據(jù)清洗5、關(guān)于數(shù)據(jù)清洗的作用,下列說法正確的是()。A.去重、補漏、計算B.去重、補漏、糾錯C.補漏、糾錯、計算D.去重、計算、糾錯6、數(shù)據(jù)清洗時,運營數(shù)據(jù)中出現(xiàn)“下單時間2088-12-12”,屬于()。A.缺失值清洗B.格式內(nèi)容清洗C.邏輯錯誤清洗D.重復(fù)數(shù)據(jù)清洗7、以下說法錯誤的是()A.數(shù)據(jù)預(yù)處理的主要流程為數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換與數(shù)據(jù)歸約B.數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)歸約這些步驟在數(shù)據(jù)預(yù)處理活動中必須順序使用C.冗余數(shù)據(jù)的刪除既是一種數(shù)據(jù)清理形式,也是一種數(shù)據(jù)歸約D.整個預(yù)處理過程要盡量人機結(jié)合,尤其要注重和客戶以及專家多交流8、處理噪聲的方法一般有()A.分箱B.回歸C.聚類D.以上都是9、數(shù)據(jù)集成的過程中需要處理的問題有()A.實體識別B.冗余與相關(guān)性分析。C.數(shù)據(jù)沖突和檢測D.以上都是10、數(shù)據(jù)歸約的方法有()A.維度歸約B.數(shù)量歸約C.數(shù)據(jù)壓縮D.以上都是11、關(guān)于數(shù)據(jù)重塑的說法中,下列選項描述錯誤的是()。A.數(shù)據(jù)重塑可以將DataFrame轉(zhuǎn)換為SeriesB.stack()方法可以將列索引轉(zhuǎn)換為行索引C.對一個DataFrame使用stack()方法后返回的一定是一個SeriesD..unstack()方法可以將行索引轉(zhuǎn)換為列索引12.12.請閱讀下面的程序:執(zhí)行上述程序后,最終輸出的結(jié)果為()。A.0False1False2TrueB..0True1True2FalseC..0False1False2FalseD..0True1True2True13、下列選項中,關(guān)于drop_duplicates()方法描述錯誤的是()。A.僅支持單一特征數(shù)據(jù)的去重B..僅對Series和DataFrame對象有效C.數(shù)據(jù)去重時默認(rèn)保留第一個數(shù)據(jù)D.該方法不會改變原始數(shù)據(jù)排列14、下列選項中,關(guān)于dropna()方法描述正確的是()。A.dropna()方法只會刪除值為NaN的數(shù)據(jù)B.dropna()方法不會刪除值為None的數(shù)據(jù)C.dropna()方法會刪除值為None和NaN的數(shù)據(jù)D.dropna()方法只會檢測缺失數(shù)據(jù)和空值15、下列選項中,關(guān)于duplicated()方法描述正確的是()。A.duplicate()方法用于刪除重復(fù)值B.duplicate()方法用于標(biāo)記重復(fù)值C.duplicate()方法會改變原始數(shù)據(jù)D.duplicate()方法會將重復(fù)的數(shù)據(jù)標(biāo)記為False16、下列選項中,屬于數(shù)據(jù)處理的目的是()A.使數(shù)據(jù)更加適用于分析B.對無意義的數(shù)據(jù)進行清洗C.整合數(shù)據(jù)D.以上全部17、數(shù)據(jù)清洗的主要內(nèi)容包括()。A.缺失值清洗B.格式內(nèi)容清洗C.邏輯錯誤清洗D.以上全部18、在數(shù)據(jù)表里,缺失值常見的表現(xiàn)形式是()。A.空值B.錯誤標(biāo)識符C.#DIV/0!D.119、數(shù)據(jù)清洗時,處理缺失值的方法不包括()。A.刪除單元格B.刪除記錄C.數(shù)據(jù)補齊D.不處理20、數(shù)據(jù)邏輯錯誤不包括()。A.數(shù)據(jù)不合理B.數(shù)據(jù)自相矛盾C.數(shù)據(jù)不符合規(guī)則D.數(shù)據(jù)格式錯誤21、下列選項中,關(guān)于數(shù)據(jù)預(yù)處理說法正確的是()。A.數(shù)據(jù)清洗包含了數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)合并和缺失值處理B.數(shù)據(jù)合并按照合并軸的方向主要分為左連接、右連接、內(nèi)連接和外連接C.數(shù)據(jù)分析的預(yù)處理過程包括數(shù)據(jù)清洗、數(shù)據(jù)合并、數(shù)據(jù)標(biāo)準(zhǔn)化和數(shù)據(jù)轉(zhuǎn)換,它們之間存在交叉,沒有嚴(yán)格的先后關(guān)系D.數(shù)據(jù)標(biāo)準(zhǔn)化的主要對象是類別型特征22、檢測出異常值之后,通常會采用哪些方式處理它們?()A.直接將含有異常值的記錄刪除B.用具體的值來進行替換,可用前后兩個觀測值的平均值修正該異常值C.不處理,直接在具有異常值的數(shù)據(jù)集上進行統(tǒng)計分析D.以上全部23、下列函數(shù)中,可以對數(shù)據(jù)進行的合并的是()。A.concat()B..join()C..merge()D.以上全部24、下列方法中,可以修改數(shù)據(jù)類型的是()。A.desc()B.to_numberic()C.dim()D.type()25、下列關(guān)于重復(fù)值處理的說法中,錯誤的是()。A.duplicated()方法可以標(biāo)記重復(fù)數(shù)據(jù)B.drop_duplicates()方法用于刪除重復(fù)數(shù)據(jù)C.重復(fù)數(shù)據(jù)的判斷標(biāo)準(zhǔn)是兩個數(shù)據(jù)中所有條目的值都相等D.duplicated()方法支持從前向后和從后向前兩種查找模式二、判斷題1、數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘中必不可少的關(guān)鍵一步,更是進行數(shù)據(jù)挖掘前的準(zhǔn)備工作。它一方面保證挖掘數(shù)據(jù)的正確性和有效性,另一方面通過對數(shù)據(jù)格式和內(nèi)容的調(diào)整,使數(shù)據(jù)更符合挖掘的需要。A.是B.否2、重復(fù)數(shù)據(jù)會影響數(shù)據(jù)處理結(jié)果的正確性,從而導(dǎo)致數(shù)據(jù)分析出現(xiàn)偏差,因此需要將其刪除。A.是B.否3、具有多層索引的DataFrame對象經(jīng)過stack()重塑后,返回的是一個Series對象。A.是B.否4、使用merge()函數(shù)進行數(shù)據(jù)合并時,不需要指定合并鍵。A.是B.否5、fillna()方法處理缺失數(shù)據(jù)時可以使用Series對象填充,但不可以使用DataFrame對象填充。A.是B.否6、dropna()方法可以刪除數(shù)據(jù)中所有的缺失值。A.是B.否7、drop_duplicated()方法可以刪除重復(fù)值。A.是B.否8、rename()方法可以重命名索引名。A.是B.否9、通過merge()函數(shù)合并數(shù)據(jù)時可以指定多個鍵。A.是B.否10、join()方法可以使用左連接和右連接兩種方式連接數(shù)據(jù)。A.是B.否11、關(guān)于Pandas中的數(shù)據(jù)重塑,stack()方法可以將列索引轉(zhuǎn)換為行索引。A.是B.否12、關(guān)于預(yù)處理中的數(shù)據(jù)合并,concat()函數(shù)是最常用的主鍵合并函數(shù),可以通過內(nèi)連接和外連接的方式堆疊合并數(shù)據(jù)。A.是B.否13、關(guān)于預(yù)處理中的數(shù)據(jù)合并,merge()函數(shù)是最常用的主鍵合并的函數(shù),但不能夠通過左連接和右連接的方式合并數(shù)據(jù)。A.是B.否14、關(guān)于預(yù)處理中的數(shù)據(jù)合并,join()方法是最常用的主鍵合并方法之一,但不能夠通過左連接和右連接的方式合并數(shù)據(jù)。A.是B.否15、Pandas中可以使用boxplot()方法繪制箱形圖,以實現(xiàn)對數(shù)據(jù)中的異常值進行檢測。A.是B.否16、關(guān)于空值和缺失值,NaN和None是完全一樣的。A.是B.否17、notnull()與isnull()方法都可以判斷數(shù)據(jù)中是否存在空值或缺失值。A.是B.否18、dropna()方法可以刪除空值和缺失值A(chǔ).是B.否19、異常值處理中可以基于不同字段的均值和標(biāo)準(zhǔn)差求出異常數(shù)據(jù)分布范圍,然后再對異常范圍外的數(shù)據(jù)做處理,例如填充為均值A(chǔ).是B.否20、數(shù)據(jù)處理中,大多數(shù)情況下重復(fù)值是需要去除的,使用數(shù)據(jù)框的drop_duplicates方法即可實現(xiàn)。A.是B.否21、隨機抽樣即隨機的抽取樣本,可使用數(shù)據(jù)框的sample實現(xiàn),并可通過參數(shù)n設(shè)置指定抽樣數(shù)量,或通過frac指定抽樣比例。A.是B.否22、字符串和日期的轉(zhuǎn)換,可通過time或datetime庫的strptime和strftime實現(xiàn)。A.是B.否23、數(shù)據(jù)標(biāo)準(zhǔn)化通過將數(shù)據(jù)按比例縮放,使之落入一個小的特定區(qū)間對象的操作。A.是B.否24、MaxMin方法則是根據(jù)原始數(shù)據(jù)的最大值和最小值做數(shù)據(jù)處理,它將數(shù)據(jù)縮放為特定范圍[0,1]內(nèi)。A.是B.否25、丟棄缺失值是直接將含有NA值的記錄丟棄,適用于NA值的記錄較少,且整體樣本量較大的情況。A.是B.否

2025春國開《電子商務(wù)數(shù)據(jù)分析與應(yīng)用》形考任務(wù)3答案1.安裝Kettle。答:安裝基礎(chǔ)環(huán)境Kettle是一個Java程序,因此,運行此工具,必須安裝Sun公司(已被Oracle公司收購)的Java運行環(huán)境1.4或者更高版本。Java的安裝登錄Java的官網(wǎng)后,進入下載頁面,選擇當(dāng)前最新的Java版本下載安裝。安裝KettleKettle的下載安裝與Spoon的啟動Kettle是作為一個獨立的壓縮包被發(fā)布的,我們可以從官網(wǎng)選擇最新的版本下載安裝。下載完畢后,解壓下載的文件,雙擊spoon.bat即可使用。為了方便使用,我們可以為spoon.bat創(chuàng)建一個Windows桌面快捷方式。創(chuàng)建快捷方式后,在新創(chuàng)建的快捷文件上單擊鼠標(biāo)右鍵,在彈出的快捷菜單中選擇“屬性”命令,系統(tǒng)打開的屬性對話框里顯示了快捷方式選項卡。在這個選項卡下單擊“更改圖標(biāo)”按鈕,可以為這個快捷方式選中一個容易識別的圖標(biāo),一般選擇Kettle目錄下的spoon.ico文件。2.安裝MySQL數(shù)據(jù)庫所需的jar包。答:要安裝MySQL數(shù)據(jù)庫所需的jar包,您可以按照以下步驟進行操作:首先,您需要下載MySQL的JDBC驅(qū)動程序,也稱為Connector/J。您可以從MySQL官方網(wǎng)站下載最新版本的JDBC驅(qū)動程序。打開MySQL官方網(wǎng)站(/downloads/connector/j/)。在下載頁面上,選擇適合您操作系統(tǒng)的版本并點擊下載按鈕。下載完成后,將下載的jar文件保存在您的項目目錄中的lib文件夾下(如果沒有l(wèi)ib文件夾,可以創(chuàng)建一個)。在您的Java項目中,將jar文件添加到您的項目的構(gòu)建路徑中。具體步驟取決于您使用的集成開發(fā)環(huán)境(IDE)。以下是一些常見的IDE的步驟:對于Eclipse:右擊您的項目,選擇”BuildPath”->”ConfigureBuildPath”。在彈出的窗口中,選擇”Libraries”選項卡,然后點擊”AddJARs”按鈕,選擇您下載的MySQL驅(qū)動程序的jar文件,最后點擊”O(jiān)K”按鈕。對于IntelliJIDEA:在項目視圖中,右擊您的項目,選擇”O(jiān)penModuleSettings”。在彈出的窗口中,選擇”Libraries”選項卡,然后點擊”+”按鈕,選擇”Java”->”JARsordirectories”,選擇您下載的MySQL驅(qū)動程序的jar文件,最后點擊”O(jiān)K”按鈕。對于NetBeans:右擊您的項目,選擇”Properties”。在彈出的窗口中,選擇”Libraries”選項,然后點擊”AddJAR/Folder”按鈕,選擇您下載的MySQL驅(qū)動程序的jar文件,最后點擊”O(jiān)K”按鈕?,F(xiàn)在,您已經(jīng)成功安裝了MySQL數(shù)據(jù)庫所需的jar包。您可以在您的Java代碼中使用這些jar包來連接和操作MySQL數(shù)據(jù)庫。希望這些步驟對您有幫助!如果您有任何其他問題,請隨時提問。

3.實現(xiàn)數(shù)據(jù)轉(zhuǎn)換,從MySQL數(shù)據(jù)庫中讀取表格內(nèi)容并輸出到Excel表格。答:見附件

4.在Kettle中,實現(xiàn)文本文件的導(dǎo)入與導(dǎo)出。讀入student.csv文件,輸出固定寬度為12字節(jié)的student.txt文件。student.csv文件以逗號為分隔符,內(nèi)容如圖所示。期望輸出的student.txt文件的內(nèi)容如圖所示。答:要在Kettle中實現(xiàn)文本文件的導(dǎo)入和導(dǎo)出,可以按照以下步驟進行操作:打開Kettle并創(chuàng)建一個新的轉(zhuǎn)換。在轉(zhuǎn)換中添加一個”文本文件輸入”步驟。在該步驟的設(shè)置中,選擇CSV文件作為文件類型,并指定student.csv文件的路徑。設(shè)置逗號作為字段分隔符。添加一個”文本文件輸出”步驟。在該步驟的設(shè)置中,選擇固定寬度作為文件類型,并指定student.txt文件的路徑。設(shè)置固定寬度為12個字節(jié)。將”文本文件輸入”步驟連接到”文本文件輸出”步驟。為”文本文件輸出”步驟定義字段映射,以將輸入字段映射到輸出字段。根據(jù)期望的輸出,可以設(shè)置如下映射:學(xué)號字段映射到輸出的前兩個字節(jié)。姓名字段映射到輸出的下一個字節(jié)。性別字段映射到輸出的下一個字節(jié)。班級字段映射到輸出的下一個字節(jié)。年齡字段映射到輸出的下一個字節(jié)。成績字段映射到輸出的下一個字節(jié)。身高字段映射到輸出的下一個字節(jié)。手機字段映射到輸出的剩余字節(jié)。運行轉(zhuǎn)換,將會生成期望的student.txt文件。請注意,根據(jù)輸入文件的內(nèi)容,可能需要根據(jù)實際情況進行一些調(diào)整和處理,以確保正確的導(dǎo)入和導(dǎo)出。

5.在Kettle中,實現(xiàn)MySQL數(shù)據(jù)庫的數(shù)據(jù)導(dǎo)入與導(dǎo)出。讀入student表格數(shù)據(jù),輸出滿足身高大于等于185,成績大于等于85的學(xué)生數(shù)據(jù)。輸出的數(shù)據(jù)存儲在StuOut表中。期望輸出的StuOut表的內(nèi)容如圖所示。答:首先,您需要在Kettle中創(chuàng)建一個轉(zhuǎn)換來實現(xiàn)MySQL數(shù)據(jù)庫的數(shù)據(jù)導(dǎo)入和導(dǎo)出。以下是一些步驟:創(chuàng)建一個新的轉(zhuǎn)換,命名為”導(dǎo)入數(shù)據(jù)”。在轉(zhuǎn)換中添加一個”Tableinput”步驟,用于從MySQL數(shù)據(jù)庫中讀取數(shù)據(jù)。配置步驟以連接到您的MySQL數(shù)據(jù)庫,并選擇”student”表作為輸入表。添加一個”Filterrows”步驟,用于篩選出身高大于等于185和成績大于等于85的學(xué)生數(shù)據(jù)。配置步驟以選擇”身高”字段大于等于185和”成績”字段大于等于85。添加一個”Textfileoutput”步驟,用于將篩選后的數(shù)據(jù)導(dǎo)出到文本文件。配置步驟以選擇輸出文件的路徑和文件名,以及固定寬度為12字節(jié)。運行轉(zhuǎn)換,將MySQL數(shù)據(jù)庫中滿足條件的學(xué)生數(shù)據(jù)導(dǎo)出到文本文件中。請注意,上述步驟僅為指導(dǎo)。您可能需要根據(jù)您的實際情況進行適當(dāng)?shù)恼{(diào)整和配置。

6.在Kettle中,實現(xiàn)HTML數(shù)據(jù)的數(shù)據(jù)導(dǎo)入與導(dǎo)出。讀入“/1_1094/5403177.html”數(shù)據(jù),輸出HTML源碼存在webout.html文件中。其中,我們需要注意網(wǎng)頁的字符編碼為GBK。webout.html用瀏覽器打開的部分內(nèi)容如圖所示。答:要在Kettle中實現(xiàn)HTML數(shù)據(jù)的導(dǎo)入和導(dǎo)出,您可以按照以下步驟進行操作:創(chuàng)建一個新的轉(zhuǎn)換,命名為”導(dǎo)入導(dǎo)出HTML數(shù)據(jù)”。在轉(zhuǎn)換中添加一個”HTTP”步驟,用于從指定的URL讀取HTML數(shù)據(jù)。配置步驟以選擇GET請求方法和輸入URL為”/1_1094/5403177.html”。添加一個”Textfileoutput”步驟,用于將HTML源碼導(dǎo)出到文件。配置步驟以選擇輸出文件的路徑和文件名為”webout.html”,并設(shè)置文件編碼為”GBK”。運行轉(zhuǎn)換,將HTML數(shù)據(jù)導(dǎo)出到指定的文件中。7.在Kettle中,實現(xiàn)基于HTTPGET請求的導(dǎo)入與導(dǎo)出。/v2/movie/in_theaters是豆瓣電影提供的API接口,該接口返回的是當(dāng)前熱映電影的JSON格式。發(fā)送HTTPGET請求到該地址,獲取當(dāng)前熱映的電影,并將電影名稱、分類、分?jǐn)?shù)、主演數(shù)據(jù)存儲在httpGetJson.xls文件中。期望輸出的httpGetJson.xls文件的內(nèi)容如圖所示。答:在Kettle中實現(xiàn)基于HTTPGET請求的導(dǎo)入與導(dǎo)出,可以按照以下步驟進行操作:創(chuàng)建一個新的Kettle作業(yè)(Job)。在作業(yè)中添加一個HTTP請求(HTTPClient)的步驟。配置HTTP請求的相關(guān)參數(shù):輸入URL:/v2/movie/in_theaters請求方法:GET添加一個JSON輸入(JsonInput)的步驟。將HTTP請求的結(jié)果連接到JSON輸入步驟。在JSON輸入步驟中,配置數(shù)據(jù)源和字段映射。數(shù)據(jù)源:從上一步驟的HTTP請求中選擇“返回的結(jié)果”字段映射:根據(jù)返回的JSON數(shù)據(jù)結(jié)構(gòu),將電影名稱、分類、分?jǐn)?shù)、主演等字段映射到對應(yīng)的列。添加一個MicrosoftExcel輸出(MicrosoftExcelOutput)的步驟。連接JSON輸入步驟到MicrosoftExcel輸出步驟。配置MicrosoftExcel輸出的相關(guān)參數(shù):文件名:httpGetJson.xls工作表名稱:Sheet1字段映射:將電影名稱、分類、分?jǐn)?shù)、主演等字段映射到對應(yīng)的列。運行作業(yè),即可將豆瓣電影API返回的熱映電影數(shù)據(jù)導(dǎo)入到httpGetJson.xls文件中。

2025春國開《電子商務(wù)數(shù)據(jù)分析與應(yīng)用》形考任務(wù)4答案單選題1、下列關(guān)于數(shù)據(jù)分析概念的描述錯誤的是()D.數(shù)據(jù)分析不能夠在雜亂無章的數(shù)據(jù)中提取有用的數(shù)據(jù)2、數(shù)據(jù)分析的一般流程為()A.明確目的和思路、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)3、關(guān)于數(shù)據(jù)分析的說法,下列描述錯誤的是()C.數(shù)據(jù)分析沒有實際的使用意義D.在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)分析能夠挖掘出更有價值的信息4、數(shù)據(jù)分析可以分為()D.以上全部5、消費者價值通常由()組成。D.以上全部6、在搭建用戶體系時,運營者可以借助RFM模型()A.調(diào)整指標(biāo)B.設(shè)計管理層級C.調(diào)整級別D.重要挽留用戶7、()越大表示客戶越久沒有發(fā)生交易,客戶越可能流失。A.RFMB.RC.FD.M8、對于()的客戶,如果企業(yè)能分析、了解、滿足他們的需求,采用有針對性的營銷手段吸引他們。提高他們的購買頻率,將會給企業(yè)帶來更多利潤。A.R越小F越大M越大B.R越小F越小M越大C.R越小F越大M越小D.R越小F越小M越小9、對于()客戶,企業(yè)應(yīng)盡量挽留,通過營銷手段提高客戶忠誠度。因此,可視其為企業(yè)的重要挽留客戶,是企業(yè)利潤的潛在來源之一。A.R越大F越大M越大B.R越大F越小M越大C.R越小F越大M越小D.R越小F越小M越小10、這類()客戶,有可能購買力有限,可能購買力強,但對企業(yè)的一些產(chǎn)品不感興趣。加大對這類客戶的營銷投人存在一定的風(fēng)險,但適當(dāng)維持與這類客戶的關(guān)系又能使企業(yè)獲得一定的利潤。A.R越大F越大M越大B.R越大F越大M越小C.R越小F越大M越小D.R越小F越小M越小11、這類()客戶,企業(yè)已很難從他們身上獲取更多利潤。因此只能看作企業(yè)的一般客戶。A.R越大F越大M越大B.R越大F越大M越小C.R越小F越小M越大D.R越小F越小M越小12、關(guān)于Anaconda的組件中,可以編輯文檔且展示數(shù)據(jù)分析過程的是()A.AnacondaNavigatorB.AnacondaPromptC.SpyderD.JupyterNotebook13、Python不支持的數(shù)據(jù)類型有()A.charB.NumbersC.StringD.List14、以下不是Python保留字的是()A.andB.lambdaC.orD.where15、python使用哪個關(guān)鍵字導(dǎo)入包()A.defB.packageC.importD.class16、以下哪個是不可變數(shù)據(jù)類型()A.listB.DictionaryC.TupleD.Set17、Python中,以下哪個變量的賦值是正確的?()A.vara=2B.inta=2C.a=2D.variablea=218、Python腳本s=‘a(chǎn)bcdef’,那么s[1:5]的值是()A.abcdefB.bcde19、Python標(biāo)準(zhǔn)庫math中用來計算平方根的函數(shù)是()D.sqrt20、列表a=[1,3,4],b=[4,5,6]那么a+b是()D.[1,3,4,4,5,6]21、列表a=[‘Google’,‘Python’,1979,2000],a[2]=2001,更新列表后a是()A.[‘Google’,‘Python’,1979,2000]22、元組tuple=(‘runoob’,786,2.23,’john’,70.2),tuple[2]=1000是()D.非法操作23、tinydict={‘name’:‘john’,’code’:6734,‘dept’:‘sales’},tinydict[‘code’]為()A.johnB.673424、以下哪個是不合格的比較運算符()A.a==bB.a>bC.a=bD.a>=b25、下列那個不是Numpy多維數(shù)組的屬性()D.columns二、判斷題1、數(shù)據(jù)分析是一個有目的地收集和整合數(shù)據(jù)的過程。()A.是B.否2、CDA-驗證性數(shù)據(jù)分析,用于找到數(shù)據(jù)間的模式,相關(guān)性。是一種“參考答案”的獲取。場景包括典型的“啤酒尿布”這類數(shù)據(jù)挖掘應(yīng)用,工具包括SAS,SPSS這類數(shù)據(jù)挖掘軟件以及python語言這類語言工具。A.是B.否3、數(shù)據(jù)生態(tài)系統(tǒng)逐漸豐富并影響企業(yè)商業(yè)模式。目前國內(nèi)整個數(shù)據(jù)分析產(chǎn)業(yè)鏈的布局相對完整,但局部環(huán)節(jié)的競爭程度差異化明顯。A.是B.否4、生意參謀中的“交易”功能版塊可以顯示店鋪的各項交易數(shù)據(jù),能夠清楚顯示店鋪的運營情況和出現(xiàn)的問題。A.是B.否5、轉(zhuǎn)化漏斗模型可以在消費者訪問店鋪到最終成交的各個環(huán)節(jié),一層層過濾轉(zhuǎn)化人數(shù),分析各個環(huán)節(jié)的轉(zhuǎn)化情況。A.是B.否6、商家獲取會員數(shù)據(jù)后,可以充分利用這些數(shù)據(jù)對會員的情況進行分析,包括會員的分布情況,如年齡分布、性別分布、地區(qū)分布,各地區(qū)會員的增長、流失情況,以及挖掘每一位會員的價值潛力等。A.是B.否7、conda是一個在Windows、MacOS、和Linux上運行的開源軟件包管理系統(tǒng)和環(huán)境管理系統(tǒng)。A.是B.否8、JupyterNotebook的優(yōu)點是可以重現(xiàn)整個分析過程,并將說明文字、代碼、圖表、公式和結(jié)論都整合在一個文檔中。A.是B.否9、使用requests庫為URL的查詢字符串(querystring)傳遞某種數(shù)據(jù)時,如果你是手工構(gòu)建URL,那么數(shù)據(jù)會以鍵/值對的形式置于URL中,跟在一個問號的后面。假如傳遞的參數(shù)為payload={‘key1’:‘value1’,‘key2’:‘value2’}。那么應(yīng)該使用r=requests.get(“url”,params=payload)語句。A.是B.否10、BeautifulSoup自帶的解析器為html.parser。A.是B.否11、數(shù)據(jù)分析隱藏的風(fēng)險和困境包括用戶隱私、管理困難、數(shù)據(jù)交易、大數(shù)據(jù)人才缺乏。A.是B.否12、電子商務(wù)領(lǐng)域的銷售業(yè)績指標(biāo)主要分為總銷售額指標(biāo)、有效訂單指標(biāo)。A.是B.否13、轉(zhuǎn)化漏斗模型包括有效入店率、咨詢轉(zhuǎn)化率、靜默轉(zhuǎn)化率、訂單支付率。A.是B.否14、商品的流量轉(zhuǎn)化直接影響店鋪的最終銷量。因此當(dāng)商品具有合格的引流能力時,商家一定要關(guān)注流量的轉(zhuǎn)化情況,并對轉(zhuǎn)化效果不佳的方面進行優(yōu)化。實際上,影響轉(zhuǎn)化的因素有很多,包括商品主圖、首頁、詳情頁、評價。A.是B.否15、JupyterNotebook不可以將文件保存為html格式。A.是B.否16、Anconda不支持Python3.x以上的版本。A.是B.否17、this屬于Python的保留關(guān)鍵字。A.是B.否18、在循環(huán)體內(nèi)使用break語句或continue語句的作用相同。A.是B.否19、catch是Python異常處理關(guān)鍵字。A.是B.否20、進程就是一個應(yīng)用程序在處理機上的一次執(zhí)行過程,它是一個動態(tài)的概念,而線程是進程中的一部分,進程包含多個線程在運行。A.是B.否21、Python中,使用socket模塊的socket()方法來創(chuàng)建套接字。A.是B.否22、計算機通信時,負責(zé)在兩臺計算機之間建立可靠連接,保證數(shù)據(jù)包按順序到達的協(xié)議是UDP。A.是B.否23、SciPy可用于python爬蟲開發(fā)。A.是B.否24、Python中,創(chuàng)建線程的方式有多種,可以使用threading模塊的Thread類創(chuàng)建線程。A.是B.否25、計算機通信時,服務(wù)器的套接字方法中用于TCP監(jiān)聽的方法是bind()。A.是B.否

2025春國開《電子商務(wù)數(shù)據(jù)分析與應(yīng)用》形考任務(wù)5答案1、電子商務(wù)數(shù)據(jù)的獲取途徑不包括()A.產(chǎn)品自有數(shù)據(jù)B.調(diào)查問卷C.互聯(lián)網(wǎng)數(shù)據(jù)導(dǎo)入D.從別人數(shù)據(jù)庫竊取2、請判斷下面各項數(shù)據(jù)的結(jié)構(gòu)化類型:()A.結(jié)構(gòu)化數(shù)據(jù)B.半結(jié)構(gòu)化數(shù)據(jù)C.非結(jié)構(gòu)化數(shù)據(jù)D.以上都不對3、以下哪個不是基于電商平臺的基礎(chǔ)數(shù)據(jù)?A.商品數(shù)據(jù)B.客戶基本信息數(shù)據(jù)C.客戶評價數(shù)據(jù)D.互聯(lián)網(wǎng)金融數(shù)據(jù)4、電子商務(wù)數(shù)據(jù)的主要來源包括()A.電子商務(wù)平臺B.社交電商平臺C.O2O數(shù)據(jù)D.以上全部5、數(shù)據(jù)處理一般指對數(shù)據(jù)進行()、()、()、和()的過程。A.采集、分析、分析、可視化表達B.整理、采集、分析、可視化表達C.采集、整理、分析、可視化表達D.整理、可視化表達、分析、采集6、數(shù)據(jù)有不同的表現(xiàn)形式,數(shù)據(jù)的來源也多種多樣,因此數(shù)據(jù)采集的()、采集的()、和采集后的()也不盡相同。A.工具、方法、存儲方式B.方法、工具、存儲方式C.方法、過程、存儲方式D.工具、過程、存儲方式7、以下關(guān)于數(shù)據(jù)采集說法正確的()A.同一數(shù)據(jù)如果有多個來源途徑,可以選擇其中的任一個來源進行采集B.數(shù)據(jù)采集人員需要針對數(shù)據(jù)采集需求、背景等對數(shù)據(jù)采集渠道進行可信度劃分,優(yōu)先選擇可信度更高的數(shù)據(jù)采集渠道C.數(shù)據(jù)采集渠道可信度與數(shù)據(jù)采集的背景和指標(biāo)無關(guān),屬于獨立的體系D.數(shù)據(jù)采集渠道無所謂優(yōu)劣,主要看能否獲取到所需數(shù)據(jù)8、某網(wǎng)店準(zhǔn)備按照店鋪產(chǎn)品的引流能力及盈利能力兩項數(shù)據(jù)分別對產(chǎn)品進行排序,將兩項數(shù)據(jù)指標(biāo)排名均靠后的5款產(chǎn)品進行下架處理。根據(jù)以上情景可確定數(shù)據(jù)分析目標(biāo)為()A.分析店鋪商品的引流能力和盈利能力B.分店鋪商品中能夠穩(wěn)定獲利的商品C.分析店鋪商品的展現(xiàn)量D.分析店鋪商品的推廣效果9、在數(shù)據(jù)采集過程中并非所有需要的數(shù)據(jù)指標(biāo)都可以采集到,在這種情況下以下做法正確的是()。A.可以使用能夠反映該指標(biāo)的其他數(shù)據(jù)替代B.不需要采集C.想盡一切辦法尋找可以采集到該指標(biāo)的數(shù)據(jù)數(shù)據(jù)渠道D.忽略該數(shù)據(jù)的采集任務(wù)10、通過網(wǎng)站公開的API接口采集數(shù)據(jù)屬于()。A.網(wǎng)絡(luò)數(shù)據(jù)采集法B.傳感器采集法C.訪問記錄采集法D.系統(tǒng)日志采集法11、下列關(guān)于為什么要做數(shù)據(jù)清理描述錯誤的是()A.數(shù)據(jù)有重復(fù)B.數(shù)據(jù)有錯誤C.數(shù)據(jù)有缺失D.數(shù)據(jù)量太大12、下列關(guān)于數(shù)據(jù)清理描述錯誤的是()A.數(shù)據(jù)清理能完全解決數(shù)據(jù)質(zhì)量差的問題B.數(shù)據(jù)清理在數(shù)據(jù)分析過程中是不可或缺的一個環(huán)節(jié)C.數(shù)據(jù)清理的目的是提高數(shù)據(jù)質(zhì)量D.可以借助Kettle來完成大量的數(shù)據(jù)清理工作13、某店鋪2019年度會員信息表中,某會員的出生年份是1990年,但年齡卻記錄為25歲,此類錯誤需要進行()。A.缺失值清洗B.重復(fù)值清洗C.邏輯值清洗D.無價值數(shù)據(jù)清洗14、數(shù)據(jù)清洗時,運營數(shù)據(jù)中出現(xiàn)“下單時間2088-12-12”,屬于()。A.缺失值清洗B.格式內(nèi)容清洗C.邏輯錯誤清洗D.重復(fù)數(shù)據(jù)清洗15、以下說法錯誤的是()A.數(shù)據(jù)預(yù)處理的主要流程為數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換與數(shù)據(jù)歸約B.數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)歸約這些步驟在數(shù)據(jù)預(yù)處理活動中必須順序使用C.冗余數(shù)據(jù)的刪除既是一種數(shù)據(jù)清理形式,也是一種數(shù)據(jù)歸約D.整個預(yù)處理過程要盡量人機結(jié)合,尤其要注重和客戶以及專家多交流16、kettle是什么編程語言編寫的?A.CB.JAVAC.PythonD.以上都不對17、如何在window操作系統(tǒng)上啟動kettle?()A.雙擊Spoon.batB.Pan.batC.runSamples.bat18、kettle轉(zhuǎn)換的核心對象,下面哪項不正確?A.輸入B.輸出C.流程D.DB連接19、數(shù)據(jù)分析的一般流程為()A.明確目的和思路、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)B.明確目的和思路、數(shù)據(jù)收集、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)C.數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)D.明確目的和思路、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)20、s=list(“壯麗七十年奮斗新時代”),給出如下代碼以下選項中能輸出字符“奮”第一次出現(xiàn)的索引位置的A.print(s.index(“奮”),1,len(s))B.print(s.index(“奮”))C.print(s.count(“奮”))D.print(s.index(“奮”),1)二、多選題1、電子商務(wù)數(shù)據(jù)具有以下哪些作用?多選題(2分)A.電子商務(wù)數(shù)據(jù)具有診斷作用B.電子商務(wù)數(shù)據(jù)具有預(yù)測作用C.電子商務(wù)數(shù)據(jù)具有決定作用D.電子商務(wù)數(shù)據(jù)具有傳播作用2、下列選項中,關(guān)于數(shù)據(jù)預(yù)處理說法錯誤的是()。多選題(2分)A.數(shù)據(jù)清洗包含了數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)合并和缺失值處理B.數(shù)據(jù)合并按照合并軸的方向主要分為左連接、右連接、內(nèi)連接和外連接C.數(shù)據(jù)分析的預(yù)處理過程包括數(shù)據(jù)清洗、數(shù)據(jù)合并、數(shù)據(jù)標(biāo)準(zhǔn)化和數(shù)據(jù)轉(zhuǎn)換,它們之間存在交叉,沒有嚴(yán)格的先后關(guān)系D.數(shù)據(jù)標(biāo)準(zhǔn)化的主要對象是類別型特征3、檢測出異常值之后,通常會采用哪些方式處理它們?()多選題(2分)A.直接將含有異常值的記錄刪除B.用具體的值來進行替換,可用前后兩個觀測值的平均值修正該異常值C.不處理,直接在具有異常值的數(shù)據(jù)集上進行統(tǒng)計分析D.視為缺失值,利用缺失值的處理方法修正該異常值4、商務(wù)數(shù)據(jù)包括()多選題(2分)A.電子商務(wù)平臺的基礎(chǔ)數(shù)據(jù)B.電子商務(wù)專業(yè)網(wǎng)站的研究數(shù)據(jù)C.電子商務(wù)媒體報道D.評論數(shù)據(jù)5、數(shù)據(jù)分析中市場類指標(biāo)主要用于描述行業(yè)情況和企業(yè)在行業(yè)中的發(fā)展情況,下列屬于市場類指標(biāo)的是()多選題(2分)A.行業(yè)增長率B.平均購買次數(shù)C.競爭對手銷售額D.活躍客戶比率6、以下屬于產(chǎn)品類數(shù)據(jù)指標(biāo)的是()?多選題(2分)A.SKUB.商品數(shù)C.商品訪客數(shù)D.跳失率7、對淘寶平臺某類商品銷量數(shù)據(jù)進行分析,以下數(shù)據(jù)采集方式可行的是()多選題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論