第十二章.調(diào)查資料整理與分析_第1頁
第十二章.調(diào)查資料整理與分析_第2頁
第十二章.調(diào)查資料整理與分析_第3頁
第十二章.調(diào)查資料整理與分析_第4頁
第十二章.調(diào)查資料整理與分析_第5頁
已閱讀5頁,還剩86頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第12章調(diào)查資料的整理和分析市場調(diào)查與預(yù)測主要內(nèi)容調(diào)查資料的整理調(diào)查資料的分析

第一節(jié)市場調(diào)查資料的整理一、調(diào)查資料整理的概念二、調(diào)查資料整理的內(nèi)容三、調(diào)查資料整理的程序引例:Sunrise購物中心數(shù)據(jù)處理Sunrise購物中心是一家擁有百余家分店的購物中心。最近,管理人員發(fā)現(xiàn)需要更多地了解顧客的滿意程度。艾米是Sunrise購物中心的市場調(diào)查負責人,現(xiàn)在她車子的后備箱中堆滿了1000多份調(diào)查問卷。她仔細看了許多問卷,很多問題的回答五花八門。艾米起初試圖憑直覺了解對每個問題的一般答案,但后來她想比較顧客的年齡、收入和來Sunrise購物中心的次數(shù),以便更好地找出這些不同人群的特征。雖然她急著想將這些調(diào)查問卷分類和進行手工計算,但她知道自己沒有時間做。一個人整理這些表格并記錄下正確數(shù)據(jù)得花上一兩周的時間。她應(yīng)該怎樣才能把這些信息變?yōu)橐粡埛治鏊匦璧脑敿氄砟??最笨的辦法是調(diào)查人員閱讀所有的問卷,記下筆記,并從中得出結(jié)論,這顯然是愚蠢的行為。專業(yè)調(diào)查人員不用這種不正規(guī)并效率低的方法,而是遵循一個程序進行資料的處理與分析。

一、調(diào)查資料整理的概念

所謂市場調(diào)查資料的整理,就是指運用科學的方法,對調(diào)查所獲得的各種原始資料進行審核、分類處理和加工綜合,使之系統(tǒng)化和條理化,從而以集中、簡明的方式反映調(diào)查對象總體情況的工作過程。

二、調(diào)查資料整理的內(nèi)容

1、調(diào)查資料的處理(整理):

包括審核、分類、匯總和制圖表。

2、數(shù)據(jù)管理:

包括資料的輸入、傳輸、存貯、更新與輸出。三、問卷整理程序?qū)徍司幋a數(shù)據(jù)處理圖表制作錄入分組審核分為兩個層面

實地審核

一般方式:

復查和回訪

資料審核

主要內(nèi)容包括:資料的時效性—準資料的完整性—缺資料的正確性—誤

1、審核調(diào)查資料審核的主要內(nèi)容(1)完備性(2)完整性(3)正確性(4)時效性(5)真?zhèn)涡?、完備性即檢查收回的問卷或調(diào)查表的份數(shù)是否齊全,是否達到了調(diào)查方案設(shè)計的樣本量的要求。如果調(diào)查問卷或調(diào)查表份數(shù)不夠,應(yīng)查明原因,采取補救措施,如重新拜訪或更換調(diào)查對象。2、完整性即檢查審核問卷或調(diào)查表填答的項目是否完整。不完整的答卷有三種情形:(1)大面積的無回答,或者相當多的問題無回答,對此應(yīng)作廢卷處理;(2)個別問題無回答,應(yīng)視為有效調(diào)查問卷,所留空白待后續(xù)工作采取補救措施,或?qū)⑺苯託w入“暫未決定”、“其他答案”的類別中;(3)有相當多的調(diào)查問卷對同一問題無回答,仍作為有效調(diào)查問卷,對此項提問可作刪除處理。3、準確性即檢查問卷或調(diào)查表中的項目是否存在填答錯誤,一般也有三種情形:(1)邏輯性錯誤,表現(xiàn)為某些答案明顯地不符合事實,或者前后不一致。對這類錯誤能夠用電話核實的可進行更正,無法核實的按“不詳值”對待;(2)答非所問的答案,一旦發(fā)現(xiàn)應(yīng)通過電話詢問進行糾正,或按“不詳值”對待;

(3)乏興回答的錯誤,如所有問題都選擇同一固定編號答案,或者一筆帶過若干個問題。如這種乏興回答僅屬個別問卷,應(yīng)徹底拋棄,如這類回答的問卷有一定的數(shù)目,且集中出現(xiàn)在同一類問題群上,應(yīng)把這些問卷作為一個獨立的子樣本看待,在資料分析時給予適當?shù)淖⒁狻?、時效性主要是對調(diào)查問卷或調(diào)查表的訪問時間、有關(guān)數(shù)據(jù)的時間屬性進行檢查,以評價調(diào)查數(shù)據(jù)是否符合時效性的要求。一般地,訪問員應(yīng)在規(guī)定的時間內(nèi)完成所有樣本單位的訪問,如延遲了訪問,則應(yīng)作出不同情況的處理:如延遲訪問對調(diào)查結(jié)果沒有什么影響,則問卷仍是合格的;若延遲訪問影響到數(shù)據(jù)的時間屬性不一致時,則應(yīng)廢棄這樣的調(diào)查表或問卷。5、真?zhèn)涡灾饕菍φ{(diào)查表或問卷的真實性進行檢驗,評價訪問員是否存在偽造問卷或調(diào)查表的行為。一般采用抽樣檢查的方法進行核實,即從回收的全部問卷或調(diào)查表中隨機抽取一部分,然后用電話或派人上門與被調(diào)查者聯(lián)系,核實訪問員是否到訪,以及訪問的時間、地點等。如果發(fā)現(xiàn)問卷或調(diào)查表是偽造的,應(yīng)作廢棄處理,并要派員重訪。調(diào)查資料審核的主要方法

經(jīng)驗判斷法

例如:如果被調(diào)查者年齡填寫為132歲,根據(jù)經(jīng)驗判斷,其填寫肯定有誤。邏輯檢查法例如:某消費者在前面說“不知道”某調(diào)味品,后面卻說“每天都在使用”,顯然前后矛盾。計算審核法例如:在家庭收支結(jié)構(gòu)中,家庭總收入遠小于總支出和儲蓄之和,那肯定有錯。

同步案例6-1錯誤的數(shù)據(jù)不如沒有數(shù)據(jù)

國內(nèi)一家知名的電視機生產(chǎn)企業(yè),2004年初設(shè)立了20多人的市場研究部門,開展了同樣的調(diào)研問卷,完全相同結(jié)構(gòu)的抽樣,兩組數(shù)據(jù)結(jié)論卻差異巨大。正是因為這次調(diào)查,部門被注銷、人員被全部裁減。問題:列舉您會選擇的電視機品牌?其中一組的結(jié)論是:有15%的消費者選擇本企業(yè)的電視機;另一組的得出的結(jié)論卻是:36%的消費者表示本企業(yè)的產(chǎn)品將成為其購買的首選。巨大的差異讓公司高層非常惱火,為什么完全相同的調(diào)查抽樣,會有如此矛盾的結(jié)果呢?公司決定聘請專業(yè)的調(diào)研公司來進行調(diào)研診斷,找出問題的真相。同步案例6-1錯誤的數(shù)據(jù)不如沒有數(shù)據(jù)普瑞辛格的執(zhí)行小組受聘和參與調(diào)查執(zhí)行的訪問員進行交流,并很快提交了簡短的診斷結(jié)論:第二組在進行調(diào)查執(zhí)行過程中存在誤導行為。調(diào)研期間,第二組的成員佩帶了公司統(tǒng)一發(fā)放的領(lǐng)帶,而在領(lǐng)帶上有本公司的標志,其標志足以讓被訪問者猜測出調(diào)研的主辦方;其次,第二組在調(diào)查過程中,把選項的記錄板(無提示問題)向被訪問者出示,而本企業(yè)的名字處在侯選題板的第一位。以上兩個細節(jié),向被訪問者泄露了調(diào)研的主辦方信息,影響了消費者的客觀選擇。這家企業(yè)的老總訓斥調(diào)研部門的主管:“如果按照你的數(shù)據(jù),我要增加一倍的生產(chǎn)計劃,最后的損失恐怕不止千萬。”問題:本案例對你有何啟示?分析提示:市場調(diào)查是直接指導營銷實踐的大事,對錯是非可以得到市場驗證,只是人們往往忽視了市場調(diào)查本身帶來的風險。一句“錯誤的數(shù)據(jù)不如沒有數(shù)據(jù)”,包含了眾多中國企業(yè)家對數(shù)據(jù)的恐慌和無奈。6.1.3缺失數(shù)據(jù)的處理1)無效問卷2)不滿意的問卷3)不滿意問卷的處理方法1)無效問卷(1)回答不完全(2)調(diào)查對象不符合要求(3)答案選擇高度一致(4)截止日期后收回的問卷2)不滿意的問卷

(1)模糊不清(2)前后不一致或有明顯錯誤的(3)模棱兩可(4)不符合作答要求3)不滿意問卷的處理方法

(1)重新調(diào)查(2)填充

①找一個中間值代替②用一個邏輯答案代替③刪除處理(3)空缺

文字資料

分組

2、分組

數(shù)字資料一、文字資料的分類對于調(diào)研問卷中的開放式問題,很多回答都是文字資料,對于這些文字資料我們需要根據(jù)其資料的性質(zhì)、內(nèi)容或特征把相異的資料挑出來,把相同或相近的資料歸為一類,這樣才能進行后期的數(shù)據(jù)分析。(1)窮舉原則。窮舉即不遺漏,就是說分類時每一條資料都要有歸屬。分類的結(jié)果必須將所有的總類全部包括進去,沒有遺漏。(2)相斥原則。相斥即不重復,就是說在一種分組中每一條資料只能歸屬為一類中,而不能既歸于這類又歸于那類,以至于在不同類別中重復出現(xiàn)。即類與類要相互排斥。對開放式問題的答案整理程序:1、集中所有同一個開放式問題的全部文字性答案,通過閱讀、思考和分析,把握被調(diào)查者的思想認識。2、將被調(diào)查者的全部文字性答案,按照其思想認識不同歸納為若干類型,并計算各種類型出現(xiàn)的頻數(shù)后,制成全部答案分布表。3、對全部答案分布表中的答案進行挑選歸并,確定可以接受的分組數(shù)。一般來說,在符合調(diào)研項目的前提下,保留頻數(shù)多的答案,然后把頻數(shù)很少的答案盡可能歸并成含義相近的幾組,應(yīng)根據(jù)調(diào)研的目的和答案類型的多少而確定,一般來說應(yīng)控制在10組之內(nèi)。4、為確定的分組,選擇正式的描述詞匯或短語。不同組別的描述詞匯或短語應(yīng)體現(xiàn)質(zhì)的差別,力求中肯、精煉、概括。5、根據(jù)分類歸納的結(jié)果,制成正式的答案分布表。例:在一項關(guān)于居民空調(diào)購買行為的調(diào)研問卷中,設(shè)置了“你對靜音空調(diào)這個產(chǎn)品概念有何看法?”的開放式問項,通過對被調(diào)查者的回答分類歸納如下:

被調(diào)查者對“靜音空調(diào)”的看法分布看法分類答案人數(shù)比重(%)符合環(huán)保要求32518.25符合發(fā)展趨勢28614.30符合消費需求31615.8希望盡快推出1989.9有可能實現(xiàn)31215.6不可能實現(xiàn)35017.5難以評價21310.65合計2000100.00二、數(shù)字資料的分組

對于問卷中的數(shù)字資料大多數(shù)在設(shè)計問卷時已經(jīng)分好組了,如問卷中的封閉式問題。但是,開放式問題如“您購買的小靈通價格是

元”,那么,我們在問卷調(diào)查完之后就還要對數(shù)字資料進行分組。數(shù)字資料有在問卷設(shè)計的時候就分組的,也有調(diào)查結(jié)束后再分組的,不管怎樣,數(shù)字資料分組的原理都是一樣的,我們都需要按照一定的步驟進行。數(shù)字資料分組的步驟1、分組標志的選擇數(shù)據(jù)資料分組的關(guān)鍵是選擇分組標志。分組標志是說明總體特征的名稱,可以分為品質(zhì)標志和數(shù)量標志。定性:

品質(zhì)標志表示事物的質(zhì)的特征,是不能用數(shù)值直接表示的屬性,如人的性別、民族等。定量:

數(shù)量標志表示事物的量的特征,是可以用數(shù)值直接表示的,如人的年齡、收入等。分組標志就是分組的依據(jù)或標準,分組標志一經(jīng)選定,各組的性質(zhì)界限和數(shù)量界限也就確定了。2、組數(shù)和組距的確定(1)組數(shù)和組距如何確定。當全距確定時,組距大則組數(shù)小,組距小則組數(shù)多。如果分組過多,組距必小,則不易觀察數(shù)列分布的規(guī)律性。如果分組過少,組距必大,會使組中值缺乏代表性。各組組中值應(yīng)對本組有良好的代表性。組距的確定一般可以請專家或以經(jīng)驗法確定。組數(shù)一般常分為10~15組。調(diào)查的數(shù)據(jù)資料最大值減去最小值,就是全距。

組距=全距÷組數(shù)

確定組距應(yīng)遵循下列3個原則:①必須把原始資料全部變量值都包括在所分組內(nèi),不能有任何遺漏;②組距盡可能取整數(shù),不要小數(shù);③各組的組距盡可能相等,少用不等距分組,因為等距分組便于后階段的分析。按照經(jīng)驗確定組數(shù)觀測值數(shù)目組數(shù)少于504~750~2007~9200~5009~10500~100010~111000~500011~135000~5000013~17多于5000017~20(2)組距應(yīng)否相等。為了便于分析研究原則上次數(shù)分布中各組的組距應(yīng)相等,即盡量編制等距數(shù)列。(3)組距的位置如何確定。為便于分析研究,一般采用整齊而慣用的數(shù)字為組限。特別是習慣于采用5或10的倍數(shù)表示組限。每組的最大值為組的上限,每組的最小值為組的下限。劃分組限時,各組頻數(shù)的計量不能重復,每一總體單位只能計數(shù)1次。恰好重疊在組限上的變量值一般歸入下限的1組,即遵循“上限不在內(nèi)”原則。(4)組限如何表示。組限的表示應(yīng)以變量值本身的性質(zhì)而定。如果是間斷數(shù)列,且數(shù)值變動范圍小,則可以把每個變量值為一組,叫單項式分組,見表5-1。如果是連續(xù)數(shù)列,且數(shù)值變動范圍較大,可將變量值劃分為幾個區(qū)間,每個區(qū)間為一組,叫組距式分組,見表5-2。5-15-2

3、編碼

編碼就是給每一個問題及答案分配一個代號,通常是一個數(shù)字、字母或特殊的符號。將問卷信息轉(zhuǎn)化為統(tǒng)一設(shè)計的計算機可識別的代碼,以便于對其進行數(shù)據(jù)整理和分析。

作用:(1)減少數(shù)據(jù)錄入和分析的工作量(2)將定性數(shù)據(jù)轉(zhuǎn)化為定量數(shù)據(jù)(3)減少誤差安·莫勒的編碼與數(shù)據(jù)錄入經(jīng)驗之談安·莫勒是亞特蘭大SDR公司的數(shù)據(jù)錄入員。20年來,在管理項目數(shù)據(jù)錄入方面積累了豐富的經(jīng)驗,他認為要在客戶預(yù)算允許的范圍內(nèi)如期完成調(diào)研工作,重要的是避免問卷中出現(xiàn)過多的開放型問題,這些問題的答案不能直接輸入數(shù)字代碼,解決的辦法是根據(jù)項目分類設(shè)計編碼,或?qū)⒎答亙?nèi)容原樣錄入電腦。莫勒說:“編碼是數(shù)據(jù)錄入過程中耗資最大且最主要的部分”?!拔覀冏x同一文本,對它的編碼可能不同。┅┅如果有太多的答案需要編碼,分析過程就會令人厭煩,而且理解詳盡答案的花費將是非常之高的”。封閉式問題的編碼步驟:第一,找出問題中的關(guān)鍵詞。第二,用適當?shù)姆柎黻P(guān)鍵詞,通常用拼音或英文縮寫作為編碼,這樣便于識別;對單選題,只用一個編碼,如果是多選題,它的每一個選項都應(yīng)該有一個編碼,這時可在統(tǒng)一的符號后加上序號作為各個選項的編碼。第三,確定編碼的取值范圍。單選題編碼的取值就是各選項的序號;多選題編碼的取值就是0或1(選中為1,未選中為0),確定編碼的取值范圍有利于檢查編碼值的輸入是否正確。第四,檢查編碼是否雷同,一張調(diào)查問卷或調(diào)查表中的每一編碼都應(yīng)該是唯一的。第五,編出編碼表,它可與調(diào)查問題進行對照,以免遺漏,也有利于統(tǒng)計匯總。編碼的主要方法(1)順序編碼法(2)分組編碼法(3)信息組碼編碼法

(4)助憶編碼法

(5)

縮寫編碼法順序編碼法:又稱系列編碼法,用一個標準對信息資料分類,按一定順序用連續(xù)數(shù)字或字母進行編碼;簡潔明了,易于管理。

例如:您的性別:□男□女編碼:XB(1、2)分組編碼法:又稱區(qū)間編碼法,把一定位數(shù)的代碼單元分成若干個組,每一組數(shù)字代表一定意義;使用相當廣泛,容易記憶,處理較方便,有時位數(shù)過多,會造成系統(tǒng)維護困難。例如:1242表示?信息組碼編碼法

例如:百貨組從1-20、食品組從20-40表意式文字編碼法(又叫助憶編碼法):指用數(shù)字、文字、符號等來表明編碼對象的屬性。

例如:20TVC表示20英寸彩色電視機縮寫編碼法

例如:KG表示千克2、編制編碼本一般來說,編碼本不但是編碼人員的工作指南,也提供了數(shù)據(jù)集中變量的必要信息。編碼本一般包含變量的以下幾方面的信息:(1)所在列的位置(列數(shù))(2)變量的順序編號(3)變量名稱及變量說明(變量及變量標識)(4)問答題編碼(5)編碼說明(變量值及變量值標識)案例:消費者購買行為調(diào)研

(1)您購買日常生活用品經(jīng)常到()購買(限選2項)A、百貨商場B、小超市C、大超市D、購物中心E、街市(2)您購買化妝品經(jīng)常到()購買(限選2項)A、百貨商場B、小超市C、大超市D、購物中心E、街市(3)好企業(yè)生產(chǎn)好產(chǎn)品,請您根據(jù)認同程度圈選一個答案()5.非常同意4.同意3.無所謂2.不同意1.非常不同意(4)產(chǎn)品銷售不是靠廣告而是靠口碑,請您根據(jù)認同程度圈選一個答案()5.非常同意4.同意3.無所謂2.不同意1.非常不同意

問題序號及內(nèi)容數(shù)據(jù)所在列問卷編號第1列1、購買生活用品地點第2列2、購買化妝品地點第3列

3、企業(yè)評價第4列

4、廣告評價第5列編碼及說明

按份數(shù)從001-500號A、百貨商場B、小超市C、大超市D、購物中心E、街市A、百貨商場B、小超市C、大超市D、購物中心E、街市5.非常同意4.同意3.無所謂2.不同意1.非常不同意5.非常同意4.同意3.無所謂2.不同意1.非常不同意

問卷編號第1列購買生活用品地點購買化妝品地點企業(yè)評價廣告評價第2列第3列第4列第5列001DA31002ACB21003CDE23____________________1004824案例:電腦用戶情況調(diào)查編碼對照表

1、您的年齡是

18歲以下18-30歲31-50歲50歲以上

2、選購電腦時經(jīng)銷商的介紹對您的影響程度是

0102030405060708090100(%)

3、您選購電腦時,可能會考慮各種因素,請您按先后順序進行排序

價格品牌功能售后服務(wù)

4、其他條件不變時,如果電腦系列產(chǎn)品平均降低售價10%,您的態(tài)度是

馬上購買會來購買比較后再看

沒有吸引力不會來購買肯定不購買

案例:電腦用戶情況調(diào)查編碼對照表

問題1編號答案類別118歲以下218-30歲331-50歲

450歲以上問題3編號答案類別1價格

2品牌

3功能

4售后服務(wù)問題2編號答案類別

10—10210—20320—30430—40540—50650—60760—70870—80980—901090—100問題4編號答案類別

1馬上購買

2會來購買

3比較后再看

4沒有吸引力

5不會來購買

6肯定不購買案例:調(diào)查答案綜合表

回答者序列號問題順序1233334001253124200237213430033723141________________________________1004824131案例:電腦用戶情況調(diào)查

1.您的年齡是()購買A、18歲以下B、18-30歲C、30-50歲D、50歲以上

2.您選購電腦時經(jīng)銷商的介紹對您的影響程度是()

01020304050607080901003.您選購電腦時,可能會考慮各種因素,請您按優(yōu)先順序進行排序()A.價格B.品牌C.功能D.售后服務(wù)E.其他4.在其他條件不變時,如電腦系列產(chǎn)品平均降低售價10%,您的態(tài)度()A.馬上購買B.會來購買C.與其他公司經(jīng)營策略比較后再看D.不會有很大吸引力E.不會來購買F.肯定不購買列變量名稱及說明問答題編號編碼說明1-3問卷編號001-1004被訪者年齡11——18歲以下;2-18-30歲……0-未回答5-6選購電腦經(jīng)銷商介紹的影響201——0-10;02—10-2000——未回答7-11選購電腦時考慮的因素31—價格2—品牌……5-其他按考慮的優(yōu)先順序排列,排在第1位的為最優(yōu)先考慮的因素,依次遞減若不夠五位,以0不足;0000-未回答12被訪者對電腦系列產(chǎn)品降價的態(tài)度41—馬上購買6—肯定不購買0-未回答1-3列4列5.6列7-11列12列011205312452022307231453033307231451100407241531

4、錄入

錄入就是由錄入員將問卷按照確定好的編碼輸入到計算機,目前主要采用鍵盤輸入法。

5、數(shù)據(jù)處理處理方法:(1)自行直接人工處理(2)委托專業(yè)機構(gòu)處理常用軟件:(1)Excell(2)SPSS(StatisticsPackageforTheSocialScience“社會科學統(tǒng)計軟件”)第二節(jié)市場調(diào)查資料的分析(一)基礎(chǔ)數(shù)據(jù)分析通過頻數(shù)分布、表列、圖表對整理后的調(diào)查資料進行一些基本的數(shù)據(jù)分析,使之能清晰明了地反映調(diào)查總體屬性的分布態(tài)勢和相互關(guān)系,有助于后續(xù)分析和預(yù)測1.頻數(shù)分布調(diào)查有關(guān)單個變量的信息了解對一個變量選擇不同取值的調(diào)查對象的數(shù)量不同取值的出現(xiàn)頻率以百分比形式展現(xiàn)3.您通常喝什么類型的酒?白酒【】葡萄酒【】香檳酒【】啤酒【】其他【】通常飲用酒類的頻數(shù)分度變量值標簽變量值頻數(shù)百分比有效百分比累計百分比白酒11020.020.820.8葡萄酒2816.016.737.5香檳酒324.04.241.7啤酒42754.056.297.9其他512.02.1100缺省924.0缺省合計50100100集中趨勢指標差異性指標分布形態(tài)指標①集中趨勢指標用于描述分布的中心包括:均值(平均數(shù))、中位數(shù)、眾數(shù)均值即平均數(shù),是最常用的統(tǒng)計量數(shù)據(jù)應(yīng)具有一定的集中趨勢,大部分答案應(yīng)分布在均值附近算術(shù)平均:加權(quán)平均:均值出現(xiàn)最頻繁的數(shù)值,表示分布中的高峰眾數(shù)所有數(shù)據(jù)按升序或降序排列后位置居中的數(shù)值若樣本數(shù)為偶數(shù),則中位數(shù)為居中的兩個數(shù)值的均值中位數(shù)是定序數(shù)據(jù)的集中趨勢指標中位數(shù)中位數(shù)比平均數(shù)更能反映大眾的真實情況【小笑話】如果比爾·蓋茨和十幾個窮光蛋在一個房間里,這個房間里十幾個人的平均收入就都超過億元。這是因為比爾·蓋茨和窮光蛋的收入差距過大,導致平均數(shù)值缺乏實際參考意義。但如果用中位數(shù)來衡量,中位數(shù)為0,就知道這房間里起碼有一半人是窮光蛋②差異性指標用于描述樣本值偏離分布中心的趨勢包括:極差(全距)、方差或標準差、變異系數(shù)反映數(shù)據(jù)的分散程度,即樣本最大值與最小值之差可結(jié)合中位數(shù)評價樣本值的代表性,受奇異值影響公式:全距=Xmax-Xmin極差離差:樣本值和均值之差方差:離均差平方的均值標準差:方差的平方根方差或標準差越大,說明數(shù)據(jù)點分布越分散,數(shù)據(jù)間差異越大方差和標準差標準差與平均數(shù)的比值如果兩組數(shù)據(jù)的度量單位和平均數(shù)相同,可用標準差來比較兩組數(shù)據(jù)的離散程度;如果度量單位和平均數(shù)不同,就只能用變異系數(shù)比較變異系數(shù)③分布形狀指標了解數(shù)據(jù)分布的形態(tài)包括:偏度、峰度數(shù)據(jù)分布可能是對稱的,也可能不對稱對稱分布中,位于中心兩側(cè)的數(shù)據(jù)值一樣多,均值、中位數(shù)、眾數(shù)相等,對于均值的正負偏差相等;非對稱分布則不等偏度指中心一側(cè)的均值偏差趨勢比另一側(cè)大偏度測量頻數(shù)分布曲線相對平滑或突起程度的指標正態(tài)分布峰度為0,峰度為正,曲線比正態(tài)分布突出,反之平緩峰度2.表列單向表列交叉表列只計數(shù)一個變量的不同數(shù)值出現(xiàn)次數(shù)的,稱為單向表列離散型變量,或變量數(shù)值較少、變動幅度不大且總體單位數(shù)不多的情況適合編制單相表列同時計數(shù)兩個或多個變量的不同數(shù)值聯(lián)合出現(xiàn)次數(shù)的,稱為交叉表列綜合分析相互聯(lián)系的多個變量之間的變動關(guān)系市場調(diào)查中最頻繁、最廣泛的方法之一①雙向交叉表列復雜交叉表列的基礎(chǔ),描述當有兩個變量同時產(chǎn)生影響作用時,頻數(shù)分布的狀況,也稱列聯(lián)表經(jīng)營年限與業(yè)務(wù)增長之間的關(guān)系表業(yè)務(wù)增長經(jīng)營年限行總計小于5年5~10年10年以上速度慢453455134速度快525327132列總計978782266經(jīng)營年限小于5年和5~10年之間的企業(yè)經(jīng)營業(yè)務(wù)的增長速度快于經(jīng)營年限超過10年的企業(yè)按經(jīng)營年限計算的經(jīng)營業(yè)務(wù)增長速度業(yè)務(wù)增長經(jīng)營年限小于5年5~10年10年以上速度慢46.4%39.1%67.1%速度快53.6%60.9%32.9%列總計100%100%100%經(jīng)營年限小于5年的企業(yè)中的53.6%和經(jīng)營年限在5~10年的企業(yè)中的60.9%增長速度快,而10年以上的企業(yè)中只有32.9%增長速度快,說明當經(jīng)營年限超過一定界限時,經(jīng)營業(yè)務(wù)的增長速度反而可能下降計算百分數(shù)可以按列計算,也可以按行計算原則:以自變量為基準計算百分數(shù)上表中經(jīng)營年限為自變量,增長速度為因變量,以自變量為基準就是按列計算如果按行計算,可得下表。表中顯示,增長速度慢的企業(yè)中有33.5%經(jīng)營少于10年,25.4%經(jīng)營了5~10年,41.0%經(jīng)營了10年以上,說明增長慢使企業(yè)經(jīng)營了很長時間,這種結(jié)果沒有實際意義按經(jīng)營業(yè)務(wù)增長速度計算的經(jīng)營年限業(yè)務(wù)增長經(jīng)營年限行總計小于5年5~10年10年以上速度慢33.6%25.4%41.0%100%速度快39.4%40.1%20.5%100%②三向交叉表列在雙向交叉表列中添加第三個變量婚姻狀態(tài)與時裝購買狀況婚姻現(xiàn)狀已婚未婚時裝購買狀況高31%52%低69%48%列總計100%100%被調(diào)查總數(shù)700300自變量:婚姻狀況,因變量:時裝購買狀況結(jié)論:未婚者比已婚者購買更多的時裝婚姻狀態(tài)、性別與時裝購買狀況性別男性女性婚姻現(xiàn)狀已婚未婚已婚未婚時裝購買狀況高35%40%25%60%低65%60%75%40%列總計100%100%100%100%被調(diào)查總數(shù)400120300180自變量:性別、婚姻狀況,因變量:時裝購買狀況結(jié)論:婚姻狀況對時裝購買的作用更多的表現(xiàn)在女性身上,男性中已婚和未婚者購買時裝的差異不大加入第三個變量后,原雙向交叉表列分析的結(jié)果可能會:更精確地反映原有兩個變量之間的聯(lián)系可能發(fā)現(xiàn)原雙向表列顯示的兩者之間的關(guān)系是假的可能使原雙變量之間不相關(guān)的結(jié)論變?yōu)榇嬖谀承╆P(guān)系可能顯示原有聯(lián)系沒有改變性別與駕車事故比率調(diào)查事項男性女性從未出過事故56%68%至少有一次事故44%32%被調(diào)查總數(shù)70806950男性比女性更容易出事故?性別、駕駛里程與駕車事故比率調(diào)查事項男性駕駛英里數(shù)女性駕駛英里數(shù)大于10000小于10000大于10000小于10000從未出過事故48%75%48%75%至少有一次事故52%25%52%25%被調(diào)查總數(shù)5010207019155035事故發(fā)生率多少與駕駛里程有關(guān),與性別無關(guān),前一張表中之所以男性事故比率高于女性,是因為男性的駕駛里程普遍多余女性3.圖表統(tǒng)計圖是以圓點的多少、直線的長短、曲線的起伏、條形長短、柱狀高低、圓餅面積等圖形來陳示調(diào)研數(shù)據(jù)統(tǒng)計圖的制作:手工制作和計算機制作統(tǒng)計圖的種類:折線圖、條形圖、直方圖、圓面圖、餅圖、環(huán)行圖、動態(tài)曲線圖、散點圖等①折線圖②直方圖③條形圖④餅圖7.5.2、非數(shù)量資料與定性分析返回常用的定性分析方法

定性分析的概念和原則

定性分析是對不能量化的現(xiàn)象進行系統(tǒng)化的理性認識的分析,理論依據(jù)是哲學觀點、邏輯判斷及推理,其結(jié)論是對事物的本質(zhì)、趨勢和規(guī)律的性質(zhì)方便的認識。1、歸納分析法2、演繹分析法3、比較分析法4、結(jié)構(gòu)分析法定量分析方法定量分析:是從事物數(shù)量方面的特征入手,運用一定的數(shù)據(jù)處理技術(shù)進行數(shù)量分析,從而挖掘出數(shù)量中所含的事物本身的特性及其規(guī)律性的分析方法。定量分析包括:(1)描述性統(tǒng)計分析:統(tǒng)計分組、集中趨勢分析、離散程度分析、相對程度分析、指數(shù)分析。(2)推斷性統(tǒng)計分析:參數(shù)估計、假設(shè)檢驗、回歸分析等(3)不確定分析方法——模糊分析返回統(tǒng)計分組次數(shù)(頻數(shù)):分布在各組的單位數(shù)叫次數(shù)或頻數(shù)。統(tǒng)計分組與次數(shù)分布(頻數(shù))集中趨勢分析數(shù)據(jù)的集中趨勢分析:

主要是對數(shù)據(jù)規(guī)律性的集中特征進行分析。集中趨勢分析的對象:

(1)平均數(shù):數(shù)據(jù)之和除以個數(shù)之和所得的數(shù)值(2)眾數(shù):在一組數(shù)據(jù)中出現(xiàn)頻數(shù)最高的數(shù)值(3)中位數(shù):按大小排列的一組數(shù)據(jù)中央位置的數(shù)值。

下頁思考:

該班同學的平均年齡是多少?中位數(shù)和眾數(shù)各是多少?16歲17歲18歲19歲20歲110人20人25人2人相對程度分析相對程度分析:

是反映現(xiàn)象之間數(shù)量關(guān)系的重要手段,它通過對比的方法反映現(xiàn)象之間的關(guān)聯(lián)程度,表明現(xiàn)象的發(fā)展過程。常用的相對程度分析指標:(1)結(jié)構(gòu)相對指標:總體中男女生比例(2)比較相對指標:兩個企業(yè)勞動生產(chǎn)率的比較(3)比例相對指標:如恩格爾系數(shù)(4)強度相對指標:人口密度、人均產(chǎn)量等。返回離散分析數(shù)據(jù)的離散趨勢分析:

集中趨勢反映的是數(shù)據(jù)的一般水平,而離散分析則是對數(shù)據(jù)差異程度的分析。集中離散分析的對象:

(1)極差(2)平均差(3)方差與標準差(4)離散系數(shù)

返回動態(tài)數(shù)列的概念概念:把反映某現(xiàn)象的同一指標,在不同時間上的指標值,按時間(如年、季、月、日等)先后順序編排所排列的數(shù)列,稱為動態(tài)數(shù)列或時間數(shù)列的每一行有序數(shù)值,就是一個動態(tài)數(shù)列。作用:返回我國近幾年職工人數(shù)及工資額的變化返回年份1996199719981999年末職工人數(shù)(萬人)14894149081485414668職工工資總額(億元)6656.48100.09080.09405.3國有單位工資(億元)3090.43812.75177.46080.4占工資總額的比重(%)46.447.157.064.4職工年平均貨幣工資(元)4538550062106470實訓項目:資料整理和報告撰寫資料整理要求:對資料(主要是調(diào)查問卷和神秘顧客記錄表)進行分組和編碼,制定編碼說明書將整理好的答案編碼表制作成Excel文檔對基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論