《大數(shù)據(jù)時代》讀書報告.doc_第1頁
《大數(shù)據(jù)時代》讀書報告.doc_第2頁
《大數(shù)據(jù)時代》讀書報告.doc_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、大數(shù)據(jù)時代讀書報告大數(shù)據(jù)時代是英國維克托·邁爾-舍恩伯格教授的著作,被公認(rèn)為是國內(nèi)外大數(shù)據(jù)研究的先河之作。作者通過枚舉了上百個例子,對大數(shù)據(jù)的方方面面進(jìn)展了系統(tǒng)、詳細(xì)講解,讓每一名讀者,即使是外行也能很容易理解,直觀感受到大數(shù)據(jù)給社會和生活帶來的改變。在本書中,對于大數(shù)據(jù)時代,作者主要提出了三個核心觀點: 1、要全體不要抽樣。分析p 與某事物相關(guān)的所有數(shù)據(jù),而不是依靠分析p 少量的數(shù)據(jù)樣本。2、要效率不要絕對準(zhǔn)確。我們樂于承受數(shù)據(jù)的紛繁復(fù)雜,而不再追求準(zhǔn)確性。3、要相關(guān)不要因果。我們不再探求難以捉摸的因果關(guān)系,轉(zhuǎn)而關(guān)注事物的相關(guān)關(guān)系。這三個觀點在某種程度上顛覆了我們的傳統(tǒng)思想。要全體

2、不要抽樣:傳統(tǒng)的統(tǒng)計學(xué)方法是解決如何通過選取少量樣本通過對樣本的分析p ,然后推斷整體的趨勢和規(guī)律。而大數(shù)據(jù)時代告訴我們“樣本=全體”,在很多時候,我們不再需要費心去考慮樣本抽樣、數(shù)據(jù)過濾等問題。我們利用大量數(shù)據(jù),甚至是所有數(shù)據(jù),然后用算法去計算分析p ,從而更精準(zhǔn)的找到各個因素之間的相關(guān)關(guān)系(不是因果關(guān)系),以發(fā)現(xiàn)數(shù)據(jù)之間的規(guī)律。要效率不要絕對準(zhǔn)確:在傳統(tǒng)的統(tǒng)計學(xué)中,由于抽樣的限制,研究往往會對準(zhǔn)確度做很嚴(yán)格的要求,譬如置信區(qū)間的概念。而大數(shù)據(jù)時代會把這些條件放的更寬松。我們要學(xué)會在精度和效率之前做取舍,要可以容忍錯誤,學(xué)會在瞬息萬變的信息中掌握趨勢,為下一刻的決策提供根據(jù),這就夠了。正如作

3、者所說:“承受數(shù)據(jù)的不準(zhǔn)確和不完美,我們反而可以更地進(jìn)展預(yù)測,也可以更地理解這個世界?!币嚓P(guān)不要因果:這個觀點也區(qū)別于我們傳統(tǒng)的教育理念。我們習(xí)慣于“打破砂鍋問到底”、“舉一反三”式的教育方式。當(dāng)我們找到了自以為是的答案時,其實可能只是冰山一角,探究事物背后本質(zhì)的動機(jī)不能停頓。但大數(shù)據(jù)時代告訴我們要放棄對因果關(guān)系的渴求,取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。上述作者提出的三個觀點對于大數(shù)據(jù)的開展具有深遠(yuǎn)的指導(dǎo)意義。我也堅信這三個觀點在將來也將長久地改變著我們的社會和生活。對于大數(shù)據(jù),接下來我也想談一談個人的理解和認(rèn)識。大數(shù)據(jù)時代,統(tǒng)計學(xué)仍然是數(shù)據(jù)分析p 的

4、靈魂。大數(shù)據(jù)時代提出的觀點是“樣本=全體”,因此,有一局部人甚至拋出了大數(shù)據(jù)時代統(tǒng)計無用的觀點。他們認(rèn)為數(shù)據(jù)中包含了所有的意義,只要計算才能足夠強(qiáng)大,就不需要什么理論。但是他們似乎忘了,數(shù)據(jù)信息。一方面,大數(shù)據(jù)采集的數(shù)據(jù)是原油而非汽油,不可以直接拿來使用,另一方面,大數(shù)據(jù)中“全”的概念本身就難以界定。“全”在某種意義上也是一種邊界。但如何確定這種邊界進(jìn)而進(jìn)展數(shù)據(jù)的全面搜集,本身就是一件困難的事情。因此,在大數(shù)據(jù)時代,數(shù)據(jù)分析p 的很多根本性問題和小數(shù)據(jù)時代并沒有本質(zhì)區(qū)別。它在某種程度上是樣本的無限放大。大數(shù)據(jù)的根基是“數(shù)據(jù)”。數(shù)據(jù)是大數(shù)據(jù)開展的前提。假如沒有有效的數(shù)據(jù),大數(shù)據(jù)技術(shù)也只是空中樓閣

5、。因此,一方面,如何積累豐富的數(shù)據(jù)資,是我們急需解決的問題,另一方面,對于已有的數(shù)據(jù)資,如何有效地利用,進(jìn)步數(shù)據(jù)標(biāo)準(zhǔn)化、準(zhǔn)確性、完好性程度,也需要我們考慮。就目前來看,大數(shù)據(jù)的將來更加關(guān)注的是“社會化大數(shù)據(jù)”,即人和人的關(guān)系、人和數(shù)據(jù)之間的關(guān)系。通過對社會化數(shù)據(jù)分析p ,使得我們可以對人、社會和商業(yè)有更加深化的理解。這也解釋了為什么在美國,很多人認(rèn)為的價值在某種程度上要大于谷歌。因此,企業(yè)在日常運行中,要注重積累這方面的數(shù)據(jù)資,同時要配套相應(yīng)的數(shù)據(jù)采集標(biāo)準(zhǔn)和方法,最大程度進(jìn)步數(shù)據(jù)利用價值。大數(shù)據(jù)的關(guān)鍵是處理。大數(shù)據(jù)的核心價值是預(yù)測。但大數(shù)據(jù)的特點對數(shù)據(jù)分析p 確實提出了全新挑戰(zhàn)。面對海量的數(shù)據(jù),如何尋找快速有效的方法進(jìn)展分析p 挖掘,為我們的決策提供根據(jù)也是擺在我們面前的一個難題。對此問題,一方面我們可以結(jié)合傳統(tǒng)統(tǒng)計方法,對構(gòu)造復(fù)雜、來多樣的數(shù)據(jù)建立有效統(tǒng)計模型,先行

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論