對大數(shù)據(jù)時代的心得體會_第1頁
對大數(shù)據(jù)時代的心得體會_第2頁
對大數(shù)據(jù)時代的心得體會_第3頁
對大數(shù)據(jù)時代的心得體會_第4頁
對大數(shù)據(jù)時代的心得體會_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、對大數(shù)據(jù)時代的心得體會讀了大數(shù)據(jù)時代后,感覺到一個大變革的時代將要 來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維 和生存基 本理論、方法和方式。下面就是小編分享的對大數(shù)據(jù)時代的心得體會,一起來看一下吧。這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運作上的應(yīng) 用,以 及它對現(xiàn)代商業(yè)運作的影響。大數(shù)據(jù)時代這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進行預(yù)測,并對未來可能出現(xiàn)的問題提出自己看法與對策。下面來重點介紹大數(shù)據(jù)時代這本書的主要內(nèi)容。 大數(shù) 據(jù)時代開篇就講了

2、Google通過人們在搜索引擎上搜索關(guān)鍵字 留下的數(shù)據(jù)提前成功的預(yù)測了 20XX年美國 的H1N1的爆發(fā)地與 傳播方向以及可能的潛在患者的事情。Google的預(yù)測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可 以弄到相關(guān)的數(shù)據(jù)。同時 Google的預(yù)測與政府?dāng)?shù)據(jù)的相關(guān)性高達 97% ,這也就意味著 Google預(yù)測數(shù)據(jù)的置信區(qū)間為 3% ,這個數(shù) 字遠遠小于傳統(tǒng)統(tǒng)計學(xué)上的常規(guī)置信區(qū)間 5%!而這個數(shù)字就是大 數(shù)據(jù)時代預(yù) 測結(jié)果的相對準(zhǔn)確性與事件的可預(yù)測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時候,

3、通過計算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本 接下來,維克多又通過了 舊M追求高精確性的電腦 翻譯計劃的失敗與 Google只是將所有出現(xiàn)過的相應(yīng)的文字語句 掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系Google詞庫就會出現(xiàn)翻譯,雖然 有的時候的翻譯很無厘頭,但是 大多數(shù)時候還是正確的,所 以Google的電腦翻譯的計劃的成 功,表明大數(shù)據(jù)時代對準(zhǔn) 確性的追求并不是特別明顯,但是相反 大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時代追求 的是全方位覆蓋的數(shù)字測度而不管其準(zhǔn)確性到底有多高,因為大 量的數(shù)據(jù)會 湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)

4、 據(jù)也會 無限的逼近事物的原貌。之后,維克托又預(yù)測了一個在大數(shù)據(jù)時代催生的重要職業(yè)數(shù)據(jù)科學(xué)家, 這是一群數(shù)學(xué)家、統(tǒng)計學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個人隱私。無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!我覺得大數(shù)據(jù)時代這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),

5、比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實就是我們將會成為被預(yù)測被引誘的對象。所以說,小心你在網(wǎng)上留下的痕跡。我喜歡這本書是因為它給我展現(xiàn)了一個新的世界。讀了大數(shù)據(jù)時代后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的 思想被強烈震撼,不禁戰(zhàn)栗起 來?!霸谛?shù)據(jù)時代,我們會假象世界是怎樣運作的,然后 通過 收集和分析數(shù)據(jù)來驗證這種假想?!?“隨著由假想時代到 數(shù)據(jù)時代的過渡,我們也很可能認(rèn)

6、為我們不在需要理論了。書中幾乎肯定要顛覆統(tǒng)計學(xué)的理論和方法,也試圖通過引用連線雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實際”來“終結(jié)”量子力學(xué)。對此我很高興,因為統(tǒng)計學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時學(xué)到抽筋都不能及格的課目。但這兩個理論實在太大,太權(quán)威,太基本了,我想我不可能 靠一 本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實 也不敢旗 幟鮮明地提出要顛覆它們的論點,畢竟還是在前面 加上了 “很可能認(rèn)為這樣的保護傘近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想

7、僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變,那我就必須“不受限于傳統(tǒng)的思維模 式和特定領(lǐng)域里隱含的固有偏見” ,跟作者一起先把統(tǒng)計學(xué)和量 子力學(xué)否定掉再說。反正我也不喜歡、 也學(xué)不會它們。當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計學(xué)了。但是由統(tǒng)計學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎(chǔ)邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了 !大數(shù)據(jù)時代第16頁“大數(shù)據(jù)的核心就是預(yù)

8、測”。邏 輯是描述時空信息“類”與“類”之間長時間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果 關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排 中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分歸納邏輯、溯 因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。 在同一件事上兩種方法 對立,應(yīng)該只有一個結(jié)果,就是要否 定掉其中之一。這就是讓我 很擔(dān)心的原因??晌覅s不能拭目以待,像旁觀者一樣等著哪一個“脫穎 而 出”,因為我身處其中。問題不解決,我就沒法思考和工 作,自

9、然就沒法活了 !更何況還有兩個更可怕的事情。其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因為爸爸就是爸爸,兒子就是兒子。那么大數(shù)據(jù)會不會通過正視混雜性,放棄因 果關(guān)系最后反而搞出時間機 器,讓爸爸不再是爸爸,兒子不 再是兒子了呢?其二:人和機器 的根本區(qū)別在于人有邏輯思維而機器沒有。大數(shù)據(jù)時代也擔(dān)心“最后做出決策的將 是機器而不是人”。如果真的那一天

10、因為 放棄邏輯思維而出現(xiàn)科幻電影上描述的機器主宰世界消滅人類的 結(jié)果,那我還 不如現(xiàn)在就趁早跳樓。還好我知道自己對什么統(tǒng)計學(xué)、量子力學(xué)、邏輯學(xué)和大 數(shù)據(jù) 來說都是門外漢,也許上面一大篇都是在胡說八道,所 謂的擔(dān)心 根本不存在。但問題出現(xiàn)了,還是解決的好,不然 沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。所以想向大數(shù)據(jù)時代的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分大數(shù)據(jù)時代的邏輯思維。信息和數(shù)據(jù)的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發(fā)展中的動態(tài)范疇,是進 行互相交 換的內(nèi)容和名稱,信息的界定沒有統(tǒng)一的定義,但是信息具備客觀、動態(tài)、傳遞、共享

11、、經(jīng)濟等特性卻是大家的共識。數(shù)據(jù):或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關(guān)于事件 之一組離散且客觀的事實描 述,是構(gòu)成信息和知識的原始材 料。數(shù)據(jù)可分為模擬數(shù)據(jù)和數(shù)字 數(shù)據(jù)兩大類。數(shù)據(jù)指計算機 加工的“原料”,如圖形、聲音、文 字、數(shù)、字符和符號等 從定義看來,數(shù)據(jù)是原始的處女地,需要 耕耘。信息則是已 經(jīng)處理過的可以傳播的資訊。信息時代依賴于 數(shù)據(jù)的爆發(fā), 只是當(dāng)數(shù)據(jù)爆發(fā)到無法駕馭的狀態(tài),大數(shù)據(jù)時代應(yīng) 運而生。 這是否是大數(shù)據(jù)時代一書所未曾闡述的背景材料?在大數(shù)據(jù)時代一書中,大數(shù)據(jù)時代與小數(shù)據(jù)時代的 區(qū)別:1、思維慣例。大數(shù)據(jù)時代區(qū)別與轉(zhuǎn)變就是,放

12、棄對 因果 關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察, 而不是傾其所有進行推理 ?這也是明智之舉2、使 用用途。小數(shù)據(jù) 停留在說明過去,大數(shù)據(jù)用驅(qū)動過去來預(yù)測未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而 TOC o 1-5 h z 相關(guān)關(guān)系更有利于預(yù)測未來。3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方 法的 整合。大數(shù)據(jù)更像是理論與現(xiàn)實齊頭并進,理論來創(chuàng)立 處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進行驗證。4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過 程。筆者認(rèn)為,小數(shù)據(jù)時代也即是信息時代,是大數(shù)據(jù)時代的前提,大數(shù)據(jù)時代是升華和進化,本質(zhì)是相輔相成,而并非相離互斥。數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)??蛻魯?shù)據(jù)、交易數(shù)據(jù)、 管理數(shù) 據(jù)等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論