- 相關推薦
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感范文(精選14篇)
當仔細品讀一部作品后,大家一定都收獲不少,是時候?qū)懸黄x后感好好記錄一下了。千萬不能認為讀后感隨便應付就可以,以下是小編幫大家整理的維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感范文,僅供參考,希望能夠幫助到大家。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 1
對于暢銷書刊、熱點話題、時尚科技,始終不太感興趣。書刊,喜歡有一定年份的。話題,鐘情于務虛的觀點。新奇的產(chǎn)品于我無緣,習慣使用成熟的科技產(chǎn)品。既不清高,也非冷漠,就是要與現(xiàn)實保持一定的距離,給自己留一點思考的空間。這一習慣最近破了例。由于工作的原因,耳濡目染,“大數(shù)據(jù)”這個新興概念開始頻繁步入我的視野。按捺不住內(nèi)心的好奇,網(wǎng)購《大數(shù)據(jù)時代》,手不釋卷,三天讀完,頗有收獲,此書有如下特點。
首先,作者站在理論的制高點上,條理清楚地闡述了大數(shù)據(jù)對人類的工作、生活、思維帶來的革新,大數(shù)據(jù)時代的三種典型的商業(yè)模式,以及大數(shù)據(jù)時代對于個人隱私保護、公共安全提出的挑戰(zhàn)。其次,文中的事例貼近現(xiàn)實生活,貼近時代,令讀者既印象深刻,又感同身受。此外,作者沒有使用大量的專業(yè)術(shù)語,沒有假裝一副專業(yè)的面孔?v觀全書,遣詞造句,均通俗易懂。
作者認為大數(shù)據(jù)時代具有三個顯著特點。
一、人們研究與分析某個現(xiàn)象時,將使用全部數(shù)據(jù)而非抽樣數(shù)據(jù)。
二、在大數(shù)據(jù)時代,不能一味地追求數(shù)據(jù)的精確性,而要適應數(shù)據(jù)的多樣性、豐富性、甚至要接受錯誤的數(shù)據(jù)。
三、了解數(shù)據(jù)之間的`相關性,勝于對因果關系的探索!笆鞘裁础北取盀槭裁础敝匾
作者指出,隨著技術(shù)的發(fā)展,數(shù)據(jù)的存儲與處理成本顯著降低,人們現(xiàn)在有能力從支離破碎的、看似毫不相干的數(shù)據(jù)礦渣中抽煉出真知爍見。在大數(shù)據(jù)時代,三類公司將成為時代的寵兒。一是擁有大數(shù)據(jù)的公司與組織。如政府、銀行、電信公司、全球性互聯(lián)網(wǎng)公司(阿里巴巴、淘寶網(wǎng))。二是擁有數(shù)據(jù)分析與處理技術(shù)的專業(yè)公司,如亞馬遜、谷歌。三是擁有創(chuàng)新思維的公司,他們可能既不掌握大數(shù)據(jù),也沒有專業(yè)技術(shù),但卻擅長使用大數(shù)據(jù),從大數(shù)據(jù)中找到自己的理想天地。
面對即將來臨的大數(shù)據(jù)時代,個人將如何應對自如?這是個嚴肅的問題。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 2
如今說起新媒體和互聯(lián)網(wǎng),必提大數(shù)據(jù),似乎不這樣說就OUT了。而且人云亦云的居多,不少談論者甚至還沒有認真讀過這方面的經(jīng)典著作——舍恩佰格的《大數(shù)據(jù)時代》。維克托·邁爾舍恩伯格何許人也?他現(xiàn)任牛津大學網(wǎng)絡學院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,曾任哈佛大學肯尼迪學院信息監(jiān)管科研項目負責人。
他的咨詢客戶包括微軟、惠普和IBM等全球企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔任多國政府高層的智囊。這位被譽為:大數(shù)據(jù)時代的預言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進行一場思想上的對話。
舍恩伯格分三部分來討論大數(shù)據(jù),即思維變革、商業(yè)變革和管理變革。在第一部分”大數(shù)據(jù)時代的思維變革“中,舍恩伯格旗幟鮮明的亮出他的三個觀點:
一、更多:不是隨機樣本,而是全體數(shù)據(jù)。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。
對于第一個觀點,我不敢茍同。
一方面是對全體數(shù)據(jù)進行處理,在技術(shù)和設備上有相當高的難度。另一方面是不是都有此必要,對于簡單事實進行判斷的數(shù)據(jù)分析難道也要采集全體數(shù)據(jù)嗎?
我曾與香港城市大學的祝建華教授討論過。祝教授是傳播學研究方法和數(shù)據(jù)分析的專家,他認為一定可以找到一種數(shù)理統(tǒng)計方法來進行分析,并不一定需要全部數(shù)據(jù)。聯(lián)系到舍恩伯格第二個觀點中所說的相關關系,我理解他說的全體數(shù)據(jù)不是指數(shù)量而是指范圍,即大數(shù)據(jù)的.隨機樣本不限于目標數(shù)據(jù),還包括目標以外的所有數(shù)據(jù)。我認為大數(shù)據(jù)分析不能排除隨機抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點,我認為這是對他第一個觀點很好的補充,這也是對精準傳播和精準營銷的一種反思!贝髷(shù)據(jù)的簡單算法比小數(shù)據(jù)的復雜算法更有效!案哂泻暧^視野和東方哲學思維。對于舍恩伯格的第三個觀點,我也不能完全贊同!辈皇且蚬P系,而是相關關系!安恍枰馈睘槭裁础,只需要知道”是什么“。傳播即數(shù)據(jù),數(shù)據(jù)即關系。在小數(shù)據(jù)時代人們只關心因果關系,對相關關系認識不足,大數(shù)據(jù)時代相關關系舉足輕重,如何強調(diào)都不為過,但不應該完全排斥它。大數(shù)據(jù)從何而來?為何而用?如果我們完全忽略因果關系,不知道大數(shù)據(jù)產(chǎn)生的前因后果,也就消解了大數(shù)據(jù)的人文價值。如今不少學者為了闡述和傳播其觀點往往語出驚人,對舊有觀念進行徹底的否定。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 3
讀完《大數(shù)據(jù)時代》這本書后,我意識到:我們即將或正在迎接由書面到電子的跳躍之后的又一重大變革。
這本書介紹了大數(shù)據(jù)時代來臨后,接踵而至的三項變革——商業(yè)變革、管理變革和思維變革。
其實,這場變革已經(jīng)打響。商業(yè)領域由于大數(shù)據(jù)時代的到來而推陳出新。前幾年,一家名為Farecast的公司,讓預訂到更優(yōu)惠的機票價格不再是夢想。公司利用航班售票的數(shù)據(jù)來預測未來機票價格的走勢,F(xiàn)在,使用這種工具的乘客,平均每張機票可以省大約50美元,這就是大數(shù)據(jù)給人們帶來的便利。
大家應該都知道2009年出現(xiàn)的H1N1型流感,就拿美國為例,疾控中心每周只進行一次數(shù)據(jù)統(tǒng)計,而病人一般都是難以忍受病痛的折磨才會去醫(yī)院就診,因此也導致了信息的滯后。然而,對于飛速傳播的疾病,Google公司卻能及時地作出判斷,確定流感爆發(fā)的'地點,這便是基于龐大的數(shù)據(jù)資源,可見大數(shù)據(jù)時代對公共衛(wèi)生也產(chǎn)生了重大的影響!
在我看來,如果想在在大數(shù)據(jù)時代里暢游,不僅要學會分析,而且還要能夠大膽地決斷。
在美國,每到七、八月份時,正是臺風肆虐之時,防澇用品也擺上了商品貨架。沃爾瑪公司注意到,每到這時,一種蛋撻的銷售量較其他月份明顯增加。于是,商家作了大膽的推測,出現(xiàn)這樣的結(jié)果源于兩種物品的相關性,便將這種蛋撻擺在了防澇用品的旁邊。這樣的舉措大大增加了利潤,這就是屬于世界頭號零售商的大數(shù)據(jù)頭腦!
大數(shù)據(jù)時代的到來,可以讓我們的生活更加便利。但是,如果讓大數(shù)據(jù)主宰一切,也存在一定的風險。
大家應該都知道電子地圖,它可以為人們指引方向。但大家應該還不知道,它會默默地積累人們的行程數(shù)據(jù),通過智能分析可以推斷出哪里是自己的家,哪里是工作單位。我們的隱私就這樣被不為人知地收集著。
大數(shù)據(jù)時代的到來,讓我們的生活更安全,更方便,但與此同時,我們的隱私不再是隱私,數(shù)據(jù)的收集變得無所不包、無孔不入。世界已經(jīng)向大數(shù)據(jù)時代邁進了一小步,一個嶄新的時代正向我們走來。讓我們用知識武裝大腦,做好準備,迎接新時代的到來!
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 4
去年的“云計算”炒得熱火朝天的,今年的“大數(shù)據(jù)”又突襲而來,讀大數(shù)據(jù)時代有感。仿佛一夜間,各廠商都紛紛改旗換幟,推起“大數(shù)據(jù)”來了。于是乎,各企業(yè)的CIO也將熱度紛紛轉(zhuǎn)向關注“大數(shù)據(jù)”來了。有一張來自《程序員》微博的漫畫很形象。我覺得這張圖,很真實地反映了現(xiàn)實中小企業(yè)云計算,大數(shù)據(jù)的現(xiàn)狀。
不過話又還得說回來,《大數(shù)據(jù)時代》是本好書。
當然,很多IT知名人士也大力推薦,寫了好多讀后感來表述對這本書的喜歡沒看此書之前,對所謂大數(shù)據(jù)的概念基本上是一頭霧水,雖則有了解關注過現(xiàn)在也比較火熱的BI,覺得也差不多,可能就是更多的數(shù)據(jù),更細致的數(shù)據(jù)分析與數(shù)據(jù)挖掘?催^此書后,感覺到之前的想法,只能算是中了一小半吧---巨量的數(shù)據(jù),而另一前:著眼于數(shù)據(jù)關聯(lián)性,而非數(shù)據(jù)精確性,或許才是大數(shù)據(jù)與現(xiàn)時BI最大的不同,不僅僅是方法,更多的時思想方法。不過坦白講,到底是數(shù)據(jù)的關聯(lián)性重佳,還是數(shù)據(jù)的精確性更好,還真的需要時間來檢驗一下,至少從現(xiàn)在的數(shù)據(jù)分析方法來論,更多的傾向于數(shù)據(jù)的精確性。看完此書,我心中的一些問題:
1.什么是大數(shù)據(jù)
查了查百度百科,是這樣定義的:大數(shù)據(jù)(bigdata),或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內(nèi)達到擷娶管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。大數(shù)據(jù)的4V特點:Volume、Velocity、Variety、Veracity--這個好像是IBM的定義吧,讀后感《讀大數(shù)據(jù)時代有感》。
以個人的觀點來看:數(shù)據(jù)海量,存儲海量都是大數(shù)據(jù)的基本原型吧。
2.大數(shù)據(jù)適合什么樣的企業(yè)
誠然,大數(shù)據(jù)的前提是海量的數(shù)據(jù),只有擁有巨量的數(shù)據(jù)資源,方能從中查找出數(shù)據(jù)的關聯(lián)性,才可以讓通過
專業(yè)化的處理,讓其為企業(yè)產(chǎn)生價值。針對電信運營,互聯(lián)網(wǎng)應用這樣海量用戶的數(shù)據(jù)的大企業(yè),也是在應用大數(shù)據(jù)的道路上擁有得天獨厚的條件,但是針對中小企業(yè)呢?銷售訂單數(shù)據(jù)?若非百年老店,估計數(shù)據(jù)也是少得可憐,5,能用的可能只有消費者數(shù)據(jù)了吧。貌似大多數(shù)廠商,用來舉例的也就是消費都購買行為分析為最多。同樣,在公共事業(yè)類的政府機構(gòu),大數(shù)據(jù)的作用也許也能很好的發(fā)揮。反而感覺在大多數(shù)中小型企業(yè)應用大數(shù)據(jù),似乎有點大題小作。書中說:大數(shù)據(jù)是企業(yè)競爭力。誠然,數(shù)據(jù)是一個企業(yè)的.核心無形資源(利用得好的話),但是否所有的數(shù)據(jù),或都換則方式說:所有的企業(yè)都以大數(shù)據(jù)為競爭力,是否真的合適么?是否在中小企業(yè)中,會顯示得小題大做呢?
3.大數(shù)據(jù)帶來的影響
當一波又一波的IT技術(shù)熱潮源源不斷地向我們鋪面而來的時候,你甚至都沒有做好準備,你都要開始迎接它所給你帶來的影響了。經(jīng)過物聯(lián)網(wǎng),云計算的推波助瀾下,大數(shù)據(jù)開始登場了。但它到底給我們帶來了什么呢?
1)預測未來書中以Google成功預測了未來可能發(fā)生流感的案例來開篇,表明通過大數(shù)據(jù)的應用,可以為我們的生活起一個保駕護航的指向標。實質(zhì)很簡單,技術(shù)改變世界。
2)變革商業(yè)大數(shù)據(jù)所帶來的商機,同時會衍生出一系列與大數(shù)據(jù)相關的商業(yè)機遇與商業(yè)模式,數(shù)據(jù)的潛在價值會源源不斷地發(fā)揮作用可以容易想到的是未來有專門的數(shù)據(jù)收集,數(shù)據(jù)分析,數(shù)據(jù)生成的一條數(shù)據(jù)產(chǎn)業(yè)鏈產(chǎn)生。影響最大的,當然是IT公司
3)變革思維書中所說:因為有海量的數(shù)據(jù)作基礎,未來,我們可能更關注數(shù)據(jù)的相關,而非精細度。對這條,本人還是持保留意見的。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 5
這么多年來,看了很多東西,如今回過頭來發(fā)現(xiàn),好像什么都忘了,真是悲劇,所謂讀書破萬卷,下筆如有神或許是不對的,還是需要下筆勤快,所以決定從這里開始。
這些年對于技術(shù)的發(fā)展,我是沒有跟上,如今發(fā)現(xiàn)即便是對于投資,技術(shù)對于我們生活的改變太大,而自己身在這個技術(shù)浪潮的前沿,還是需要跟上步伐!把
大數(shù)據(jù)這個概念已經(jīng)提了很久,我也一直疏忽了對于它的理解?赐辍洞髷(shù)據(jù)時代》,再結(jié)合如果工作上對于大數(shù)據(jù)的理解,頓時發(fā)現(xiàn)數(shù)據(jù)的重要性,以前在這方面的確沒有足夠的思想意識。
整本書來說,我覺得最關鍵的三個點是前面幾個章節(jié):
1、要總體,不要隨機樣本:從小對于統(tǒng)計學相關的學習,基本都是從樣本出發(fā),理論的基礎在于如何隨機的足夠分散的選取樣本,這可是技術(shù)活加直覺。而對于大數(shù)據(jù)來說,要的就是總體,本質(zhì)上來說,總體樣本的確更能準確找到結(jié)果。但是對于統(tǒng)計來說,總體的分析增加了數(shù)據(jù)分析的難度,不僅數(shù)據(jù)核對不好進行,一旦出現(xiàn)數(shù)據(jù)污染,準確度就會大打折扣,而且進行數(shù)據(jù)回溯的時候,也無法準確確認問題,而這一點也是后面相關性上問題;
2、要混亂,而不是精確:這里主要想說明的是希望數(shù)據(jù)的多樣性,盡量將相關數(shù)據(jù)都收集起來,不管是結(jié)構(gòu)化的還是非結(jié)構(gòu)化的。這樣就不可避免的最終結(jié)果的不準確性。大數(shù)據(jù)更多的是從一個總體數(shù)據(jù)中說明以后概率事件,既然是概率,也就可以理解無法精確。這里有個點的說明,我覺得需要提一下,大數(shù)據(jù)算法更傾向于“簡單”,而不是復雜,這個倒是出乎我的意外。
3、要相關性,而不是因果:從我對于知識獲取的過程來說,我是不同意這個觀點,從人體對于知識的理解,還是要從因果論出發(fā),沒有因果論,就會變成瞎子。而作者的觀點上來說,原因可能還是從大數(shù)據(jù)本身的非準確性,一旦找到合適的算法,找到相關性,向上追述原因本身就很難。但是從舉的示例上看,相關性的確認是一個非常大的工程,基本就是使用排舉法,一個一個試。
所以,對于大數(shù)據(jù)來說,最重要的.三點是:1、數(shù)據(jù)——得到更多數(shù)據(jù);2、算法——建立更快的算法體系;3、思維——尋找數(shù)據(jù)間更多的相關性。
對于數(shù)據(jù)最終的走向,我同意書中所提到的政府管理的觀點,既然都是以“石油”的標準來看待數(shù)據(jù),政府統(tǒng)一管理也就是必然的了。而且對于政府來說,掌握更多數(shù)據(jù)也有利于其管理及維護社會的穩(wěn)定性。而對于社會道德方面的論述,我不想多說什么,時代發(fā)展是不會被道德綁架的。
所以最后,想要建立對于大數(shù)據(jù)的思維,《大數(shù)據(jù)時代》還是值得一讀,里面的很多示例也非常不錯。如人際關系這一塊,也是出乎我的意料。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 6
知道"是什么"就夠了,沒必要知道"為什么"。在大數(shù)據(jù)時代,我們不必非得知道現(xiàn)象背后的原因,而是讓數(shù)據(jù)自己"發(fā)聲"。這個命題是我讀這本書最大的感觸。
對于大多數(shù)人來說,這的確是一場思維變革。對于理科學生來說,會認為這是一個錯誤的觀點,因為這無異于否定了他們對世界客觀物理化學規(guī)律探索的重要性;對于一名工科學生,其實這并不是一個多么新穎的觀點,因為工科是講求時用性的,如何能更好地利用基本自然科學規(guī)律創(chuàng)造社會財富比探索自然科學知識顯得更重要。
這些天來,在讀大數(shù)據(jù)這本書的同時,也稍微重溫了一下自動控制原理,認識到控制系統(tǒng)中存在明顯的大數(shù)據(jù)時代思維方式,借讀書交流會之際,與大家分享。
對系統(tǒng)的有效控制需要對系統(tǒng)理解與建模。以一個日常生活中的例子說明。開車的時候一腳油門下去車就飛出去了,但并不知道這一腳油門下去能給多大車速,這就需要駕駛?cè)藛T的熟練的駕駛技能了,不然超速被開罰單是很正常的。那么,問題就來了:如何能實現(xiàn)速度的自動控制而不用駕駛?cè)藛T踩油門?這就是控制系統(tǒng)最關鍵的環(huán)節(jié)——建立系統(tǒng)數(shù)學模型。大白話就是知道車速與燃油量的數(shù)學關系式。若是以探索為什么的思維模式,不可避免的要列一大堆能量方程、動量方程等物理化學式子,經(jīng)過繁雜的計算,還是能得到車速和燃油量的數(shù)學關系式的。很明顯這是一個繁瑣的過程,因為得知道現(xiàn)象背后的原因。這僅是對于這種簡單的系統(tǒng),若是對于航空發(fā)動機這種復雜的.系統(tǒng),結(jié)構(gòu)工藝過于復雜,分析各部分的物理化學過程是十分困難的,這時候可以通過實驗法得到數(shù)學模型。
實驗法主要有時域測定法、頻域測定法和統(tǒng)計相關法。與大數(shù)據(jù)時代思維最接近的是統(tǒng)計相關法,主要過程是對被研究對象施加某種隨機信號,根據(jù)被測對象各參數(shù)的變化,采用統(tǒng)計相關法確定被測系統(tǒng)或?qū)ο蟮膭討B(tài)特性。這種方法可以在被測系統(tǒng)或生產(chǎn)過程正常運行狀態(tài)下進行在線辨識,測試結(jié)果精度較高,但要求采集大量測試數(shù)據(jù),并需要相關儀和計算機進行數(shù)據(jù)計算和處理。
若用開車實例來解釋,此時的系統(tǒng)為汽車動力系統(tǒng),施加的隨機信號為燃油量,被測對象指車轉(zhuǎn)速,得到的動態(tài)特性就是指車速與燃油量函數(shù)關系式,從而不用探求背后的物理化學規(guī)律就得到了數(shù)學模型。
在沈陽黎明航空公司實習時去過試車間,除了發(fā)動機點火后震撼的場景動人心魄,控制室屏幕上海量的數(shù)據(jù)也同樣引人注目,我想這么多數(shù)據(jù)無非就是驗證數(shù)學模型或直接實驗法得到數(shù)學模型,結(jié)合航空發(fā)動機這種復雜的系統(tǒng),對于搞控制的人來說,得到數(shù)學模型就夠了,現(xiàn)象背后的原因交給研發(fā)的人來探索更好。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 7
乍一看題目,最初的想法是數(shù)據(jù)只不過是人們在日常工作過程中產(chǎn)生的那些數(shù)據(jù),而大數(shù)據(jù)無非就是數(shù)據(jù)量龐大,在我們?nèi)粘L幚淼臄?shù)據(jù)類的基礎上上一個臺階,僅此而已。
我的這個想法無疑是天真的,簡單的就像一個孩童剛剛學會咿呀學語,完全不知道語言的廣博和意義的深刻。讀罷此書,雖說談不上能跟上作者那天馬行空的思想境界,但也簡單地總結(jié)一些讀書的心得,以求得一定的學習成果,便于打開自己的眼界,拓展自己的思維方式。
大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型。它和望遠鏡、顯微鏡一樣,能客觀上改變我們對世界的認知,并從其他多種角度讓我們了解精彩紛程的世界。在過去十幾二十幾年的時間里,大數(shù)據(jù)不僅改變著公共衛(wèi)生、商業(yè),更重要的是正改變著我們的思維,使我們能從全新的思維出發(fā)去感知、去洞見未來,這無疑是大數(shù)據(jù)最有價值所在。
大數(shù)據(jù)時代的到來,正在改變著我們的思維模式。以下三個部分的應用證據(jù),說明我們正在經(jīng)歷著這樣的與以往不一樣的變革,這種變革將打破傳統(tǒng)思維的束縛,向著更高更復雜的層面演進。
第一,大數(shù)據(jù)強調(diào)認為,不是隨機樣本,而是全體數(shù)據(jù)。我們知道,對歷史數(shù)據(jù)進行研究的初衷,是我們想得出歷史數(shù)據(jù)之間的運行變化規(guī)律,進而能更精確地推測數(shù)據(jù)未來的走向,以求對未來發(fā)展的事項進行能動的控制。那這里所認為的全體數(shù)據(jù),到底什么才是全體數(shù)據(jù)呢?究竟是“我們需要的全體數(shù)據(jù)”,還是“我們能收集到的全體數(shù)據(jù)”,亦或是“我們認為的全體數(shù)據(jù)”,每個人對數(shù)據(jù)集合的范圍可能存在不同,在某種情況下,個別選定的“全體數(shù)據(jù)”可能也是局部數(shù)據(jù),甚至可能是隨機數(shù)據(jù)。只是數(shù)據(jù)的廣度范圍、精細程度可能存在不同而已。因此,大數(shù)據(jù)選認定的全體數(shù)據(jù)仍然是一個相對的概念,是相對于傳統(tǒng)的隨機樣本而提出的,但是,其數(shù)據(jù)量、質(zhì)都與傳統(tǒng)隨機樣本具有本質(zhì)區(qū)別,這將導致得出與隨機樣本完全不同的結(jié)論,F(xiàn)代計算機技術(shù)的發(fā)展解決了巨大數(shù)據(jù)運算的各種問題,使我們得出問題的`結(jié)論更貼進于事物的本像。
第二,大數(shù)據(jù)強調(diào)認為,不是精確性,而是混雜性。書上講,執(zhí)迷于精確性是信息缺乏時代和模擬時代的產(chǎn)物。需要加工的數(shù)據(jù)可能只5%是結(jié)構(gòu)化式的,其他95%部分需要通過加工,或組合、或移動、或裁剪等加工方式,加工成適合我們利用的方向,最終將在加工的數(shù)據(jù)之上進行分析,得出結(jié)論。由此得出待加工的原始數(shù)據(jù)具有混雜性,而非精確性,以前傳統(tǒng)分析是這樣,現(xiàn)在大數(shù)據(jù)下更亦如此。另一個層面,指的是加工出來的數(shù)據(jù)的精確性,這個就需要人為定義了。提出“精確”這個概念,是基于有相對容差數(shù)據(jù)的,即大數(shù)據(jù)如何控制或者說評定“輸出品質(zhì)”。一個東西要出故障,不會是瞬間的,而是慢慢地出問題,通常,我們需要找到問題的幾個關鍵點,進行監(jiān)控,我們才可能可以預測未來。在這過程之中,設定監(jiān)控問題越精密,監(jiān)控的效果越好。如果我們?nèi)萑袒祀s性程度越高,可能效果越不盡理想。
第三,大數(shù)據(jù)強調(diào)認為,不是因果關系,而是相關關系。在大數(shù)據(jù)時代,知道“是什么”就夠了,沒必要知道“為什么”。我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”。這是區(qū)別于以往思維方式的最重要的事項之一,想想過去,言必出,行必果,感覺這個言行必須要因果結(jié)果,沒有因,就沒有果,同樣,沒有果,原因也沒有存在的必要和意義。大數(shù)據(jù)時代拓寬了看待事物的層面,從各個角度去看問題,之前的因果關系被弱化,甚至無關緊要,從相關的角度去度量、預測事物的發(fā)展、內(nèi)源等取向,則會得到無數(shù)條通往事物發(fā)展方向的道路,勢必將使事物呈現(xiàn)更加立體、更加多源的格局,使我們更清楚地認識事物或現(xiàn)象的本質(zhì)。那么如何在大數(shù)據(jù)時代運用相關關系“開發(fā)”事物或現(xiàn)象更多層面的發(fā)展或內(nèi)源供人們利用呢?找到關聯(lián)物,是運用大數(shù)據(jù)進行有效預測的關鍵。相關關系的核心是量化兩個數(shù)據(jù)值之間的數(shù)理關系,相關關系強是指當一個數(shù)據(jù)值增加時,另一個數(shù)據(jù)值很有可能也會隨之增加,而相關關系弱是指當一個數(shù)據(jù)值增加時,另一個數(shù)據(jù)值幾乎不會發(fā)生變化。當然,嚴格地講,即使沒有相關性,另一個數(shù)據(jù)值也可以大幅變化,只是沒有趨勢可循罷了。相關關系是通過識別有用的關聯(lián)物來幫助我們分析一個現(xiàn)象,而不是通過揭示內(nèi)部的動作機制。通過給我們找到一個現(xiàn)象的良好的關聯(lián)物,通過計算機的大量運算,相關關系可以幫助我們捕捉現(xiàn)在和預測未來,而且分析數(shù)據(jù)更加準確、更快,不易受偏見的影響,這點非常重要。因此,建立在相關關系分析法基礎上的預測是大數(shù)據(jù)的核心。
以上三人方面的“應用證據(jù)”在商業(yè)變革、管理變革方面普遍運用,百且取得了意想不到的效果,開拓了想象的“藍!、管理更趨多元,手段更加精準和獨到。
但是大數(shù)據(jù)并不是一個充斥著算法和機器的冰冷世界,人類的作用依然是無法被完全取代的。大數(shù)據(jù)為我們提供的不是最終答案,只是參考答案,人類在眾多參考答案的基礎上,運用自己對現(xiàn)象的“職業(yè)判斷”,得出更靠譜的方法和答案,并在實踐的檢驗下,越趨完善的方法和答案反過來又作為充斥大數(shù)據(jù)成員的一部分,使大數(shù)據(jù)構(gòu)架基礎更加科學并充分展示事物的性質(zhì),以方便我們隨時獲取。這是一個沒有終點,循環(huán)往復的不斷進化的過程。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 8
未來的十年,將是大數(shù)據(jù)引領下的智慧科技時代。不管你是否意識到它的存在,大數(shù)據(jù)都將越來越快地改變我們這個時代,包括我們的生活方式。
維克托·邁爾-舍恩伯格是最早洞見大數(shù)據(jù)時代發(fā)展趨勢的數(shù)據(jù)科學家之一。他通過一個大家熟知的事例,來幫助我們理解“大數(shù)據(jù)”的潛在影響力,那就是四個世紀之前望遠鏡和顯微鏡的發(fā)明。望遠鏡能夠讓我們感受宇宙,顯微鏡能夠讓我們觀測微生物,它們都是收集海量數(shù)據(jù)的新工具,因為這種工具的發(fā)明,人們同步更新了分析數(shù)據(jù)的技術(shù)和方法,促進了人們對世界更好的理解。如果說望遠鏡和顯微鏡是測量領域中的一場革命,那么今天的數(shù)據(jù)測量就相當于是現(xiàn)代版的望遠鏡、顯微鏡。隨著社交網(wǎng)絡的逐漸成熟,移動帶寬迅速提升,云計算、物聯(lián)網(wǎng)應用更加豐富,以及更多的傳感設備、移動終端接入到網(wǎng)絡,由此產(chǎn)生的數(shù)據(jù)及數(shù)據(jù)的增長速度比歷史上的任何時期都要多、都要快。一個大數(shù)據(jù)的時代,不經(jīng)意間順理成章地翩然而至。
一、什么是大數(shù)據(jù)?
大數(shù)據(jù)是當前最熱門的話題之一。但什么是大數(shù)據(jù),人們尚未給出確切的定義。首先,“大數(shù)據(jù)”是相對過去小的、局部性的數(shù)據(jù)而言的;其次,利用大數(shù)據(jù)進行分析和工作時,所依據(jù)的關于此事盡可能完整的數(shù)據(jù),從而“一覽眾山小”,而不是采用局部的小數(shù)據(jù),從局部推斷整體。
維克托也并未直接給出大數(shù)據(jù)的定義。不過,他用三大轉(zhuǎn)變描述了大數(shù)據(jù)的特性:
轉(zhuǎn)變之一:在大數(shù)據(jù)時代,我們可以分析更多的數(shù)據(jù),有時候甚至可以處理和某個特別現(xiàn)象相關的所有數(shù)據(jù),而不再依賴于隨機采樣。例如一項針對相撲比賽中非法操縱比賽結(jié)果的研究對64000場比賽進行了分析,這算不上一個很大的數(shù)字,但由于這是過去十年所有的比賽,所以它是大數(shù)據(jù)。
轉(zhuǎn)變之二:由于有了更多的數(shù)據(jù),我們可以接受更多的混雜、更多數(shù)據(jù)上的不精確。如果我們對于一個事物只有50個數(shù)據(jù)點,那么每一個數(shù)據(jù)點都必須非常精確,因為每個數(shù)據(jù)點都是有用的;但是如果我們有5000萬個,去掉10個,甚至去掉1000個都沒有太大的問題。
轉(zhuǎn)變之三:不再探求難以捉摸的因果關系,轉(zhuǎn)而關注事物的相關關系。分析大數(shù)據(jù)主要為了預測未來“是什么”,而不是“為什么”。因為很多時候我們以為我們找到了事情背后的原因,實際上卻沒有找到。更多時候知道了“是什么”就足夠了。例如知道流感將會擴散到哪里就足夠了,我不需要知道為什么;知道什么時候在網(wǎng)上購買機票能夠獲得最優(yōu)惠的價格就足夠了,我不需要知道為什么此時價格最低。
二、大數(shù)據(jù)帶來的變化
大數(shù)據(jù)從根本上改變我們認識世界和改變世界的方式。很多傳統(tǒng)的習慣將被顛覆,很多舊的制度將面臨挑戰(zhàn)。舉例來說:
第一,科學探究的思路和方式受到挑戰(zhàn)
探究是新課程改革中的一個熱詞,是促進學校教學與科學研究相融合的實踐舉措?茖W探究的基本路徑是:發(fā)現(xiàn)問題,提出假設,制定方案,實踐探究,分析數(shù)據(jù),得出結(jié)論。之所以會梳理出這樣一個探究的路徑,與我們對問題知曉的信息過少有關。換句話說,對所要研究的事物,我們知道的數(shù)據(jù)很少,需要從這些很小的數(shù)據(jù)出發(fā),通過猜想和假設,進行試探性的研究,如果研究得出的結(jié)果和自己的假想是一致的,則說明我們的假說是正確的,這些假說會上升為對該事物描述的知識,我們掌握該事物的數(shù)據(jù)也隨之增加。
利用測量所獲得的點滴數(shù)據(jù),從一個局部來推測世界是怎樣的,這是科學探究的基本思路和方式。長期以來,我們總是通過這樣的方式來認識世界,對其有宗教般的信仰。盡管我們知道,決策者總是先有了想法,才會提出假設。如果決策者自身對所研究的事情存在著偏見,所提出的假設就很難得到實證的支持,這往往會導致探究花費了很長的時間、很大的物力和財力,也常常勞而無功。但科學研究者還是堅定不移地沿著這條道路前行,學校在教學中也將其作為科學研究的基本規(guī)范來傳授。
在大數(shù)據(jù)時代,這樣的研究方式收到了極大的挑戰(zhàn)。先舉個事例來說吧。手機輻射是否能夠致癌?關于這個問題,無論我們的假設如何,實驗的設計都很難進行。首先,樣本選擇過少,沒有統(tǒng)計學上的意義;其次,不能拿人做研究對象;第三,短時間的研究很難觀察到變化。有了大數(shù)據(jù)之后,這樣的難題就可以迎刃而解了。前段時間,丹麥就進行了這樣的研究。丹麥擁有1985年手機推出以來所有手機用戶的數(shù)據(jù)庫。他們從這個數(shù)據(jù)庫中分析了1990年至2007年擁有手機的所用用戶的數(shù)據(jù),同時,他們還收集了這一期間醫(yī)院收集的所有癌癥患者的數(shù)據(jù),然后分析手機用戶是否比非手機用戶有更高的癌癥發(fā)病率。這兩個數(shù)據(jù)庫本身是完全獨立的,在作分析之前從來沒有想過可以做這樣的研究。結(jié)果表明,使用移動用戶和癌癥風險增加之間不存在任何關系。2011年10月,這一研究的`結(jié)果發(fā)表在《英國醫(yī)學雜志》上。
上述的案例告訴我們,在獲得了大量的數(shù)據(jù),能夠?qū)κ挛锏恼w進行全面的認識之后,假想就沒有意義了,我們可以直接根據(jù)全面的數(shù)據(jù)做出結(jié)論。
第二,傳統(tǒng)的思維習慣受到挑戰(zhàn)
因果關系思維,是人們生活中最為普遍的一種思維方式。既是看上去沒有關系的事情,人們也總是從因果的角度去理解他。比如說,1885年7月6日,巴斯德接診了一個被帶有狂犬病毒的狗咬傷的孩子,他把自己剛研制出來的狂犬疫苗給孩子注射,結(jié)果孩子活下來了。巴斯德的這一舉措,使得狂犬疫苗和孩子的生存之間建立起了一個因果關系。但事實上,人被狂犬病狗咬傷后換上狂犬病的概率是只有七分之一,就算沒有狂犬疫苗,這個孩子活下來的幾率還是有85%。
在哲學界,關于因果關系的爭論已經(jīng)持續(xù)了幾個世紀。爭論的焦點在于:如果因果關系是普遍存在的,每一個果都有一個因和他相對應,世界上的所有事情都有因果的話,我們就沒有決定任何事情的自由了。盡管哲學領域的爭論很熱烈,但并不耽誤人們在日常生活中通過因果關系來思考問題。不僅如此,由于掌握的數(shù)據(jù)過少,人們還容易從線性關系的角度找尋事物之間的因果關系。在物理學中,有一種處理數(shù)據(jù)的方式之一就是“化曲為直”,設法找到兩個變量之間的線性因果關系,從而進行定量的描述。事實上,由于很多事情之間的關系是很復雜的,簡單的線性處理容易導致人們對事物本質(zhì)屬性的誤解。
在大數(shù)據(jù)時代,相關關系比因果關系重要。2009年甲型H1N1流感發(fā)生之后,美國的衛(wèi)生系統(tǒng)極力想從因果關系上來找到流感的源頭,但信息反饋的速度太慢,讓專家們束手無策。谷歌公司做出了快速反應,把5000萬條美國人最頻繁檢索的詞條和美國疾控中心在2003年至2008年間季節(jié)性流感傳播時期的數(shù)據(jù)進行比較,研究特定檢索詞條的頻繁使用與流感在時間和空間上的傳播之間的聯(lián)系,很快就確定了流感是從哪個地方傳播出來的。谷歌采取的就是相關關系分析的方法,而不是因果關系分析的方法。這是大數(shù)據(jù)時代,對數(shù)據(jù)進行處理的一種典型方法。
第三,數(shù)據(jù)化比數(shù)字化更加重要
數(shù)字化是將模擬數(shù)據(jù)轉(zhuǎn)化成0和1的二進制碼,以便電腦進行數(shù)據(jù)處理的過程。過去的很長時間,我們所做的事情,就是對文本進行數(shù)字化。很多書籍包括教材,通過PDF等格式,變成了數(shù)字形態(tài)的資料,存入了電腦或者網(wǎng)路之中。
但是,這些數(shù)字化的資料要查詢起來并不方便。首先你要知道所需的資料在那本書中,其次你還要仔細地去翻閱這些數(shù)字化的資源,以便找到你所需要的信息。這和到書本里去找沒有本質(zhì)的區(qū)別。
如果這些數(shù)字文本能夠被數(shù)據(jù)化,文本中的字、詞和段落能夠一一被識別,利用搜索殷勤加以檢索就會方便很多。所謂數(shù)據(jù)化就是將一種現(xiàn)象轉(zhuǎn)化為可以制表分析的可量化的過程,量化,是數(shù)據(jù)化的核心。信息只能被數(shù)據(jù)化,其巨大的潛在價值才有可能被釋放出來。
數(shù)字化帶來了數(shù)據(jù)化,但數(shù)字化不能替代數(shù)據(jù)化。今天,很多學校都在進行“電子書包”的課程教學實踐,但有不少實踐者認為,所為電子書包,就是將紙質(zhì)的課本和教輔資料數(shù)字化,裝入電腦中讓學生上課中使用,這其實是對電子書包最大的誤解。電子書包的核心在于數(shù)據(jù)化,要通過對學生學習過程所記錄的大數(shù)據(jù)分析,把握學生的個性化學習特征,以便給予更有針對性的指導。
三、需要關注的一些問題
從教育的角度看,大數(shù)據(jù)時代的來臨,對教育的變革將帶來巨大的影響。
首先是教育內(nèi)容要進行革新。大數(shù)據(jù)使得傳統(tǒng)的因果思維方式、科學研究方式不再是生活、工作起主導地位的方式,這必然要求我們在教學中要將這些變化和學生講清楚,以便他們能夠在今后走上社會的時候有足夠的能力迎接挑戰(zhàn)。
其次是教學方式要進行革新。過去的教學,因為沒有大量數(shù)據(jù)的支撐,該教什么全憑教師自己跟著感覺走。今天,我們可以將教師的教學視頻掛在晚上,通過深度分析學生在觀看視頻的過程中在哪些地方停頓或者重放的頻次比較高,來找出學生不明確或者課程吸引人的地方,幫助教師改進教學、確定教學重點。這必然導致教師教學方式的變革。
第三是學習路徑會發(fā)生變化。在過去,如果你想成為一個優(yōu)秀的生物學家,一定要認識很多生物學家。今天,要解決一個生物難題,可能與天體物理學家或者數(shù)據(jù)視圖設計師聯(lián)系就可以實現(xiàn)。
第四是要防止對數(shù)據(jù)的癡迷。一方面,我們要研究學校長期以來儲存下來的大量數(shù)據(jù),同時積累學校每天的教育數(shù)據(jù),為進入大數(shù)據(jù)時代做好充分的思想準備;另一方面,要喚醒學校里沉睡的數(shù)據(jù),讓其在學校管理和教師教學中發(fā)揮更大的作用;再一方面,也要防止出現(xiàn)另一個極端,那就是對數(shù)據(jù)的癡迷。能僅僅為了收集數(shù)據(jù)而收集數(shù)據(jù),要讓數(shù)據(jù)在如何全面反映一個學生的能力、全面反映教師的教育質(zhì)量等方面做出實踐和探索。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 9
舍恩伯格的《大數(shù)據(jù)時代》,讓我重新審視了"大數(shù)據(jù)"這個在信息時代異軍突起的熱點詞匯,作為信息安全專業(yè)的我,對大數(shù)據(jù)這個詞本身有著更多的熱忱。
在百度上搜索到的解釋是:"大數(shù)據(jù)",或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具工具,在合理時間內(nèi)達到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊。特點:數(shù)量、速度、品種、真實性。
而舍恩伯格認為,大數(shù)據(jù)并不能定義一個確切的概念。他提到"大數(shù)據(jù)是人們獲得新的認知,創(chuàng)造新的價值的源泉;大數(shù)據(jù)還是改變市場、組織機構(gòu),以及政府和公民關系的方法。"這是一種更具有人文色彩和社會意義的詮釋。
本書中,主要從三個方面論述,即思維變革、商業(yè)變革和管理變革。而舍恩伯格更是著重闡明三大觀點:
一、更多:不是隨機樣本,而是全體數(shù)據(jù)。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關系,而是相關關系。
對于觀點一,我不敢茍同,畢竟大數(shù)據(jù)的實現(xiàn)需要一定的技術(shù)支持,而顯然,現(xiàn)在這種技術(shù)還不夠成熟,同時一些簡單的事情運用大數(shù)據(jù)反倒是問題更加復雜化,因此這種大叔據(jù)的繁雜處理方式更適用于一些特定的情況,比如商業(yè)預測,人類dna的研究等。
而對第二種觀點,我是十分贊同舍恩伯格所說的"大數(shù)據(jù)的簡單算法比小數(shù)據(jù)的簡單算法有效"。在計算機行業(yè)迅速發(fā)展中,一種新的簡單可行的算法的出現(xiàn),遠沒有計算機在運算速度和存儲容量的發(fā)展快,而大數(shù)據(jù)算法似乎更能迎合這種大趨勢。
觀點三中提到的相關關系在大數(shù)據(jù)中可是重量級的,它能較快找到事物規(guī)律和對應的解決措施,當然,也不能完全忽視因果關系,畢竟人們在思維上更能夠接受因果關系分析出的結(jié)果,而大數(shù)據(jù)預測的需要人們慢慢的適應才能接受。當我們完成相關關系的分析而又不滿足于只知道"是什么"的時候,我們就可以轉(zhuǎn)而研究"為什么"了,畢竟問題的根本在于因果。而舍恩伯格的全體數(shù)據(jù)和相關關系是大數(shù)據(jù)時代下的一種捷徑。
但是在信息時代,信息安全問題的日趨凸顯,數(shù)據(jù)獨裁與隱私保護之間的矛盾更是立于風口浪尖,成為眾矢之的,舍恩伯格在本書的最后章節(jié)曾試圖尋找一種解決方式來擺脫這一種困境,但最終沒能做到,但是他提出"大數(shù)據(jù)并不是一個充斥著算法的'和機器的冰冷世界,人類的作用仍無法被完全代替。"這里表明人在數(shù)據(jù)時代同樣的重要,數(shù)據(jù)是為人類服務的,也就該人類驅(qū)使下完成相應的目的。
在這樣的大環(huán)境下,常引起我更多的思考和擔憂。
大數(shù)據(jù)時代對于我們同是機遇與挑戰(zhàn),一些國家已開始步入大數(shù)據(jù)時代的行列,并在各個領域開始研究和使用。而對于我國龐大的人口,以及較大的領土面積,都可以在大數(shù)據(jù)時代為我們提供數(shù)據(jù)的保障,而能否面臨挑戰(zhàn),在大國之間的新一輪角色角逐間嶄露頭角,我們更需要解決技術(shù)等方面的問題,更應在政策上逐步開放各領域的數(shù)據(jù),保證數(shù)據(jù)來源、權(quán)限等問題得到解決,不斷學習先進的計算機技術(shù),縮小與其他國家的差距。
工業(yè)化、信息化,我們都向世界交出了一份讓世界不能小覷的答案;
大數(shù)據(jù)時代的數(shù)據(jù)化我們又將怎樣在新的風暴中所向披靡,如果大數(shù)據(jù)時代是一種必然趨勢,那這就是我們這一代人的責任,是我們新的戰(zhàn)場!
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 10
“大數(shù)據(jù)”一詞不知何時在我們的生活悄然出現(xiàn),為了一探究竟,我便選擇了《大數(shù)據(jù)時代》一書。
作者先從全局簡單地描述大數(shù)據(jù)對我們的生活、工作與思維的影響,再從三方面具體地用上百個學術(shù)和商業(yè)的實例展開寫作。樣本=總體、追求精確性和相關關系等大數(shù)據(jù)時代具體特點一一現(xiàn)出。在同時,作者也從個人、企業(yè)等多角度分析大數(shù)據(jù)中的隱憂。
書中內(nèi)容繁多,在此不能各方面概括。此書中雖有許多專有名詞,但作者以其通俗的語言以及許多實例讓我嗅到大數(shù)據(jù)時代中一抹清新之氣。
為什么是清新的呢?因為書中的內(nèi)容仿佛向我打開了一個既有點熟悉又有點陌生的世界。我們現(xiàn)在已處于網(wǎng)絡時代,在我們?nèi)粘:唵蔚牟僮髦写罅繑?shù)據(jù)產(chǎn)生,然而起初我們僅用眾多技術(shù)在解決手頭上的問題,那些大數(shù)據(jù)像沙子中的金子,價值不被發(fā)現(xiàn)。到目前,每當我們網(wǎng)上購書時總會看到“猜你喜歡”的欄目、出現(xiàn)谷歌搜索與流感預測、Farecast與飛機票價預測系統(tǒng)等,這些事情的達成全來自于那些曾被忽略的大數(shù)據(jù)同時也在證明“預測,大數(shù)據(jù)的核心”這句話,為我們的生活創(chuàng)造了前所未有的可量化的維度。看到書中這部分內(nèi)容時,我不禁感受到自己的生活已在享大數(shù)據(jù)帶來的福利,就像“猜你喜歡”欄目讓我觸到更多合我口味的書,讓我看到了以前無法發(fā)現(xiàn)的細節(jié)。擁有大量數(shù)據(jù)的公司巨頭如谷歌、亞馬遜大力開發(fā)有關大數(shù)據(jù)的新型產(chǎn)業(yè)和研究相關項目。借網(wǎng)絡時代的便利大數(shù)據(jù)成為了如今最有商業(yè)價值的事物,使一切可量化的趨勢也開始出現(xiàn)!氨举|(zhì)上世界是由信息構(gòu)成的”,面對這句話時,大數(shù)據(jù)時代仿佛就在眼前。
在感受驚嘆著大數(shù)據(jù)能為我們做到以往無法想象的事和它巨大的價值時,我認同大數(shù)據(jù)能極大優(yōu)化我們的生活,但又不禁為這時代感到擔憂。一旦大數(shù)據(jù)時代來臨,不僅我們的隱私可能不再是隱私,就如書中所言“我們時刻暴露在‘第三只眼’下:亞馬遜監(jiān)視著我們的購物習慣,谷歌監(jiān)視著我們的`購物習慣,而微博似乎什么都知道”,而且利用大數(shù)據(jù)我們可以預測許多事情并且十分高效,一旦人們依賴大數(shù)據(jù)極少運用人類自身的創(chuàng)新等能力被數(shù)據(jù)束縛住,世界只會淪落為一個極少活力的機械環(huán)境。而我認為最大的憂患,是大數(shù)據(jù)時代對人類自身思維、思想、信仰等精神領域的沖擊。如今我們都生活在數(shù)據(jù)中,大數(shù)據(jù)時代說不定在幾年后就會逐步來臨,這使我不禁發(fā)問:我們一直堅信著信仰著的究竟是什么?我覺得世界說變就變實在令我想不通這個問題。事情都有好壞,我也不知道自己是否杞人憂天。
于是我繼續(xù)去探索作者對這問題的思考!案蟮臄(shù)據(jù)在于人本身”,作者還說“我們是在創(chuàng)造更好的未來”,也說“在一個預測的時代里,人類的自由意志不可侵犯,這一點不可輕視。我們在使用大數(shù)據(jù)時,應當懷有謙恭之心,銘記人性之本”。人類學家克利福德吉爾茲曾說:“努力在可以應用、可以拓展的地方,應用它、拓展它;在不能應用、不能拓展的地方,就停下來!边@些話語仿佛是陽光,驅(qū)散我心中對大數(shù)據(jù)時代的擔憂以及內(nèi)心對其的恐懼。我認為,在堅守我們內(nèi)心和自由意志下,大數(shù)據(jù)才會造福我們?nèi)祟愂澜纾l(fā)揮出它背后對人溫暖的光芒。
面對時代的變革,我會為堅守內(nèi)心深處的自由意志而努力并“擁抱大數(shù)據(jù)”。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 11
我主要讀了第一部分和第三部分。
第一部分是大數(shù)據(jù)的思維變革,作者舍恩伯格提出了三個觀點,一是"不是隨機樣本,而是全體數(shù)據(jù)",二是"不是精確性,而是混雜性",三是"不是因果關系,而是相關關系",作者被譽為"大數(shù)據(jù)時代的預言家",拋出的觀點是擲地有聲的,下面我將談談我對這三點的理解。
對于一,我們必須承認我們以往做的處理抽樣數(shù)據(jù)得到結(jié)果的方法,是省時省力省錢的,而且判斷結(jié)果是相對高精準的,如人口普查這一案例,如果采用全體數(shù)據(jù)進行統(tǒng)計分析的話,工作難度是相當大的,最后的結(jié)果也不會很滿意,這是得不償失的。但是隨著數(shù)據(jù)處理技術(shù)的飛速發(fā)展,我們已經(jīng)具備了處理大量數(shù)據(jù)的能力,如果在數(shù)據(jù)分析過程中采用全體數(shù)據(jù),就能避免抽樣數(shù)據(jù)可能由于選取偏見帶來的非隨機性,處理全體數(shù)據(jù)也必將成為一種趨勢。用在國防生管理工作中,就是管理層要對每個個體都給予充分的關心與互動,對于優(yōu)秀的固然要偏愛,但是對于較差的也要保持"不拋棄不放棄"的態(tài)度,讓每一個個體都找到自己的定位與價值。
對于二,作者強調(diào)通過掌握更多的數(shù)據(jù),暫時犧牲精確性,關注更多容易被忽略的細節(jié),來做更多的事,得到更多的結(jié)果,也就是說我們要有一定的.包容錯誤的能力。我們在收集數(shù)據(jù)時,要主動獲取更多的數(shù)據(jù),少加一些限制性條件,然后應用我們處理大數(shù)據(jù)的能力,或許會獲得意想不到的結(jié)果。作者舉了一個谷歌翻譯系統(tǒng)的例子,通過英語作為中轉(zhuǎn),進行各語言之間的轉(zhuǎn)換。此處的啟發(fā)就是用我們最擅長的途徑,不拘泥于特定規(guī)則,來達到我們的目的,也就是說我們要先認清自己,不去刻意的模仿,找出最適合自己的一套方法。
對于三,作者指出知道"是什么"就夠了,沒必要知道"為什么",乍一看這個觀點覺得有點無腦,但是結(jié)合第二點就合理了,降低對精確性及原因結(jié)果的要求,通過對相關數(shù)據(jù)的廣泛分析,進而得到更豐富更多元的結(jié)果。如購物時,系統(tǒng)的購物推薦,并不是肯定你會購買,僅僅是你感興趣進而可能會買就足夠了。其實作者對"相關關系"的強調(diào),主要是大數(shù)據(jù)強大的預測能力,而且這種預測性能還是相當精確的。以上只是我用作者的觀點佐證他自己的觀點,證明其一定的合理性,但是我是不完全認同的,在航天領域,我們對成功率的要求是極高的,尤其是載人航天領域,我們必須做到萬無一失,我們對每一個結(jié)果都會深究其根,找出原因。對于國防生體能成績的分析也是如此,結(jié)果只是我們的一個評價機制,而最重要的還是產(chǎn)生這一結(jié)果的原因及過程。
第三部分是大數(shù)據(jù)的管理變革,本來以為作者會講點如何通過大數(shù)據(jù)來改革管理機制和提高管理效率,沒想到作者只是講了大數(shù)據(jù)其實就是我們的隱私的暴露,提出了要讓數(shù)據(jù)采集管理公司對數(shù)據(jù)的使用負起責任的解決途徑。個人感覺,一是我們在平時要意識到個人隱私的保護,而是相關法律政策的完善,真正的讓大數(shù)據(jù)服務我們的工作生活,而不是一種變相的威脅。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 12
信息時代的到來,我們感受到的是技術(shù)變化日新月異,隨之而來的是生活方式的轉(zhuǎn)變我們這樣評論著的信息時代已經(jīng)變?yōu)樵?jīng)。如今,大數(shù)據(jù)時代成為炙手可熱的話題。筆者在這說明信息和數(shù)據(jù),只是試圖首先說明信息、數(shù)據(jù)的關系和不同,也試圖說明,為什么信息時代轉(zhuǎn)變?yōu)榱舜髷?shù)據(jù)時代?大數(shù)據(jù)時代帶給了我們什么?
信息和數(shù)據(jù)的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發(fā)展中的動態(tài)范疇,是進行互相交換的內(nèi)容和名稱,信息的界定沒有統(tǒng)一的定義,但是信息具備客觀、動態(tài)、傳遞、共享、經(jīng)濟等特性卻是大家的共識。數(shù)據(jù):或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關于事件之一組離散且客觀的事實描述,是構(gòu)成信息和知識的原始材料。數(shù)據(jù)可分為模擬數(shù)據(jù)和數(shù)字數(shù)據(jù)兩大類。數(shù)據(jù)指計算機加工的“原料”,如圖形、聲音、文字、數(shù)、字符和符號等。從定義看來,數(shù)據(jù)是原始的`處女地,需要耕耘。信息則是已經(jīng)處理過的可以傳播的資訊。信息時代依賴于數(shù)據(jù)的爆發(fā),只是當數(shù)據(jù)爆發(fā)到無法駕馭的狀態(tài),大數(shù)據(jù)時代應運而生。這是否是《大數(shù)據(jù)時代》一書所未曾闡述的背景材料?
在《大數(shù)據(jù)時代》一書中,大數(shù)據(jù)時代與小數(shù)據(jù)時代的區(qū)別:
1、思維慣例。大數(shù)據(jù)時代區(qū)別與轉(zhuǎn)變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉。
2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動過去來預測未來。筆者認為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關,而與數(shù)據(jù)的解讀者有關,而相關關系更有利于預測未來。
3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實齊頭并進,理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進行驗證。
4、分析基礎。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認為,小數(shù)據(jù)時代也即是信息時代,是大數(shù)據(jù)時代的前提,大數(shù)據(jù)時代是升華和進化,本質(zhì)是相輔相成,而并非相離互斥。
數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)?蛻魯(shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機遇和挑戰(zhàn)也隨之而來,適應變革,適者生存。我們可以有更廣闊的業(yè)務發(fā)展空間、可以有更精準的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實現(xiàn)“數(shù)據(jù)應用”才能擁抱“大數(shù)據(jù)”時代,從數(shù)據(jù)中攫取價值,笑看風云變換,穩(wěn)健贏取未來。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 13
讀了涂子沛先生的《大數(shù)據(jù)時代》(這是一本社科類書籍,想深入研究大數(shù)據(jù)原理的可以選擇其他技術(shù)類專業(yè)書籍)。作者以美國為例,講述了“數(shù)據(jù)不僅可以治國,還可以強國”的觀點,對中國今后的大數(shù)據(jù)發(fā)展戰(zhàn)略提出了建議。讀完之后,主要有一下幾點感想。
一、美國社會之所以發(fā)達高效,引領世界科技的發(fā)展,與其尊重數(shù)據(jù),收集數(shù)據(jù)的傳統(tǒng)是分不開的。數(shù)據(jù)被視為科學的度量、知識的來源。沒有數(shù)據(jù),無論是學術(shù)研究,還是政策制定,都寸步難行!皵(shù)據(jù)驅(qū)動決策方法”使得政府更有效率、更加開放、更加負責。
數(shù)據(jù)的積累需要時間,不能一蹴而就,美國在數(shù)據(jù)的收集方面歷史悠久。美國聯(lián)邦政府的取得數(shù)據(jù)主要有三個來源:業(yè)務管理的數(shù)據(jù),民意社情數(shù)據(jù),物理環(huán)境數(shù)據(jù)。例如1940年羅斯福引進的民意調(diào)查、1962年啟動的海浪監(jiān)測計劃和1973年誕生的最小數(shù)據(jù)集。而中國取得類似的進步,是進入21世紀之后才發(fā)生的事情。2003年,中國開始著手制定醫(yī)療系統(tǒng)的最小數(shù)據(jù)集,創(chuàng)立了第一個全國性的大型社會調(diào)查項目,開始對社會的發(fā)展和變遷進行全方位、綜合性、縱貫性的問卷訪談調(diào)查。2006年中國衛(wèi)生部才出臺了最小數(shù)據(jù)集的標準。幾經(jīng)周折,國家統(tǒng)計局才在2006年9月成立了社情民意調(diào)查中心。
中國的落后,根源之一是缺乏以數(shù)據(jù)為基礎的精確管理,未來中國的進步,需要面對收集數(shù)據(jù)、使用數(shù)據(jù)、開放數(shù)據(jù)的挑戰(zhàn)。
二、大數(shù)據(jù)是一柄雙刃劍,數(shù)據(jù)雖然可以造福于民,但是也可能成為控制人民的工具。2013年的“棱鏡門”事件揭露了政府對于人民的監(jiān)控,引起軒然大波。在未來,每個人都可能存在一份數(shù)據(jù)檔案,包括一個人的教育、醫(yī)療、福利、犯罪和納稅等等一切從搖籃到墳墓的數(shù)據(jù)記錄,甚至包括電話、郵件等都可能被監(jiān)聽和記錄。通過數(shù)據(jù)整合和信息加總,就可以再現(xiàn)一個人生活的軌跡和全景,各個系統(tǒng)之間的數(shù)據(jù)可以彼此印證、互相解釋,個人隱私就無所遁形。英國作家喬治。奧威爾在其諷刺小說《一九八四》中描述了時刻被“老大哥”監(jiān)視的零隱私的可怕情形:不論是睡著還是醒著,在工作還是在吃飯,在室內(nèi)還是在戶外,早浴盆里還是在床上,沒有躲避的地方。除了你腦殼里幾個立方厘米以外,沒有東西是屬于你自己的。
隨著大數(shù)據(jù)科技的發(fā)展,我們的一舉一動,每一通話,每一次上網(wǎng)記錄都被監(jiān)控、記錄,分析,當這些數(shù)據(jù)被某一個人或組織掌握,將會是對我們隱私的莫大威脅,因此,對于數(shù)據(jù)使用的監(jiān)管需要進一步的立法進行規(guī)范,我國目前對于數(shù)據(jù)的收集、利用處于野蠻生長階段,任何商業(yè)組織都可以收集和分析用戶的信息。政府需要立法對技術(shù)的'使用進行監(jiān)管,保障公民的安全。
三、數(shù)據(jù)是一種公共資源,政府使用納稅人的錢收集了數(shù)據(jù)信息之后,需要將數(shù)據(jù)進行公開,這樣既可以集中大眾的智慧,利用數(shù)據(jù)科學地治理社會;也可以讓大眾對政府的行為進行監(jiān)督,避免政府的腐敗。因為缺乏競爭,官僚體制與生俱來有一種僵化保守的本性,政府機關也往往固守不前。很多數(shù)據(jù)都被以機密為借口封存起來,人民就無從得知政府的各項舉措是否合理,因此在黑暗中就滋生了腐敗。
而且,現(xiàn)代社會中,掌握信息多的人,在社會競爭中處于有利的地位,而信息貧乏的人,則處于不利地位,數(shù)據(jù)不應該被少數(shù)人壟斷,應該作為一種公共資源被普通百姓獲取。
四、技術(shù)的進步離不開科學技術(shù)人員的不懈努力,知識分子應該承擔促進社會進步的責任和使命。正如Linux的開發(fā)者所說的:“一個人做事的動機,可以分為三類:一是求生,二是社會生活,三是娛樂。當我們的動機上升到一個更高階段時,我們才會取得進步:不是僅僅為了求生,更是為了改變社會,更理想的是——為了興趣和快樂。
維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感 14
維基百科說大數(shù)據(jù)由巨型數(shù)據(jù)集組成,這些數(shù)據(jù)集大小常超出常用軟件在可接受時間下的收集、利用、管理和處理能力,或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,大數(shù)據(jù)的常見特點是3V:Volume、Velocity、Variety。
規(guī)模巨大的數(shù)據(jù)未必是大數(shù)據(jù),需滿足她的三個特點。以研究擲硬幣概率的實驗為例,當傳統(tǒng)實驗次數(shù)達到一定規(guī)模后就能幫助實驗者分析正反面出現(xiàn)的概率,隨著實驗次數(shù)的增加,數(shù)據(jù)大量積累可能越來越支持這一結(jié)論,數(shù)據(jù)達到一定量,它的邊際效應就出現(xiàn)了,數(shù)據(jù)繼續(xù)增加對分析概率還有多少意義呢?按照現(xiàn)代概率學伯努利試驗去帶入函數(shù)計算就好了,這僅算是概率學或者是統(tǒng)計學吧。故大數(shù)據(jù)不是因為單純體積大而大,是因為雜而大,研究硬幣正反面的概率如引入天文學、心理學、材料學、物理學等領域的數(shù)據(jù)而使之變大,進而研究關聯(lián)關系(或因果關系,注:本書不認同因果關系的重要性),從而得出概率的分布,然而大量相關數(shù)據(jù)的引入,按照傳統(tǒng)分析過程的時間是不可接受的,需利用高效計算資源,迅速把雜而大的處理結(jié)果呈現(xiàn)出來,并且實驗者對結(jié)果的預期不能要求100%的`精確。大數(shù)據(jù)并不是數(shù)據(jù)本身,而是一種思維方式。
大數(shù)據(jù)令人著迷的地方在于用"科學"的辦法挑戰(zhàn)了"預測學",幫助人們發(fā)現(xiàn)未知,幫忙人們進行決策。然而本書作者Viktor Mayer—Schonberger強調(diào)"大數(shù)據(jù)不是因果關系,而是相關關系,相關關系比因果關系更重要",此觀點不能認同,因果關系是宇宙的基本定律,且不說種瓜得瓜、善有善報之類哲學命題,若商家在發(fā)現(xiàn)電容器、釘子、高壓鍋有關聯(lián)購買關系而去做大量營銷的話豈不是有可能發(fā)生更多的波士頓爆炸案。
①關聯(lián)關系在大數(shù)據(jù)中被提取出來使用,而不去關心因果關系是一種粗暴的、倒退的處理方式,是作者理解的現(xiàn)代社會浮躁的心里體現(xiàn)。我認為的大數(shù)據(jù)應該是把看起來不相干的數(shù)據(jù)放到一起分析,找到某些跨領域的關聯(lián)關系,進而推論因果關系,發(fā)現(xiàn)其中價值。作者引用了安德森的觀點"現(xiàn)在已經(jīng)是一個有海量數(shù)據(jù)的時代,應用數(shù)學已經(jīng)取代了其他的所有學科工具,而且只要數(shù)據(jù)足夠,就能說明問題",數(shù)據(jù)和所有科學的關系,我覺得有點像現(xiàn)在互聯(lián)網(wǎng)和其他所有行業(yè)的關系一樣,互聯(lián)網(wǎng)終究還是一個工具。作者舉了沃爾瑪"尿布與啤酒"。
③的故事,這也是大家熟知的一個數(shù)據(jù)分析的故事,但是沃爾瑪真的是這么做的嗎?大家可以去沃爾瑪?shù)臅r候留意一下。一家大型的超市,如果為了這種所謂相關關系,所有商品用這種關聯(lián)關系去擺放,天哪,這將是一家多么混亂的超市,顧客進去將難以區(qū)分食品在哪、生活用品在哪!有人可能說這種關聯(lián)關系更適合電子商務,是的,但是我還是比較看好已知原因的關聯(lián)關系,比如嬰幼兒智力玩具和孕婦減肥放到一起,比如在線播放器旁邊放衛(wèi)生紙的廣告(哈哈哈,你懂的)。本書用美國折扣零售店塔吉特與懷孕預測。
、趤碜糇C他的觀點,但恰恰是知道因果關系后商業(yè)價值才能更多的體現(xiàn)出來,未知因果關系前顧客的父親生氣并要求賠償,知道因果關系后才使得這種廣告理所應當并讓客戶接受。
互聯(lián)網(wǎng)信息時代數(shù)據(jù)的積累以及BI、數(shù)據(jù)倉庫、人工智能、HADOOP、NOSQL等技術(shù)的流行,使得人們考慮問題的方式已經(jīng)發(fā)生變化,接下來我們要做的只有接受擁抱數(shù)據(jù)時代、大數(shù)據(jù)時代。軟件行業(yè)程序上線的變更差錯率是一個考核IT水平的指標,為此很多公司引進了CMMI體系,以求他保障軟件的質(zhì)量,為此也收集了大量的過程數(shù)據(jù)。若用數(shù)據(jù)的思維,是否可能根據(jù)之前的各種相關數(shù)據(jù)預測下次投產(chǎn)變更的成功率?若用大數(shù)據(jù)的思維,是否可以根據(jù)CMMI數(shù)據(jù)以及程序員開發(fā)期間上下班考勤數(shù)據(jù)、工資發(fā)放時間、上線當天天氣情況來綜合預測投產(chǎn)變更的成功率?用大數(shù)據(jù)的思維,訂餐網(wǎng)站不僅根據(jù)之前你定的是咸的還是辣的來給你推薦菜單,可能因為你微博上發(fā)了一句"每個月總有那么幾天"修改了訂餐的推薦菜單(哈哈)!故在數(shù)據(jù)時代,提議童鞋們檢查公司的信息系統(tǒng),是否有定期刪除"垃圾"日志、數(shù)據(jù)的機制(Viktor說,即使最平凡的信息業(yè)可以具有特殊的價值),為了日益廉價的存儲而刪除日益昂貴的數(shù)據(jù),請三思后行吧。
【維克托邁爾舍恩伯格《大數(shù)據(jù)時代》讀后感】相關文章:
亨舍爾和格萊特的童話故事07-16
埃格伯特10-15
飛來伢與女巫德博恩格09-16
關于扎克伯格的經(jīng)典語錄70句09-07
說大話的維克托閱讀訓練12-26
艾爾和肖恩勇闖賽爾號第十三集09-23
艾爾和肖恩勇闖賽爾號第七集12-03
艾爾和肖恩勇闖賽爾號第八集07-20
艾爾和肖恩勇闖賽爾號第四集10-04
艾爾和肖恩勇闖賽爾號第十集09-20