前言:本站為你精心整理了大數(shù)據(jù)與統(tǒng)計(jì)學(xué)協(xié)同發(fā)展的思考分析范文,希望能為你的創(chuàng)作提供參考價(jià)值,我們的客服老師可以幫助你提供個(gè)性化的參考范文,歡迎咨詢。
摘要:海量的數(shù)據(jù)已經(jīng)滲透了每個(gè)人的生活,以數(shù)據(jù)為研究對(duì)象的統(tǒng)計(jì)學(xué)應(yīng)該以科學(xué)的態(tài)度迎接大數(shù)據(jù)浪潮,并積極思考如何把握這重要的發(fā)展機(jī)會(huì)。本文首先闡明大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的密切關(guān)系,再從大數(shù)據(jù)時(shí)代下的非結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)、相關(guān)關(guān)系與因果關(guān)系,這兩個(gè)方面思考大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的協(xié)同發(fā)展。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代;大數(shù)據(jù);統(tǒng)計(jì)學(xué);
一、大數(shù)據(jù)與統(tǒng)計(jì)學(xué)
(一)大數(shù)據(jù)與統(tǒng)計(jì)學(xué)關(guān)系密切
簡(jiǎn)單來說,我們可以分為兩個(gè)方面來理解大數(shù)據(jù):若“大數(shù)據(jù)”作為形容詞,則描述的是大數(shù)據(jù)時(shí)代數(shù)據(jù)的特點(diǎn);若“大數(shù)據(jù)”作為名詞,則體現(xiàn)的是數(shù)據(jù)科學(xué)研究的對(duì)象。對(duì)大數(shù)據(jù)的定義有非常多,不同領(lǐng)域不同專業(yè)對(duì)大數(shù)據(jù)的界定都會(huì)有些許不同。通俗地說:大數(shù)據(jù)是目前人類所有可抓取、可記錄、可存儲(chǔ)的信號(hào)集合。這個(gè)包含了一切信號(hào)的集合將非常非常之龐大、多樣、繁雜,并且還在不停地、迅速地增加。現(xiàn)代互聯(lián)網(wǎng)和信息技術(shù)的飛速發(fā)展,使得人類開始有能力收集、儲(chǔ)存、分析、處理這些從前無能為力的數(shù)據(jù),從中挖掘出有用的信息促進(jìn)社會(huì)的發(fā)展。邁爾•舍恩伯格說:大數(shù)據(jù)發(fā)展的核心動(dòng)力就是人類測(cè)量、記錄和分析世界的渴望。而統(tǒng)計(jì)學(xué)正好是收集、整理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。由此可見大數(shù)據(jù)與統(tǒng)計(jì)學(xué)關(guān)系密切,將大數(shù)據(jù)與統(tǒng)計(jì)學(xué)結(jié)合發(fā)展?jié)摿o窮。
(二)大數(shù)據(jù)時(shí)代下的非結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)需整合
對(duì)接統(tǒng)計(jì)研究可根據(jù)自身的目的收集總體數(shù)據(jù)或樣本數(shù)據(jù),但如果總體太過龐大,以過去的技術(shù)方法來收集總體數(shù)據(jù)成本會(huì)很高,受于限制統(tǒng)計(jì)研究更多收集得是樣本數(shù)據(jù)。如今,人類已經(jīng)開始能夠在合適的成本下獲得大數(shù)據(jù),大數(shù)據(jù)的廣博給統(tǒng)計(jì)研究帶來了新的發(fā)展方向。我們需要著重研究的一個(gè)方向就是如何將結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)對(duì)接。大數(shù)據(jù)的核心是數(shù)據(jù),統(tǒng)計(jì)學(xué)的研究對(duì)象也是數(shù)據(jù),但是它們獲得的數(shù)據(jù)性質(zhì)有所不同:大數(shù)據(jù)收集的多是半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),通俗地理解,先獲得數(shù)據(jù),再整理結(jié)構(gòu)(如聲音、圖片、視頻等信息);傳統(tǒng)統(tǒng)計(jì)學(xué)收集則主要是結(jié)構(gòu)化數(shù)據(jù),先定好結(jié)構(gòu),再根據(jù)目標(biāo)結(jié)構(gòu)收集數(shù)據(jù)(如數(shù)字、符號(hào)等信息)。拿非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)來說:大數(shù)據(jù)時(shí)代使得我們有更多可以分析利用的數(shù)據(jù),使得統(tǒng)計(jì)研究不僅可以在有更多的結(jié)構(gòu)化數(shù)據(jù)的情形下進(jìn)行;對(duì)于一些領(lǐng)域的研究工作還可以設(shè)法將非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化的數(shù)據(jù)結(jié)合起來分析。如何實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)的結(jié)合?首先,完善非結(jié)構(gòu)化數(shù)據(jù)的整合,然后我們可以用結(jié)構(gòu)化數(shù)據(jù)做數(shù)量說明,非結(jié)構(gòu)化數(shù)據(jù)加強(qiáng)描述;或是提高數(shù)據(jù)處理技術(shù),實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)的互相轉(zhuǎn)化,選擇能更好說明問題的數(shù)據(jù)形式作為后續(xù)分析基礎(chǔ)。這都是值得再深入思考研究的新問題,而且這不僅僅是大數(shù)據(jù)和統(tǒng)計(jì)研究的事,同時(shí)需要計(jì)算機(jī)技術(shù)的一同創(chuàng)新發(fā)展。統(tǒng)計(jì)研究的范圍在大數(shù)據(jù)時(shí)代越來越大,能用數(shù)據(jù)說明的問題越來越多。
(三)大數(shù)據(jù)時(shí)代下的相關(guān)分析與因果分析發(fā)展并重
《大數(shù)據(jù)時(shí)代》一書中表示:大數(shù)據(jù)時(shí)代的一個(gè)顯著變化是:相關(guān)分析比因果分析更重要。我的看法是:大數(shù)據(jù)時(shí)代下,市場(chǎng)確實(shí)會(huì)對(duì)相關(guān)分析有著更強(qiáng)的關(guān)注度,但這并不意味著因果分析的重要性會(huì)有褪色。統(tǒng)計(jì)學(xué)中既有相關(guān)分析,也有因果分析,要對(duì)它們有合理的了解,首先需要明確的是相關(guān)關(guān)系和因果關(guān)系之間的聯(lián)系,簡(jiǎn)單說:有相關(guān)關(guān)系不一定有因果關(guān)系,有因果關(guān)系則一定有相關(guān)關(guān)系。大數(shù)據(jù)時(shí)代,相關(guān)關(guān)系變得比以前更加為人所關(guān)注的原因:一方面,在很多領(lǐng)域的應(yīng)用里,相關(guān)分析比因果分析更簡(jiǎn)單可行;另一方面,因?yàn)橄嚓P(guān)關(guān)系足以體現(xiàn)事物之間的一定聯(lián)系,在商業(yè)效益上更為經(jīng)濟(jì)有效。因此在商業(yè)利潤(rùn)的推動(dòng)下,相關(guān)關(guān)系也會(huì)更加受到青睞。但是我們不能就此否定因果關(guān)系的重要性,因果關(guān)系是對(duì)數(shù)據(jù)更加深度地分析:相關(guān)關(guān)系讓我們知道了“是什么”,因果關(guān)系是讓我們知道了“為什么”。倘若只是在商業(yè)經(jīng)濟(jì)上的利用和成本考慮,“是什么”在很多時(shí)候就以足夠;但如果是在科學(xué)研究領(lǐng)域,“知其然而不知其所以然”就遠(yuǎn)遠(yuǎn)不夠了。結(jié)合現(xiàn)實(shí)發(fā)展需要,可在分析確定相關(guān)關(guān)系后,根據(jù)情況研究因果關(guān)系,若能夠得出因果關(guān)系,那肯定是更具價(jià)值和意義的。探求“為什么”始終是人類探索世界的動(dòng)力,因果分析是人類永恒的使命。
二、結(jié)語
大數(shù)據(jù)時(shí)代的到來幾乎對(duì)每個(gè)領(lǐng)域都有著不可忽視的影響。大數(shù)據(jù)與統(tǒng)計(jì)學(xué)關(guān)系密切,大數(shù)據(jù)的出現(xiàn)對(duì)統(tǒng)計(jì)學(xué)的意義是非凡的,我們應(yīng)把握住大數(shù)據(jù)時(shí)代和統(tǒng)計(jì)學(xué)的可結(jié)合點(diǎn)。其一,完善非結(jié)構(gòu)化數(shù)據(jù)的整合,深入研究如何實(shí)現(xiàn)非現(xiàn)結(jié)構(gòu)化與結(jié)構(gòu)化數(shù)據(jù)的對(duì)接,都需要我們思維上的創(chuàng)新、數(shù)據(jù)處理技術(shù)上的提高。其二,在注重相關(guān)分析的同時(shí),不能丟掉對(duì)因果分析的研究,應(yīng)合理并重,實(shí)現(xiàn)大數(shù)據(jù)的進(jìn)一步利用,真正挖掘出數(shù)據(jù)的價(jià)值。對(duì)于以數(shù)據(jù)為研究對(duì)象的統(tǒng)計(jì)學(xué)科,大數(shù)據(jù)時(shí)代就是統(tǒng)計(jì)學(xué)變革創(chuàng)新的時(shí)代,統(tǒng)計(jì)研究工作人員也應(yīng)把握機(jī)會(huì)思考創(chuàng)新,為統(tǒng)計(jì)學(xué)增添新的生命力。
參考文獻(xiàn):
[1]朱建平,張悅涵.大數(shù)據(jù)時(shí)代對(duì)傳統(tǒng)統(tǒng)計(jì)學(xué)變革的思考[J].統(tǒng)計(jì)研究,2016(02):3-9.
[2]朱建平,章貴軍,劉曉葳.大數(shù)據(jù)時(shí)代下數(shù)據(jù)分析理念的辨析[J].統(tǒng)計(jì)研究,2014(02):10-19.
[3]ViktorMayer-Sch-nberger,KennethCukier.盛楊燕等譯.大數(shù)據(jù)時(shí)代[M].杭州:浙江人民出版社,2013
作者:張?zhí)焓?單位:廣州工商學(xué)院
數(shù)據(jù)報(bào)告 數(shù)據(jù)采集論文 數(shù)據(jù)安全論文 數(shù)據(jù)采集 數(shù)據(jù)挖掘總結(jié) 數(shù)據(jù)安全 數(shù)據(jù)統(tǒng)計(jì)論文 數(shù)據(jù)挖掘 數(shù)據(jù)理論論文 數(shù)據(jù)通信論文 紀(jì)律教育問題 新時(shí)代教育價(jià)值觀