前言:本站為你精心整理了時代背景下大數據和統計學分析范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
摘要:隨著信息技術的飛速發展,大數據已成為當今時代的背景與代名詞。對于大數據的發展與應用,不僅影響著這個世界,還改變著人們的生活。統計學,作為一種學科,同時也作為一種科學,在社會的發展進步中發揮著不可替代的作用。它不僅可以實現對數據的搜索與整理,而且還能對數據進行分析和歸類,從而完成對特定事物的預測與判斷,以此了解和分析相關事件的特點,論證事物發展的歸因。特別是在近些年,統計學的應用更為廣泛,甚至可以對未來的社會發展形勢,以及個別領域的發展趨勢進行精準的預測與計算。
關鍵詞:大數據;統計學;數據科學;重心遷移
一、引言
在當多數人認為,因為大數據技術的出現,導致統計學專業,乃至于統計學領域都遭受到了較大的沖擊。其實,這種認識是片面的,也是錯誤的。時代的發展進步也是科學技術的發展與進步,同時也是不斷開拓與進去的過程。所以,新科技、新技術會隨著時代的發展而被應用到當今的社會環境中。在此基礎上,傳統模式下的統計學科學與新興領域中的大數據技術便實現了高效的有機結合,并且在兩者有機結合的基礎上實現了融合發展與創新的模式,進而開拓出了一個全新的局面與發展空間。同時,兩者之間也在相互競爭的態勢下不斷提升自身的作用,完善自身的優勢,從而實現了兩種技術應用的平衡發展。
二、尋找發展機會,迎接未來挑戰
不論任何行業,在面臨機會的同時也是在面對更大的挑戰。大數據的發展與建設同樣需要從兩個角度對其進行分析。在這一基礎下,才可以真是的反映出大數據技術和統計學科學兩者之間的關系。大數據技術,本質是一種數據科學計算技術。其涵蓋了經濟、交通、文化、醫療、教育與商業等各個領域。而且在任意領域中都體現出了完全不同的應用方式與應用價值,且都具有高度的復雜性與獨立性。所以,當今我們所面臨的主要問題并非“大數據與統計學誰更強、用誰更好”,而是應該考慮“如何利用大數據來解決社會各個領域的實際問題;以及能否在應用大數據的過程中融合統計學科學對其進行深度分析;或者能否在兩者有機結合的基礎上實現數據的絕對安全,及數據的高效管理與控制該如何實施等?!边@是當前需要重點思考的問題,也是當今相關學者研究的重點范圍。
三、大數據的應用狀況分析
(一)基于互聯網基礎發展而來的應用技術
部分人認為,在當前社會中,大數據對社會經濟的發展、人們的生活、工業的建設等覆蓋是非常全面的。顯然,這一想法并不成熟,至少在現階段是不健全的。就目前來說,大數據無法實現對社會環境的全部覆蓋,而是在不斷覆蓋的發展過程中。在大數據的覆蓋范圍之外,以及在互聯網的應用范圍之外,依然有很多我們無法通過信息技術對其進行有效控制的領域。就如,我們可以將以太網作為已經被大數據覆蓋的領域與范疇,然后,將“暗網”或者“深度網絡”作為未被大數據覆蓋的領域與范疇。此時,便可以發現,未被覆蓋的領域依然非常龐大。
(二)著眼于覆蓋范圍以外的可發展領域
大數據的覆蓋可以為我們人類的生活帶來很多便捷,且可以為社會的科學發展、經濟建設以及文化傳承等提供強大的動力。但是,我們卻無法保證大數據在任何環境和任何領域中都能夠為我們提供相應的服務。所以,大數據的覆蓋范圍以及應用空間雖然很大,但是其覆蓋面積與覆蓋率還是受到了較大的限制。該情況類似于通訊信號,一個信號基站周圍若有阻斷,便無法實現通訊的有效聯通。因此,現階段的大數據發展與應用更加注重于對未被覆蓋的區域進行縱深發展與延伸。這樣,可以讓大數據技術的應用領域更加廣泛,且可以讓大數據惠及到更多的人,為其提供相應的服務于幫助。同時,在這一發展背景下,大數據可以實現更多區域的緊密連接,進而構建一個整體的數據應用體系,為將來的社會發展和進步提供相應的幫助與高效服務。同時,我們必須要借助統計學科學對其進行全面的創新與設計,以此來實現兩者之間的有效配合。
(三)大數據與統計學的融合發展
我們在分析大數據技術與統計學技術的應用方法時候,一般會偏向于“哪一種更好,哪一種更精確,哪一種更有利”的模式對其進行分析與研究。在此,對于大數據和統計學的思考需要從兩者之間的融合發展模式中出發,并分期兩種應用技術在實現融合之后所體現的特征與優勢。這一課題展開研究與探索。統計學科學有著大數據無法模擬與實現的人工應用技術和處理方法,但是大數據可以從根本上提高計算與分析的速度,且可以用來精確計算與分析其具體值,還可以在宏觀條件下反映精確結果。所以,兩者之間不存在優越性的比較或者代替作用。如果將兩者看做是一個相互融合的體系,那么,大數據技術與統計學科學便呈現出了一種同步發展與應用的積極狀態。
四、統計學和數據科學
(一)統計學和數據科學的關系
介于當前部分人員將統計學和數據科學混為一談,在此筆者要對其提出質疑,而且筆者負責的指出,統計學和數據科學是兩個個體,并非是一個整體。如果非要做出一個從屬關系之分,那么,筆者寧愿將統計學看作是數據科學中的一個“分支”。嚴格意義上講,可以把統計學作為一種“邁向數據科學”基礎的路徑與方法來應用。通過該方法,不僅可以明確什么是“統計測度”,還能搞清楚測度的顯示形式,以及測度的具體方法和測度的計量方式,甚至可以定義出測度的具體維度與數據變化特征。由此可見,數據科學是統計學的發展基礎,不論是從統計學來分析,還是從統計學的日常研究對象來判斷,或者是從“統計的主題”做研究,都可以反映這一事實。
(二)科學關系的三個方面
第一個方面是大數據與統計學的問題提出;第二個方面是大數據與統計學的數據分析;第三個方面是大數據與統計學的方法應用?;谶@三個方面,以一則案例進行分析:多年前,皮爾遜做過一個“父母酗酒對后代危害”的統計研究。最終研究結果得出:父母酗酒與后代的身高、智力、身體健康狀況沒有任何可直接表述的關聯。但是卻遭到了社會各界的抵觸與反對,認為皮爾遜的統計結論太過于片面,而且認為“在統計過程中應用600戶家庭,完全不注意代表全世界的人口”。如果將之放在今天來看,就是一個反應問題提出方法與數據分析方式以及方法應用措施的綜合表現形式。眾人皆知,導致后代身心發展問題的因素有很多,即便酗酒是一個噱頭,如果體現在統計學的范疇中,其務必要有廣域的數據分析,以及大量的數據研究才能得出最終結果。所以,若應用今天的大數據技術和統計學科學再對其進行一次分析與研究,相信可靠性會高出很多。
(三)科學的四個應用領域
在大數據應用技術與統計學應用技術實現融合發展滯后,對于社會的分析與研究需要從四個科學領域入手分析,第一是社會精神科學應用環境、第二是社會物質科學應用環境、第三是社會心理科學應用環境、第四是社會物理科學應用環境?;谶@四個方面,可全面的反映出統計學是實現數據科學發展與應用的主要路徑。而且,基于這四個方面進行統計研究,開展統計工作,組織統計運算,可以將社會中的各種事物最大限度的結合在一起,進而通過統計學應用技術對其進行研究與分析。
五、統計重心在大數據時代背景下的遷移
(一)總體模式下的樣本數據發展
扎克伯格說:“給我全世界所有的數據,我可以改變世界的面貌。”從表面上理解,這是一句完全符合大數據技術和統計學科學的觀點。但是,如果對其進行深度分析則會發現這一說法對于大數據的解釋并不全面。在這句話中,就體現出了數據的樣本與數據的總體這一概念。因為沒有任何方法可以對全世界的數據進行總結,而且社會在不斷發展,數據只是一種對社會發展態勢的儲存與記錄方法,其反應的內容具有時效性,但是卻無法對其進行長遠發展的分析與應用。因此,想要應用現階段的大數據改變整個世界的發展模式,可謂是無稽之談。由此可見,在大數據技術的支撐背景下,以及統計學科學的研究過程中,都無法將數據看作是一個總體,而是只能在既定的范圍內對其做出相應的分析與考量才能反映社會總體模式中的樣本數據應用效果。
(二)關于數據識別的問題
數據識別能力對于大數據技術的構建與仿真具有很大的影響,甚至關系到了大數據分析的準確性與可用性。因此,在對數據識別的問題進行分析與研究的過程中,務必要結合相應的“產品或工具”,以及服務的范疇,受眾群體等進行整體的完善與優化,以此來滿足大多數人,對需要被覆蓋的領域進行全面的覆蓋。
(三)關于數據獨裁的控制與防范
數據獨裁,就是數據對人的控制,并且以此來統治人的行為。這一現象的主要危害在于,人很容易被經過嚴密分析的數據結果所迷惑,而且會將之認為是一種絕對科學的結果。這是一種過于依賴數據的現象,也是一種偽科學行為。為防止這一狀況,務必要清新頭腦,明白數據的使用方法與使用價值和使用場合,在此,以一實際案例作為佐證。例如:越戰美軍總指揮麥克納馬拉,將越戰的細節利用數據的形式體現了出來,且認為美國必然勝利。最后,卻被越軍深誘到沼澤地帶難以脫身。歸根結底,就是他太過于迷信數據,反而忽視了其他可能干預到戰爭局勢變化的因素。
六、結束語
由此可見,統計學可統計的領域正在不斷的擴張與延續。大數據作為一種類似于統計學的技術,其應用功能和使用方法更為便捷,且在兩者的融合狀態下,可以完成更復雜的數據統計與分析內容。所以,在大數據技術與統計學科學的融合過程中,也是一個相互融合的過程。在這一狀態下,可體現出更大的價值與作用。
參考文獻
[1]馬會寧.大數據驅動的云計算平臺及其在統計學中的應用分析[J].中國集體經濟,2019(36):97-98.
[2]徐藝歌.淺談基于大數據背景下的統計學的應用[J].中國新通信,2019,21(22):108-109.
作者:何媛媛 單位:青島市城陽區工業和信息化局