前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇醫學統計范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
在醫學論文寫作中,醫學統計學方法應用是必不可少的,正確使用能保證科研工作順利進行,并使科研成果更具有科學性、代表性和可靠性。反之,如果使用不當或者誤用,會直接影響研究結果的質量,反而會使讀者產生誤解,甚至有時會導致錯誤的結論。近年來,醫學統計學方法在醫學科研中的應用越來越受到國內廣大醫學科研工作者的重視,統計分析結果表達已成為醫學論文中一個不可缺少的重要組成部分。醫學統計學是評價醫學科技論文質量優劣的重要依據,然而從近年發表的論文來看,有不少作者對統計方法的使用還不熟悉,實際應用中統計方法濫用、錯用和誤用的情況時有發生[1]。據國外20世紀60年代到80年代對不同醫學期刊的調查,有統計學錯誤的論文比例最高者達66%,最低者也有20%[2-4]。國內有學者對5種中華醫學會系列雜志論著中統計學方法的應用狀況進行了調查,結果顯示,1985年統計錯誤的論文比例為24%,1995年為36%[5]。這些調查研究均說明統計方法誤用的嚴重性以及正確應用的緊迫性。國外從20世紀70年代起就有針對醫學論文的科研設計與統計方法應用情況的調查研究,國內學者也進行了相關研究[6]。這種研究有助于及時了解醫學科研論文中統計方法的應用質量,發現存在的問題,提高醫學科研工作者應用統計方法的水平。筆者總結了近年來已發表的醫學科技論文中常見的統計學問題,希望能引起各位專家學者和臨床醫生的共識與重視,促進我國醫學期刊質量的提高。
1 統計設計存在的常見問題
統計設計是整個研究中最重要的一環,是研究工作應遵循的依據。常見的統計設計問題有:忽視組間均衡性,樣本缺乏代表性,樣本例數不足,未設置對照組,未隨機分組,未提出統計分析方法等。針對以上問題,在科研設計中一定要遵循實驗設計的四大原則即“隨機、對照、均衡、重復”的原則[6]。
1.1不遵循或不重視隨機化原則
隨機化是科研設計的重要原則,直接影響研究結果的可信度。隨機化既要隨機抽樣,還要隨機分組,并有足夠的樣本量作前提。然而,在醫學論文中許多作者對此不夠重視,主要表現在論文中統計處理隨機化不突出,隨機化缺失情況比較常見,有的論文甚至將隨機誤解為隨意、隨便,不采用隨機化處理方法,導致結果缺乏可靠性。還有些文章中沒有提出“隨機”抽樣的設計與方法,沒有排除標準,給人隨意選擇病例之感,且病例數少,因此沒有代表性,所得出的結論不可靠。部分文章雖然注明了“隨機”,但未提及采取什么方法進行隨機化研究或兩組間的例數相差甚遠,不符合隨機化的一般規律,沒有臨床參考價值[7]。
1.2缺少對照研究或對照組設計不合理
正確設立對照是臨床或實驗研究的一個核心問題,設立對照的意義在于說明臨床試驗或實驗研究中干預措施的效應,減少或防止偏倚和機遇產生的誤差對試驗結果的影響。目前,國內許多期刊發表的論文對照組設計不合理現象比較普遍,尤其有些作者對某種新藥或新技術在臨床的應用觀察研究中,不設對照組,缺乏對照觀察,得出的結論缺乏科學性,令人懷疑。有的文章雖然設立了對照組,但在分析結果時,卻沒有將試驗組與對照組的結果進行比較,而僅將各組間的自身前后進行比較,從而使該研究失去對照意義。對照組選擇不當,還表現在兩組間重要的臨床特征和基線情況相差太大,無可比性,如性別、年齡、病情、經濟情況和文化程度等不一致,如有些論文將健康人或志愿者作為對照組,使結果受到非處理因素的影響,產生偏倚或系統誤差,使結論不可信[7]。
1.3均衡性原則掌握不夠
均衡性原則要求實驗中的各組之間除處理因素不同外,其他可控制的非處理因素要盡可能保持一致。特別對疾病預后有重要影響的臨床特性一定要在組間分布均衡。各組間越均衡,可比性越強。有些作者在對病例進行分組時,忽視了均衡性原則,兩組之間沒有可比性,結論自然是錯誤的。具體表現在:有的文章對治療組與對照組的相應統一指標沒有設在均衡的水平上。對治療組情況交代的比較詳細,而對對照組的年齡、性別、病情等不予交代,或所選對照組的年齡與治療組不在一個年齡段,影響了作者對指標的觀察[7]。
1.4重復的原則掌握不好
所謂重復,一是指重復試驗或平行試驗,二是指各樣本組的例數要有一定的數量,即樣本的例數要足夠大。雖然隨機化是增強非處理因素均衡性的重要方法,但當各組內例數過少時,盡管采用了隨機化分組的方法,也難以保證非處理因素的均衡一致。在隨機化分組的基礎上,只有樣本例數足夠大,才能使非處理因素均衡一致,同時也才能使抽樣誤差減小,增強樣本對總體的代表性。一般來說,在隨機分組的前提下,樣本例數越大,各組之間非處理因素的均衡性越好;但當樣本量太大時,往往又會給整個實驗和質量控制工作帶來更多的困難,同時也會造成浪費。為此,在實驗設計時,還應保證在實驗結果具有一定可靠性的前提下,確定最少的樣本例數。一般說來,計數指標每組樣本不得少于20~30例,計量指標每組樣本不得少于5~10例。在多因素分析時,一般認為樣本例數至少為觀察指標的5~10倍[8]。
1.5樣本的含量
樣本的含量的大小直接影響到結論的可靠性。樣本量過少,則抽樣誤差大,結果可靠性差,且經不起重復驗證;反之,盲目加大樣本量也會造成人、財、物的浪費,同時也造成非抽樣誤差增大。故應在保證研究結果精確可靠的前提下,確定最小的樣本量。如某篇論文報道某藥治療的臨床療效,實際總例數為10例,其中6例有效,于是作者得出有效率為60%。顯然,有限的病例數不能充分說明該藥是否有效,作者貿然得出結論,容易給他人造成假象甚至誤導[9]。
2 統計方法選擇與使用不當
在選擇統計方法之前,首先應確定研究資料是計數資料還是計量資料。只劃分其類別而得到的資料為計數資料,也叫定性資料,如根據治療結果計算出的治愈率、陰性率、陽性率等。測定某個具體數值而得到的資料為計量資料,如血壓值、血細胞計數、血氧分壓測定等許多物理診斷和化驗檢查的結果。目前,醫學論文中計數資料最常用的統計方法為χ2檢驗,計量資料最常用的統計方法為t檢驗。值得注意的是,各種假設檢驗方法均有其適用條件,應根據資料特點來選用最適當的方法。均數與標準差分別是描述正態分布資料集中和離散趨勢的指標。能否選用“均數±標準差”來描述某一資料的分布特征,關鍵看該資料是否符合正態分布。當資料不符合正態分布或方差不齊時,應將資料轉換使之符合正態分布,方差齊性后再用t檢驗或方差分析,否則用秩和檢驗。有些作者在使用t檢驗時,未考慮到上述適用條件而盲目使用,造成統計學處理不當或統計學計算錯誤[10]。#p#分頁標題#e#
2.1統計指標應用不當
2.1.1描述計量資料的統計指標描述計量資料的統計指標主要有平均數指標(算術均數、中位數M等)和變異指標(標準差s和四分位數間距Q等),在應用時一定要注意它們各自的適用范圍。對于非對稱分布資料,算術均數不能反映數據的平均水平,應采用中位數描述。一般地,正態資料或對稱資料用描述,偏態資料用M和Q來描述。在不能確定數據的分布類型時,應選用M和Q進行統計描述。四分位數間距Q是75%分位數P75和25%分位數P25之差,即Q=P75-P25,所謂百分位數Px是將全部觀察值分為兩部分,理論上x%的觀察值比它小,(100-x)%的觀察值比它大,中位數M是50%分位數P50。、s、M、Px與Q可通過統計軟件直接輸出[9]。
2.1.2描述計數資料的統計指標描述計數資料的統計指標有絕對數和相對數。絕對數是原始資料經匯總得到的小計或總計數。相對數是兩個有關的絕對數之比,主要包括率和構成比(百分比)。醫學論文中相對數應用的主要問題之一是分母較小。分母較小時,相對數的可靠性不能保證,在這種情況下,宜直接用絕對數進行描述而不宜計算相對數。醫學論文中相對數應用的主要問題之二是將構成比誤用來說明事物發生的強度。構成比只能反映事物的內部構成,不能說明事物的發生強度。醫學的研究對象主要是人以及與人體有關的各種因素。由于生物現象的變異較大,各種影響因素又錯綜復雜,研究常是抽樣觀察,使事物本質差異與抽樣誤差混雜,故需用統計方法透過偶然現象來探測其規律性。如果不能正確運用統計學方法,造成統計學上的偏差或失誤,就很容易把本來成功的結果當成失敗而放棄,或把失敗的教訓誤認為成功的結論而加以宣傳。在進行科研設計時要嚴格遵循科學的統計學分析方法,不能留下隱患,否則,再高明的統計學專家和統計學軟件也無法彌補科研設計缺陷造成的損失。總之,統計學分析在醫學研究和論文寫作中意義重大。作者在撰寫論文時,應注意識別、總結有代表性的、有借鑒意義的統計學領域的缺陷、失誤或錯誤的多發點,特別留心易出現統計錯誤的險區,從而使論文中的統計學問題減到最低限度。認真檢查、仔細核驗,盡量避免上述錯誤,必要時還可以請統計學專家幫助把關[12]。
2.2統計方法描述或選擇不當
統計方法選擇非常重要,它直接影響結論的可靠性[12]。臨床資料的結果變量可分為計數資料、計量資料和等級資料。計數資料指將觀察對象按兩種屬性分類,如生存、死亡,治愈、未治愈,有效、無效等,通常轉化為率。如果是兩組間的比較,則采用四格表χ2檢驗或其校正公式,如果是多組間率的比較,則采用行×列表資料χ2檢驗。計量資料指對某一個研究對象用定量的方法測定某項指標得到的資料,一般均有計量單位。通常資料呈正態分布時,兩組間均數比較用t檢驗,多組間均數比較用方差分析和q檢驗。當資料不呈正態分布或方差不齊時,也可用秩和檢驗等非參數檢驗法。
2.2.1統計方法描述不清
醫學論文中常可發現作者未交代所用的統計方法,如是配對設計的t檢驗還是成組設計的t檢驗,是Ridit分析還是χ2檢驗,是作相關分析還是作回歸推斷。統計方法交代不清或根本不予交代,使讀者對論文結論的正確與否無法判斷。有的作者只提一句“經統計學處理”后,就寫出結論。有的甚至直接用P值說明問題,籠統地以P<0.05或0.01、P>0.05便稱結果差異有無顯著性,P值的大小不說明差值的大小,它還與抽樣誤差大小有關[13]。因此,還應寫明具體的統計方法,如有特殊情況,還應說明是否采用了校正,應寫出描述性統計量的可信區間,注明精確的統計量值和P值,然后根據P值大小作出統計學推斷,并作出相應的醫學專業結論。
2.2.2假設檢驗方法交代不清不交
代假設檢驗方法或假設檢驗方法交代的不具體、不清楚是醫學科研論文中常見的錯誤。如果不交代假設檢驗方法或假設檢驗方法交代的不具體,讀者就無法考察論文的統計學方法選擇的是否正確,無法核對計算結果是否準確。每一種假設檢驗方法都有其特定的適應條件和嚴格的適用范圍。對于同一組資料,采用不同的假設檢驗方法可能得出截然相反的結論。如將配對設計的資料按成組設計資料的方法處理,將會損失樣本提供的信息、降低檢驗效率,可能使原本有統計學意義的結果無統計學意義[14]。在論文寫作時,不但要交代選用的是什么統計學方法,而且統計學方法要盡可能具體。如選擇t檢驗,要說明是配對t檢驗,還是成組t檢驗;選擇方差分析時,要說明是完全隨機設計的方差分析,還是配伍組設計的方差分析。對于四格表資料,應說明是一般四格表χ2檢驗、配對四格表χ2檢驗及四格表資料的精確概率法等。
2.2.3統計方法選擇常見錯誤
①誤用χ2檢驗。χ2檢驗有一定的適用條件,n>40且理論數(T)>5時,可用一般χ2檢驗;n>40,但至少有1個T>1且T<5時,可用校正χ2檢驗;n<40或T<1時用χ2檢驗的確切概率法[15]。②t檢驗誤用于多組資料的比較。在醫學期刊中常會出現將t檢驗誤用于多組資料的比較。多組資料的比較應該采用方差分析(F檢驗),當差異具有統計學意義時,再進一步作兩兩比較。當各組均與一個對照組比較時采用Dunnettt檢驗;當各組相互循環比較時,則常采用Student-Newman-keuls(SNK)檢驗,又稱q檢驗[16]。③配對t檢驗與成組t檢驗誤用。大部分論文只注明采用t檢驗,而未注明是配對t檢驗還是成組t檢驗。配對t檢驗常用于處理前后的自身對照,即差值均數與總體均數“0”的比較;成組t檢驗適用于成正態分布的兩個小樣本均數間的比較。④資料不呈正態分布時未用非參數檢驗。t檢驗F檢驗等適用于呈正態分布、方差齊且有確切的測量數值的資料,而非參數檢驗(如符號檢驗、秩和檢驗Wilcoxon法、秩檢驗-KruskalWallis法、Friedman法、Ridit分析、Seperman相關等)對資料無特殊要求,對按大小順序、評分、等級、反應程度甚至色調深淺等資料都可進行分析比較[17-18]。因此,對于多組計量資料的比較,呈正態分布且方差齊時用F檢驗,方差不齊時可用變量變換,或采用秩和檢驗;對于兩個小樣本均數的比較或處理前后的比較,方差齊時用成組t檢驗或配對t檢驗,方差不齊時用t′檢驗[19]。
3結果解釋時存在的問題
統計分析的結果是無效假設或是不能無效假設。無效假設在一般的統計檢驗為兩組總體參數相等。無效假設只能說兩組總體參數不相等而并不能說兩組相差很大。兩組相差如何要對可信區間進行研究觀察后得出。由于統計檢驗不能得出差別的大小,因而結論不能說“有明顯差異”或“有顯著差異”,也不能說“差異非常顯著”,更不能說“差異明顯”。在國外的統計書籍上的英語表達為“significant”,它的正確意義應當是“有意義的、有重要性的”。俄語為“Значмый”和日語中的“有意”也是這個意思。國內只有極個別的英漢詞典把“significant”誤譯為“顯著的”。正確的說法應當是“差異有統計學意義”或“差異有高度統計學意義”等[20]。在解釋差別有統計學意義的結果時,有些人常常根據P值的大小作出對實驗效應差別程度不同的專業結論[21]。例如某實驗研究,比較甲、乙兩種治療方法對某病的治療效果(假定甲法的療效優于乙法),若得到“P<0.001”,則認為甲法極顯著優于乙法;若得到“P<0.01”,則認為甲法非常顯著優于乙法;若得到“P<0.05”,則認為甲法顯著優于乙法。犯這種錯誤的原因是錯誤的理解了統計學中P值的概念[7]。統計學上根據假設檢驗原理推算出來的P值表示拒絕特定的無效假設可能犯假陽性錯誤的概率。P值的大小并非指差異的太小,只能反映兩者相同或不相同。P值越小,說明越有理由認為兩種處理方法效果不同,而不能反映對比的兩組或多組之間差異的大小。差異的大小只能根據專業知識來確定。此外,甚至在部分投稿文章中未交代所采用的統計分析方法,也未見應用統計學的跡象,僅從各組數據的均數大小做出了統計推斷。醫學期刊論文中暴露出來的統計學錯誤,從表面上看是編輯部和審稿者把關不嚴所致。事實上,即使審稿時發現了上述錯誤,也無法改正。因為實驗設計的錯誤只有在科研工作開始之前才有可能得到糾正。即使編輯工作者能夠阻止有嚴重統計學問題的,也僅僅是治標而已。如何使廣大醫學論文作者在醫學研究中正確應用統計學,提高科研質量才是治本[7]。#p#分頁標題#e#
4對策與建議
眾所周知,統計學是從事科學研究不可缺少的工具。從試驗設計、資料收集與表達、數據處理和結果分析,每一個環節都需要正確地運用統計知識,才能真正發揮統計學在科學研究中應起的作用。然而,在已出版和發表的一些學術專著和論文中、通過評審的科研成果和答辯的學位論文中,經常可以看到忽視、輕視和誤用統計學的現象[22]。
知識應完善編輯人員的知識結構,保證統計學應用的準確性。為此,可定期聘請統計學專家對審稿人員進行統計學知識培訓。科技期刊的群體效應理論[23]認為,期刊編輯的專業結構應多元化,以利于編輯互相學習,實現知識互補。醫學期刊編輯部可考慮聘用統計學專業的研究生作為編輯。編輯應將醫學統計學作為自己的必修課,通過多種方式,如自學自修,參加講座或培訓班學習統計學知識,有條件的編輯部,如醫學院校學報編輯部,可以有計劃地組織編輯參加本科生或研究生醫學統計學課程的學習,也可鼓勵編輯人員在職攻讀統計學專業研究生學位。這樣,可以提高全體編輯人員的統計學水平,最終使編輯和審稿人都能夠發現論文中存在的統計學錯誤,并指導作者修改,正確進行醫學論文中有關統計學分析的描述[24]。另外,有關職能部門或學會可組織與醫學統計學相關的培訓班,聘請統計學專家講課,對編輯人員進行定期統計學知識培訓,加強科研設計、統計學知識的學習[19]。
4.2加強醫學統計學專家審稿
醫學研究論文專業性強,經常涉及統計學處理問題,有時會遇到統計方法復雜的稿件,這不僅需要本學科專家審稿,而且需要醫學統計專家把關,只有這樣,才能保證論文所報道的研究成果的真實性和可靠性。醫學期刊編委會中應有統計學專家,專門負責稿件統計學方面的審查工作。
4.3強化作者的統計學意識
《醫學科研方法》的主要內容包括醫學基本科研方法的講解、醫學文獻的閱讀、醫學科研論文的寫作等,可以使醫藥專業的學生了解醫學科研的基本方法和基本程序,開闊學生的視野,激發學生對醫學科學研究的興趣以及對專業的熱愛。為今后的就業和繼續深造做好鋪墊。
隨著高校人才培養模式的轉變,從原來的培養臨床醫生轉變到了培養全面的醫學創新人才。醫學創新型人才應有濃厚的創新意識、高尚的創新人格、豐富的創新知識、飽滿的創新精神、活躍的創新思維、高超的創新能力、科學的創新實踐[2-3]。為了適應這種轉變,很多醫學類院校都在研究生中開設了《醫學統計學》、《醫學科研方法》這兩門課程,以達到培養全面型人才的目的。近年來,逐漸在本科學生中也開設了這兩門課程。
在醫學科研相關內容的學習中,《醫學統計學》、《醫學科研方法》是相輔相成、相互促進的兩門課程[4-6],但是我在教學中發現,我校的醫學類專業學生的課程設置中,有的專業兩門課程都學習了,有的專業只學習了一門課程,兩門課程都學習的專業中,有的設置在同一學期,有的設置在不同的學期。為了探討課程設置的最佳效果,我對這幾類班級做了調查。
一、對象與方法
1.1 研究對象
以2012級醫學本科本學期開設了《醫學統計學》的班級為研究對象,分成三大類,分別是在學習《醫學統計學》之前沒有學習過《醫學科研方法》的班級、在學習《醫學統計學》之前的某學期學習過《醫學科研方法》的班級、以及在學習《醫學統計學》的同時正在學習《醫學科研方法》的班級,在這三類中分別隨機選擇一個班級作為研究對象,稱為甲班、乙班和丙班,共208人。這三個班級所使用的《醫學統計學》和《醫學科研方法》的教材一致,授課學時、內容相同。
1.2 研究方法
采用問卷調查的方式,給研究對象發放調查問卷。
1.3 統計學處理
資料錄入和分析均采用SPSS17.0軟件,計數資料采用卡方檢驗的方法進行統計分析。
二、結果
2.1 調查問卷結果
在整個學期的教學結束以后,對所選三個班的同學進行問卷調查,結果見表1、表2。
三、討論
《醫學科研方法》這門課程主要的教學內容為:科研設計的基本概念、科研設計的三要素、科研設計的原則、科研設計的類型、動物實驗、醫學文獻的閱讀、醫學論文的寫作等。《醫學統計學》的主要教學內容為:醫學統計學的基本概念、數據的分類、t檢驗、方差分析、卡方檢驗、非參數檢驗等。
在本次調查中,上過《醫學科研方法》的班級對科研的興趣和了解比未上過《醫學科研方法》的班級要高,差別有統計學意義(P<0.05),這說明醫學科研方法確實有開設的必要,能讓學生們在本科的學習階段對科研有所了解,為以后的深造打下基礎。
在內容上,醫學統計學中學生們會學習到的統計學方法,都是與醫學科研方法中學習到的科研設計類型相對應的,在沒有上過醫學科研方法課程的班級中,就需要教師額外給學生講解相對應的科研設計類型,并且還要給學生解釋統計在醫學中的應用,這就耗費了上課的時間,且很多學生在上課時簡單的講解中并不能很好的理解各種科研設計類型。如果兩門課程分開兩個學期進行教學,學生們對之前的內容就會有所遺忘,因此乙班和丙班兩個班級的大部分學生都覺得將兩門課程放在同一個學期教學能促進相互的理解,內容上顯得更加的連貫。
本次研究只是對《醫學統計學》和《醫學科研方法》這兩門課程在內容理解上的相互促進進行了初步的探索,為以后的學生培養方案的改革提供了一定的依據。但在任何課程的教學中,教學效果不僅僅是由培養方案中的課程開課順序決定的,對教學效果有影響的還有教學模式,要將好的教學模式與合理的培養方案結合起來,才能培養出具有實際運用能力的、全面發展的學生。
1資料與方法
1.1研究對象山東醫學高等專科學校2013級藥學和檢驗專業需要進行醫學統計學授課的兩個教學班所有學生作為研究對象,隨機確定檢驗班(102人)作為實驗組,藥學班(100)作為對照組。
1.2實施方案實驗組和對照組所使用教材相同,教學大綱、授課學時數一致,由一名教師進行授課。對照組實施傳統理論教學方法,即在課件結合板書的前提下以教師講授理論知識并講解例題,學生課下做習題練習。實驗組實施案例式教學方法,在傳統教學方法的基礎上,基于授課內容設計案例以學生為主進行討論。
1.3案例式教學方法實施步驟案例質量是決定案例式教學方法效果的關鍵,因此課前除精心制作、選擇體現教學目的的案例外,應盡可能“擬似醫學研究情境”使學生有親臨其境的感覺,即注重案例的實用性和真實性,以滿足教學內容,并體現科學研究的嚴謹,每個案例設置3~4個問題。課堂傳統教學法講解理論知識后,提出問題,導出案例,由學生進行思考、討論。課下10人一組基于圖書館、網絡查閱所學知識單元的錯誤案例,在統計習題練習課上教師引導由學生進行分組討論。
1.4教學效果檢測與評價兩組學生均于醫學統計學課程結束后,進行問卷調查,內容包括學生對該課程的態度、興趣及其應用能力。另外由學校教務處組織學生在同一時間、使用同一試卷對課程進行測試,然后比較兩組學生的測試成績。
1.5統計學處理Epidata3.0建立數據庫,雙人錄入,SPSS20.0進行數據分析,計量資料采用t檢驗,計數資料采用2x檢驗,檢驗水準α=0.05。
2結果
2.1兩組學生一般情況比較實驗組和對照組學生年齡(t=0.843,P=0.400)、性別(2x=0.695,P=0.405)間差異無統計學意義,前期的醫學基礎課程成績類別構成相近(見表1),說明兩組學生的一般特征均衡性較好,有好的可比性。
2.2教學效果評價
2.1學生學習態度、興趣和能力為對比分析兩種教學方法的效果,設計了包含學生對醫學統計學課程態度、興趣和使用能力的問卷,于教學結束后對兩組學生進行現場問卷調查,將各項得分進行t檢驗,學生對醫學統計學態度、興趣及試驗能力的得分差異有統計學意義,實驗組高于對照班,其他指標差異無統計學意義。結果詳見表2。2.2學生期末考試醫學統計學成績分析基于學生期末實際成績按照不及格、60~80分、80分以上分成三個檔次分別統計(見表3)并對構成比進行檢驗。
3討論
案例式教學法最早在哈佛大學興起,歷經完善,現已成為世界范圍內教育教學模式改革的首選。由于其突出學生的主體性,融合探究性、創新性的教學理念,擬合真實教學情景,大大激發了學生自主學習的意識和運用知識自主解決問題的能力,彌補了傳統教學模式的不足,得到我國教育工作者的認可和推廣。
職專醫學統計學課程的傳統教學模式以學生被動接受的灌輸式為主,該模式以教師為主體,學生參與較少,對學生自主解決問題能力的培養存在大的弊端,故而對職專醫學統計學的教學改革勢在必行。本研究結果發現實驗組與對照組學生對待醫學統計學課程的態度、興趣和試驗能力得分經t檢驗顯示,差異有統計學意義(P<0.05),且期末考試成績實驗組優于對照組(P<0.05)。應用能力中2個選項兩組學生得分差異無統計學意義(P>0.05),但實驗組各項得分均數均大于對照組,由以上結果可見,在職專醫學統計學教學過程中引入案例式教學法,其教學效果優于傳統教學方法。反思前一階段的教學改革過程,案例式教學方法在醫學統計學得以順利實施有以下幾個關鍵環節。①正確把握案例式教學與傳統教學的關系。案例分析是在學生掌握醫學統計學基礎理論的前提下,以培養學生理論聯系實際、分析和解決問題的能力為目標,而傳統教學是講授醫學統計學概念、原理和方法中無法替代的教學環節,因此在實際應用時不能偏重案例教學而輕視傳統教學,二者應相輔相成,否則案例式教學方法將成為無本之木,無法實現為教學目的服務的目標。②重視案例的設計和篩選。醫學統計學案例應根據教學單元內容和目的進行設計,盡量選擇與專業接近、學生熟悉的案例,應用使學生有身在其中的案例導入方法,以降低學生理解和接受的難度并激起學生學習的興趣。案例問題的設計應循序漸進,隨著基礎知識的累積由簡到難,統計方法的應用從單個到綜合,以培養學生分析和解決問題的能力。③強調學生的主體地位。案例式教學法所體現的教學理念就是“以學生為中心”,通過提問和學生的討論、回答,加深對知識的理解并達到活學活用。通過互動,促進學生間、師生間的溝通,增強團隊協作意識,完成合作式學習,同時提高學生的整體素質。由學生課下多途徑查閱錯誤案例,在習題課討論,鍛煉學生自主學習能力。④體現教師的引導作用。案例式教學法是一種師生共同參與的教學模式,其中學生是主體,教師是鼓勵者和引導者。在課堂上教師應調動學生的學習積極性,引導學生思考、討論,適時點評學生的見解,幫助學生梳理和總結問題并掌握完整的知識體系。所以該教學方法對教師的專業水平和駕馭課堂能力提出了更高的要求,需要教師加強自身的專業素質,探索并完善教學方法。
【摘要】 目的 為了了解《醫學統計學》教學改革工作中存在的問題,了解《醫學統計學》考試方法改革的利弊。方法 搜集97~99級臨床醫學本科生《醫學統計學》的考試試卷和成績,對試卷從學生成績的分布、信息難易度、區分度等方面進行了綜合分析,并且對該課程的考試方法改革前后進行比較研究。用SPSS for Windows12.0建立數據庫和有關的數據處理。多組間比較根據資料的性質不同分別選用one-way ANOVA和Kruskal-Wallis Test的比較方法,多重比較使用LSD法。兩組間比較選用Mann-Whitney Test法。結果 99級臨床醫學本科生《醫學統計學》的考試成績低于97~98級的臨床醫學本科生《醫學統計學》的考試成績(U=5.702,P=0.000);99級學生中,一系和二系的成績優于三系的成績(P=0.011和P=0.033);97級的試卷可靠性好,99級的可靠性較好,98級的可靠性一般;3份試題的難度和區分度綜合評價結果,以99級的為最優(X 2 =7.580,P=0.065);《醫學統計學》考試方法改革前后的難度無統計學意義(F=1.885,P=0.163);3年臨床醫學專業《醫學統計學》試卷的全卷區分度考試方法改革后的比改革前的大,97級與98級比較P=0.004,97級與99級比較P=0.007,98級與99級間無差異P=0.435。結論 對五年制臨床醫學專業《醫學統計學》教學與考試的改革實踐結果表明:學生比較適應于記憶的內容,對實際應用的方面感覺較難;作業對學生知識的掌握有一定的作用,發散性的思維鍛煉可以促進學生學習的積極性。
關鍵詞 醫學統計學 考試方法 比較
《醫學統計學》是本科臨床醫學專業的必修專業基礎課。在教學過程中,學生普遍反映《醫學統計學》抽象、難學。為了進一步了解在教學改革過程中存在的問題,本研究收集了97、98和993級的臨床醫學專業(五年制)的《醫學統計學》試卷進行具體的分析和比較研究,可以找出在此課程教學改革工作中存在的問題,了解《醫學統計學》考試方法改革的利弊。為教師調整教學內容,改革教學方法,提高教學質量和以后的教學改革提供理論依據。
1 資料來源和方法
1.1 情況簡介 臨床醫學專業醫學統計學課程屬于必修專業基礎課。在以前醫學統計學是《預防醫學》中的一部分(衛生學和統計學各占50%),教學一般是分前后9周2個階段進行,考試“單科獨進”。歷年來教研室一直嚴格把關,認真施教,采用統一命題,閉卷考試方法,學生學習成績一直很好。在醫學教育改革的影響下,從99級臨床醫學開始,把《預防醫學》分成《醫學統計學》和《衛生學》兩門課。臨床醫學本科生《醫學統計學》的考試,自從98級開始,采用了以“醫學實踐問題為中心”的方式來出題,結果99級325人參加考試,有75人不及格;98級12人參加補考,有10人不及格,引起了教研室廣大教師的高度重視和警惕。
1.2 資料來源 97、98、99連續3級五年制臨床醫學專業的醫學統計學試卷。試卷命題均由作者親自完成,閱卷均是采取流水作業的方式,統一評分。3屆學生在年齡、性別比例和招生來源等方面基本相同。大課任課老師和實習指導相同,判卷按統一標準答案,由任課教師每人1題,公正評分。97、98級學生是以書本課后的練習為作業,而99級一系學生的作業是:從中華系列或中國系列的專業雜志中找一些相關的文獻,要求根據所學醫學統計學知識對文中所涉及的統計設計、統計指標和統計方法的選擇使用加以 ˇ 基金項目:本項目受浙江大學第六期SRTP項目的資助正確理解、識別其正誤并且加以評析,99級二系的學生是以書本課后的練習為作業,99級一系學生老師沒有布置任何作業。
1.3 方法
1.3.1 統計方法 用SPSS for Windows12.0建立數據庫和有關的數據處理。多組間比較根據資料的性質不同分別選用one-way ANOVA和Kruskal-Wallis Test的比較方法,多重比較使用LSD法,兩組間比較選用Mann-Whitney Test法。
1.3.2 試卷信度采用分半信度方法 其計算公式:r S-B =2r 半 /(1+r 半 ),r 半 為分半相關系數,即按試卷奇偶題得分計算其相關程度。分半信度系數0.9以上,可靠性好:0.8~0.9,可靠性較好;0.6~0.8,可靠性一般;0.6以下,可靠性較差 [1] 。計算得97級衛生統計學試卷分半信度系數為0.96。對98級試卷采用克倫巴赫系數法,其計算公式:C=n(1-∑ n i=1 S i2 /S 2 )/(n-1),其中n為試卷總題數,S 2 為考試總分數的方差,S i 為第i題的方差。C在0.5~0.9范圍內較好 [2] 。98級試卷信度系數為0.56。對99級試卷采用分半法(按難度相等兩半兩分)計算其信度:ρ=2r/(1+r),先將n個試題按難度從小到大排列,取順序號單號為一組,雙號為一組,其次求各題的平均分數,然后求這兩組的相關系數即為r,計算ρ=0.69,即99級試卷信度為0.69。試題難度是考生對某一試題作出正確回答的百分率,用難度系數P表示。小樣本時:客觀性試題P=答對該題人數/考生總人數:主觀性試題P=考生該題平均得分/該題滿分。大樣本時:P=(P H +P L )/2,其中P H 為高分組該題的難度,P L 為低分組該題的難度。按難度四級分類法(P>0.8,易;0.65~0.8中等難度;0.5~0.65較難,P
1.3.3 區分度是衡量試題、鑒別考生水平差異能力的重要指標,用D表示。公式P=P H -P L 。本文采用得分率求差法(Johnson法)求全卷區分度:D=X H -X L
N(H-L) ,其中X H 、X L 分別為27%高分組,27%低分組的總分,H、L分別為最高分和最低分,N為各組人數。
2 結果
2.1 考試及總體得分情況,見表1、表2,圖1~3。表1 3屆學生《醫學統計學》考試總體得分情況從表1可見,3年試卷的學生成績總分的總體分布是呈偏態分布的。97、98級的平均成績差不多,以99級為最低,學生間總得分的差異以99級為最大。不及格率也是以99級為最高。表2 三屆臨床醫學學生《醫學統計學》考試成績的分布情況對表2中資料分析表明,三屆臨床醫學學生《醫學統計學》考試成績分布是不同的(X 2 =65.469,P=0.000),其中97級和98級間沒有差異(U=1.715,P=0.086),99級臨床醫學學生《醫學統計學》考試成績比前兩級的差(U=5.702,P=0.000)。
2.2 試卷組成及得分情況 97、98、99連續三級五年制臨床醫學專業的《醫學統計學》試卷的題型、題量、分值以及學生的得分情況見表3。
2.3 99級三系之間的比較情況 99級臨床醫學《醫學統計學》考試的平均成績二個系之間有統計學意義(F=3.63,P=0.028);一系與二系之間沒有差異(P=0.656),一系平均成績比三系高(P=0.011),二系平均成績比三系高(P=0.033),見表4和圖4。
2.4 試卷質量評價情況
2.4.1 試卷信度 97、98、99連續三級五年制臨床醫學專業的《醫學統計學》試卷的信度分別為0.96,0.56和0.69。97級的試卷可靠性好,99級的可靠性較好,98級的試可靠性一般。
2.4.2 難度和區分度 試題的難度和區分度是衡量試題質量的量化指標。三年臨床醫學《醫學統計學》試卷的難度分布見表5。三年臨床醫學專業《醫學統計學》試題的難度無統計學意義(F=1.885,P=0.163)。表3 三屆學生《醫學統計學》試卷組成及學生得分情況年級 表4 99級臨床醫學《醫學統計學》考試成績情況 三年臨床醫學專業《醫學統計學》試卷的全卷區分度有差異(F=6.029,P=0.005),區分度以97級試卷為最差(97級與98級比較P=0.004),97級與99級比較P=0.007,98級與99級間無差異P=0.435),見表6。表6 3份《醫學統計學》試卷的區分度分布情況年級
2.4.3 3份試題的難度和區分度綜合評價結果,以99級的為最優(X 2 =7.580,P=0.065),見表7所示。表7 3份《醫學統計學》試卷中的各小題質量綜合評價情況
3 討論
3.1 3屆學生考試成績均呈負偏態分布,即分布曲線高峰右偏,高分人數較多。《醫學統計學》考試的目的是檢查學生對基本概念、基礎知識和基本統計分析方法的掌握程度,即檢查學生是否達到教學大綱的要求,所以其3屆學生考試成績分布類型是與實際要求吻合的。
3.2 信度表示考試的可靠性,即考試結果是否真實反映考試的實際水平,影響信度的主要因素是測量誤差。一個考生的實得分數由兩部分組成,一部分是憑他所掌握的知識確能得到的真實分數;另一部分是因試題不合理,包括試題難度、代表性、覆蓋面、教師編制試題的主觀偏見和隨意性等因素而影響了成績。3份試卷中,97級、99級試卷信度較好,98級試卷信度不理想,應改進。可以通過增加同質試題數的方法提高其信度 [2] 。
3.3 3次考試的平均難度分別為0.76、0.74、0.68,與國內關于考試試卷P值在0.60~0.80之間為宜的觀點相符 [3] ,可以認為3份試卷難度適中。
3.4 試卷區分度是說明試卷能否反映學生水平差異的指標,區分度好能反映學生的真實水平,區分度差則說明成績是隨機的,不能反映學生的真實能力。98級、99級全卷區分度均優于97級試卷區分度,但是3屆試卷的區分度水平一般。
3.5 衡量試題質量的兩個指標是難度和區分度。根據難度四分法,97級試卷易題占47.4%,難題占5.3%,易題所占比重過大,使整張試卷顯得過于簡單,高分人數偏多,成績呈負偏態分布;98級難題所占比重相對易題大;99級難題所占比重與易題相當。一般來說,整張試卷易題和難題各占1/4,中等難度的試題占1/2,因此應減少97級試卷的易題,增加難題,而98級試卷則相反,99級的難易題分配尚合理。若簡單的試題為學生應該掌握的基礎知識,作為課程考試題仍可使用。1965年,美國檢驗專家L?Ebel根據長期經驗提出用鑒別指數評價題目性能的標準:區分度D>0.40試題很好;0.30~0.39之間的試題良好,修改更佳;0.20~0.29試題尚可,仍需修改;D
3.6 加強學生能力的培養。97級試卷題型符合教學大綱,分析其各型的得失分,滿分10分的詞解釋平均得分8.1分,滿分20分的選擇題平均得分15.3分,滿分70分的問答題平均得分52.3分,學生對基本概念掌握良好,對基本知識的簡單應用尚可以,綜合應用能力相對稍薄弱,可看出學生的綜合分析能力欠佳,對所學知識不能靈活應用、融會貫通。98、99級試卷題型全部為問答題,學生成績均較97級差,也說明了學生在綜合應用方面存在缺陷。故在教學工作中應注重培養學生對知識的理解掌握、綜合分析能力。對此,可以采用在教學中結合實際問題的方法,鼓勵學生積極思考,主動學習,自主分析問題。同時,可根據課程特征,運用多樣化的教學方法,如采用討論法、實習作業法等提高 教學效果。并且,在教學工作中,強調平時的作業,使學生把所學內容加深理解和進一步地得到鞏固。
3.7 科學化命題。考試是評價教與學效果的重要指標,對教學工作和學生的學習起著調控和指導作用。而命題的科學性、合理性則決定了這一指標的準確度。一套好的試題應該符合教學大綱的內容,具有合適的難度和較好的區分度,較好的信度和覆蓋度,能夠客觀、準確地反映學生的真實水平。故教師應掌握命題技巧,制定命題計劃,建立統一的試題評價體系,綜合評價學生的能力。
參考文獻
1 洪汝渝.試卷分析.渝州大學學報,1997,14(3):103-106.
2 毛春元.試卷質量的統計分析.淮海工學院學報,1999,8(B12):86-88.
1.醫學統計學動畫課件庫的組成
根據教學內容內在聯系的需要來制作課件,不一定追求整堂課使用,關鍵是解決教學的難點、重點,以提高教學質量。因此,我們選定了有代表性的內容用flash8制作了模擬課堂的趣味性動畫,同時結合flash腳本語言制作了常用概率分布的動態演示、抽樣分布等課件。制成課件庫的形式,使用時可以靈活地調用,課件庫的框架如圖1。
2.醫學統計學動畫課件庫的制作
按照制作原則,將選定的內容制作成動畫。對于模擬課堂,先由美術師繪制教師和學生的卡通形象,我們再選用音頻軟件GoldWave5.23漢化版錄制及編輯聲音〔2〕,然后將圖片及聲音都導入flash8,并運用其動畫技術制作成影片,模擬教師授課的真實情境,增強學生的參與感。為了增加播放的靈活性,我們模仿一般播放器的控制效果設計了影片播放控制器,功能包括播放、暫停、后退、快進、停止。對于常用概率分布、抽樣分布及其他的動畫,我們采用flash8的ActionScitpt腳本語言工具編程實現,并且運用flash的交互性,提供可更改參數的指標項,以實現變量和參數的輸入、輸出以及部分的計算。譬如動畫“總體均數的置信區間”,學習者輸入不同的參數,并單擊確定,則輸出的界面會動態地發生改變。學習者能夠積極參與,以形成較為真實的學習情境,進行模擬實驗或探究發現以供學習使用。圖2為“總體均數置信區間”的界面。為了幫助對動畫的理解,在課件中增加了相關知識點文字概述的鏈接,讓學生理論與實踐相結合,提高學習的收效。在課件播放的過程中,單擊知識點鏈接旁邊的Enter按鈕,即可到達相應的文字說明。
3.醫學統計學動畫課件庫的試用和評價
為了解動畫課件在“醫學統計學”教學過程中的使用效果和學生對采用動畫課件進行教學的態度,我們在本校2006級非臨床專業醫學本科生中進行調查,采用學生自答問卷的方式。共發問卷95份,回收91份,回收率為95.8%,有效問卷91份,有效率為100%。調查結果如下:我們主要從對課件的總體評價、課件對學習的幫助,以及對課件的要求和希望等方面進行調查。大多數的學生對課件持肯定和贊同的態度,84.6%的學生認為課件生動有趣,91.3%的學生希望今后的教學中采用flash課件,81.4%的學生認為課件對激發學習興趣和提高學習效果有一定的幫助(34.1%認為很有幫助,47.3%認為較有幫助),同時學生對于網上加載課件的必要性也給予了肯定。對于設置的兩個開放式簡答題,學生提出了較好的建議,對我們今后進一步的修改課件,提高多媒體教學效果大有裨益。“醫學統計學”結合flas課件進行教學,從學生的接受程度來看是值得肯定的。討論利用動畫可將醫學統計學中的抽象概念與理論形象化,有助于學生深刻理解、領會和培養統計思維,有利于激發學生的學習興趣,有利于知識的獲取與記憶,有益于難點和重點的掌握,為學生創造理想的學習條件,充分發揮學生的學習主動性。本課件庫具有以下的特點:
第一,有選擇的納入有代表性的部分,內容不在于多,而在于精;應該能夠突出重點,突破難點,最終提高教學質量。
第二,形象性、趣味性:利用模擬課堂,將枯燥的概念或學生難以理解和傳統教學方法難以講清的問題,以生動、形象的方式展現,使學生容易接受和掌握,同時激發學生的學習興趣;運用動漫技術,增加內容的生動及趣味性,使人賞心悅目,獲得美的享受。
第三,交互性:課件庫中的交互運用AS編程制作。對于模擬課堂,播放控制器具有控制動畫的暫停、播放、停止、快退、快進等功能,非常方便學習。課件具有輸入通道,可由使用者自行定義參數的具體數值(如組段數、均數、標準差等),通過更改參數,演示諸如各種概率分布以及統計量抽樣分布曲線等的變化,從而增加使用者的參與性,便于其理解相關內容。