在统计学中参数的含义是指_期刊论文中科研统计学缺陷分析及解决路径
中華醫(yī)學(xué)科研管理雜志, 2018,31(5)??張策, 陳淑良, 王曉桐, 等
摘要目的從期刊論文統(tǒng)計方法缺陷方面進行分析,并提出解決方案。
方法資料采用中國知網(wǎng)文獻數(shù)據(jù)庫中的"基礎(chǔ)科學(xué)"及"醫(yī)藥衛(wèi)生科技"數(shù)據(jù)庫的全部文獻作為抽樣源,限定時間為2014年11月10日-2017年11月10日進行檢索。共檢出文獻1 456 417篇,采用隨機數(shù)字法每年抽樣100篇,共300篇逐一通讀考察統(tǒng)計學(xué)方法應(yīng)用,指出統(tǒng)計缺陷并給出解決方案。
結(jié)果在分析的300篇文獻中有126篇采用統(tǒng)計學(xué)方法,存在一定程度上的統(tǒng)計缺陷,其主要集中在未詳細標注統(tǒng)計量和P值,統(tǒng)計方法的適用條件把握不好等問題,針對這些問題,筆者開發(fā)了統(tǒng)計學(xué)路徑圖和問答式計算機系統(tǒng),供臨床應(yīng)用。
結(jié)論從被抽查的論文看,存在大量統(tǒng)計學(xué)缺陷,本文提出的統(tǒng)計路徑圖和問答式計算機系統(tǒng)為解決臨床統(tǒng)計問題提供了一種解決方案。
統(tǒng)計學(xué)(Statistics)是一門研究數(shù)據(jù)收集、整理和分析的學(xué)科,隨著現(xiàn)代醫(yī)學(xué)的發(fā)展,統(tǒng)計學(xué)在醫(yī)學(xué)科研領(lǐng)域得到廣泛應(yīng)用,研究設(shè)計、數(shù)據(jù)記錄、結(jié)果表達與解釋等均涉及統(tǒng)計學(xué)知識,統(tǒng)計學(xué)方法的正確應(yīng)用是論文具有科學(xué)性和可靠性的前提;統(tǒng)計學(xué)的內(nèi)容非常豐富且不斷發(fā)展,但在科研過程中不規(guī)范使用、濫用、甚至誤用的現(xiàn)象非常普遍,且涉及實驗設(shè)計到結(jié)果解釋的各個環(huán)節(jié)[]。醫(yī)學(xué)統(tǒng)計學(xué)是醫(yī)學(xué)科學(xué)研究中必需的手段,它體現(xiàn)科研結(jié)果的可信性、可靠性、科學(xué)性[]。但是許多調(diào)查研究發(fā)現(xiàn),在醫(yī)學(xué)學(xué)術(shù)論文中仍存在不少統(tǒng)計方法使用錯誤及表達不當?shù)那闆r,這造成了論文統(tǒng)計結(jié)論的不可靠,有的甚至產(chǎn)生了嚴重的偏倚。本研究對近3年醫(yī)學(xué)學(xué)術(shù)論文中統(tǒng)計學(xué)分析方法的應(yīng)用情況進行了抽樣調(diào)查和分析,分析常見的統(tǒng)計分析方法缺陷的原因,為提高論文的學(xué)術(shù)水平提供有益的建議。
資料與方法1.1 資料一般情況資料采用中國知網(wǎng)文獻數(shù)據(jù)庫中的"基礎(chǔ)科學(xué)"及"醫(yī)藥衛(wèi)生科技"數(shù)據(jù)庫的全部文獻作為抽樣源,限定時間為2014年11月10日-2017年11月10日進行檢索。近3年共檢索出文獻1 456 417篇,其中2017年535 250篇(2016年11月10日-2017年11月10日)、2016年795 074篇(2015年11月10日-2016年11月09日)、2015年126 093篇(2014年11月10日-2015年11月09日)。
1.2 文獻抽取方法運用SPSS20.0軟件包生成300個隨機數(shù),利用隨機數(shù)在2015到2017年這3年的所有文獻中,每年各隨機抽取100篇文獻進行統(tǒng)計學(xué)質(zhì)量評價,具體方法為以中國知網(wǎng)搜索引擎搜出的文獻的默認順序號為基準,用隨機數(shù)進行對應(yīng)抽取。抽樣過程中,隨機種子設(shè)為20171110,執(zhí)行RAND函數(shù)。
1.3 統(tǒng)計學(xué)路徑設(shè)想統(tǒng)計學(xué)誤用往往導(dǎo)致非常嚴重的后果,如結(jié)論錯誤、數(shù)據(jù)造假、丟失有價值的數(shù)據(jù)信息等,醫(yī)學(xué)科研中的統(tǒng)計學(xué)缺陷可能違背醫(yī)學(xué)倫理學(xué)要求,甚至可能導(dǎo)致不良的臨床后果[]。但同時應(yīng)該注意到的是,臨床專業(yè)人員對統(tǒng)計學(xué)的執(zhí)行不夠嚴格,特別是統(tǒng)計學(xué)的基本理論欠缺,不能正確的選擇統(tǒng)計學(xué)方法,筆者針對這一問題,創(chuàng)建統(tǒng)計學(xué)路徑理論和問答式計算機系統(tǒng),配有專門的統(tǒng)計學(xué)軟件操作視頻進行指導(dǎo),目的是讓臨床醫(yī)生不必過多了解統(tǒng)計學(xué)基本理論就能正確的選擇統(tǒng)計學(xué)方法,利用"傻瓜式一站統(tǒng)計"助力臨床科研。相信可以降低統(tǒng)計學(xué)缺陷的產(chǎn)生。
結(jié)果2.1 前十名雜志的一般特征300篇文獻中涉及使用統(tǒng)計學(xué)研究方法的有126篇,其中2017年35篇、2016年50篇、2015年41篇。將抽選數(shù)量排名前的十位雜志列表顯示,抽樣文獻中選自《中國婦幼健康研究》共有29篇,占41.43%。抽樣分析中刊物級別省級和國家級大致均衡。本文的影響因子一般都在0.5~1之間,國內(nèi)文獻影響因子不高。其中影響因子最高的是《武漢大學(xué)學(xué)報》雜志,影響因子為1.321。
2.2 期刊中的統(tǒng)計學(xué)缺陷分析國內(nèi)外研究者通過調(diào)查發(fā)現(xiàn),在現(xiàn)代醫(yī)學(xué)期刊中,統(tǒng)計方法的運用及表述存在著較多的問題[],本次分析中發(fā)現(xiàn)的問題如下,如表1所示:
表12015-2017年抽取的文獻中統(tǒng)計學(xué)缺陷舉例(n=189)
2.2.1 未標注P值 假設(shè)檢驗時,可由樣本數(shù)據(jù)計算出該統(tǒng)計量的值,根據(jù)檢驗統(tǒng)計量的具體分布,可求出P值。[]根據(jù)抽樣發(fā)現(xiàn),抽樣得到的300篇文獻中,共有41.27%的文獻沒有標注P值,建議給出假設(shè)檢驗的精確P值而不是僅僅表達為"P>0.05"或"P<0.05"。P值與概率密切相關(guān),其含義是樣本間的差異由抽樣誤差所致的概率大小,所以精確標明P值,對假設(shè)檢驗的判斷還是比較有意義的。
P值的習慣表述是,P>0.05稱組間差異不顯著,P≤0.05稱組間差異顯著,這里的"顯著"是統(tǒng)計學(xué)的一個術(shù)語,指觀察結(jié)果統(tǒng)計量實際代表的總體參數(shù)與原假設(shè)總體參數(shù)在概率意義上的"顯著"偏離。P值越小,拒絕原假設(shè)的統(tǒng)計學(xué)依據(jù)越充分,但不能理解為P值越小,試驗結(jié)果本身越有意義[]。
2.2.2 未標注統(tǒng)計量 在進行統(tǒng)計分析時,應(yīng)根據(jù)不同的分析方法給出相應(yīng)的檢驗統(tǒng)計量。[]統(tǒng)計量是計算P值的重要依據(jù),也是判斷P值的重要參考,論文中應(yīng)同時標注統(tǒng)計量和P值。我們的研究發(fā)現(xiàn)有許多文獻在分析中并未給出統(tǒng)計量,而僅僅給出P值,這樣的問題占比40.21%。大大降低了論文的科學(xué)性和嚴謹性。
2.2.3 希臘字母χ2(卡方)用X2表示,科研有欠嚴謹 研究發(fā)現(xiàn)有11.6%的的卡方檢驗的希臘字母χ用英文字母用X表示,體現(xiàn)科研工作欠嚴謹。
2.2.4 方差分析未考慮方差齊性 方差分析的前提條件是資料要服從獨立、正態(tài)和方差齊性。在本次調(diào)查中發(fā)現(xiàn),方差分析中針對獨立性和正態(tài)性控制的較好,對方差齊性檢驗尚存在欠缺,有2.65%的研究沒有明確考慮方差齊性。在統(tǒng)計工作中,如方差齊采用LSD等方法進行兩兩比較,如果方差不齊,應(yīng)對變量進行處理:(1)用非參數(shù)檢驗方法;(2)用近似法;(3)采用變量變換法,使其方差呈齊性[]。
2.2.5 未考慮正態(tài)檢驗 數(shù)據(jù)的正態(tài)性檢驗是參數(shù)檢驗的基礎(chǔ),所以數(shù)據(jù)是否服從正態(tài)比較重要,本次研究中,有1.59%的研究沒有考慮數(shù)據(jù)的正態(tài)性檢驗。正態(tài)性檢驗可采用繪制PP圖、QQ圖進行觀測,也可以采用假設(shè)檢驗的方法計算P值,是數(shù)據(jù)分析中的一個比較重要的步驟。統(tǒng)計學(xué)的中大部分參數(shù)檢驗均存在數(shù)據(jù)正態(tài)性假設(shè)的統(tǒng)計前提,不進行正態(tài)性檢驗就貿(mào)然選用參數(shù)統(tǒng)計的假設(shè)檢驗方法無疑進入了統(tǒng)計方法誤用的誤區(qū)。
2.2.6 數(shù)據(jù)建模中無模型評價,直接給出建模結(jié)果,導(dǎo)致建模參數(shù)表達沒有依據(jù) 抽樣中共有3篇文獻建模,均未出現(xiàn)建模評價,同時應(yīng)該注意的是,模型建立的好壞直接關(guān)系到數(shù)據(jù)建模的結(jié)果,是數(shù)據(jù)結(jié)果的基礎(chǔ),在文獻中,基本都沒有對統(tǒng)計模型建模評價的說明,是統(tǒng)計上的一個缺陷。
2.2.7 配對資料采用獨立資料的檢驗方法 有些醫(yī)學(xué)論文采用配對設(shè)計卻誤用了獨立設(shè)計資料的t檢驗,配對t檢驗適用于配對設(shè)計的資料[12]。配對t檢驗的原理是對每對數(shù)據(jù)的差值做與0比較的單樣本t檢驗,例如觀察對象屬于干預(yù)前后對比(治療前后、檢查前后等)和同體同源對比(同一觀察對象兩種干預(yù)方法)的兩組資料,作統(tǒng)計學(xué)處理時應(yīng)采用配對t檢驗,如果用組間獨立樣本檢驗,其更易獲得本應(yīng)沒有意義的結(jié)論得到有意義的結(jié)論,范統(tǒng)計學(xué)上的第II類錯誤,特別是在顯著性臨界狀態(tài)時更明顯[。同時在進行配對檢驗時,除了描述配對樣本的一般情況(如均數(shù)和標準差)、該出假設(shè)檢驗統(tǒng)計量和P值外,也應(yīng)注意給出組間差值的均差及其95%可信區(qū)間,作為統(tǒng)計結(jié)論的重要依據(jù)。
討論臨床醫(yī)生對統(tǒng)計學(xué)的掌握程度并不高,在科研統(tǒng)計學(xué)方法的選擇上存在問題,讓臨床醫(yī)生了解復(fù)雜統(tǒng)計理論存在一定的現(xiàn)實困難,筆者團隊創(chuàng)建臨床科研統(tǒng)計簡易路徑,方便研究者使用。研究者在使用時,只要通過了解該路徑右側(cè)的幾個名詞解釋,就能正確選擇統(tǒng)計方法,研究團隊為各種統(tǒng)計方法制做了SPSS軟件操作視頻,供使用者學(xué)習,統(tǒng)計路徑如圖1所示。
圖1臨床科研統(tǒng)計學(xué)簡易路徑
同時,筆者團隊將這一路徑做成了超鏈接形式,使用者采用人機對話形式回答電腦給出的問題就可以找到正確的統(tǒng)計學(xué)方法。并針對臨床研究人員對SPSS操作不熟練的特點,在相應(yīng)的統(tǒng)計學(xué)方法中給出了一站式解決方案,具體為首先用Excel組織數(shù)據(jù),然后將數(shù)據(jù)導(dǎo)入到SPSS中,通過執(zhí)行我們所給出的SPSS語句就可以實現(xiàn)統(tǒng)計操作,減少研究者的軟件操作過程,切實解決了研究者統(tǒng)計應(yīng)用問題,此人機對話電腦系統(tǒng)能夠成為臨床醫(yī)生的統(tǒng)計助手,人機對話軟件如圖2所示。
圖2人機對話形式的統(tǒng)計學(xué)路徑選擇
提高醫(yī)學(xué)期刊中論文的統(tǒng)計學(xué)質(zhì)量是一項艱巨而又持久的系統(tǒng)工程,需要各界人士(作者、編輯、審稿者、讀者、期刊管理者等)的共同努力[]。筆者只是對醫(yī)學(xué)論文中常見統(tǒng)計學(xué)概念方面的誤用情況做了簡單的分析和總結(jié),限于篇幅,不能詳細概括出問題的全部。但有一點是很明確的,即作者只有提高認識,才能在醫(yī)學(xué)研究中自覺地運用統(tǒng)計學(xué)原理進行醫(yī)學(xué)資料的科學(xué)收集、整理和分析。本文通過分析總結(jié)近3年相關(guān)文獻中統(tǒng)計學(xué)分析方法的應(yīng)用情況進行了抽樣調(diào)查和分析,分析常見的統(tǒng)計分析方法缺陷的原因,并開發(fā)了科研統(tǒng)計輔助工具以幫助醫(yī)學(xué)科研工作者提高科研水平。重視數(shù)據(jù)在科研中的作用。這就需要從源頭抓起,提高作者的統(tǒng)計學(xué)處理能力[]。
關(guān)注“醫(yī)學(xué)科研管理空間”
總結(jié)
以上是生活随笔為你收集整理的在统计学中参数的含义是指_期刊论文中科研统计学缺陷分析及解决路径的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SpringBoot配置文件绑定到Jav
- 下一篇: 虚拟环境创建,pip管理包