如何分析临床大数据
隨著行政數(shù)據(jù)庫和患者登記注冊數(shù)據(jù)庫的有如雨后春筍般地出現(xiàn),研究人員越來越容易獲得大數(shù)據(jù)。這些數(shù)據(jù)集的大樣本量使對罕見結(jié)果的研究更加容易,并提供了確定國家估算值和地區(qū)差異的潛力。因此,JAMA外科編輯和審稿人已經(jīng)收到使用大數(shù)據(jù)去試圖回答臨床和政策相關(guān)問題的稿件。但是,沒有數(shù)據(jù)庫完全沒有偏倚和測量誤差的。對于更大的數(shù)據(jù),一些隨機(jī)現(xiàn)象也可能產(chǎn)生統(tǒng)計(jì)學(xué)差異的結(jié)果,并且由于窄的置信區(qū)間,統(tǒng)計(jì)推斷也可能產(chǎn)生一個精確但是不準(zhǔn)確的結(jié)果。上述問題在所有臨床研究都會遇到,但是在大樣本、復(fù)雜數(shù)據(jù)庫中,這些方法學(xué)的問題將被放大。
關(guān)于研究人群的注意事項(xiàng)
對讀者而言,重要的是要了解研究者是如何得到研究人群。通常,它根據(jù)納入標(biāo)準(zhǔn)從一個非常龐大的源來源人群篩選得到。統(tǒng)計(jì)報(bào)告時,應(yīng)當(dāng)清楚地描述納入和排除參與者的流程圖,其中要寫出包括排除的人數(shù)和排除原因。同樣,如果研究是縱向研究,應(yīng)報(bào)告失訪現(xiàn)象和失訪人數(shù),這樣有助于讀者理解該研究可能存在著選擇偏倚。
關(guān)于研究方法和樣本量注意事項(xiàng)
研究的目的和結(jié)局指標(biāo)應(yīng)在數(shù)據(jù)收集和分析之前確定。如果作者正在尋找兩組人群之間某些變量的差異,則該差異及其置信區(qū)間的統(tǒng)計(jì)分析也應(yīng)預(yù)先計(jì)劃。除了統(tǒng)計(jì)結(jié)果(例如回歸系數(shù),P值)外,效應(yīng)值的差異應(yīng)報(bào)告以患者為中心、具有臨床意義且可解釋的差異。不幸的是,在沒有預(yù)先計(jì)劃的情況下挖掘大型數(shù)據(jù)集會導(dǎo)致無意的、常常是錯誤的結(jié)論。統(tǒng)計(jì)學(xué)差異(P值)與樣本量有關(guān),并且如果樣本量足夠大,則各組之間的即使差異很小,也會顯示統(tǒng)計(jì)學(xué)上的差異來(P<0.05),然而這些差異很可能在臨床上沒有意義。
文章剩余內(nèi)容<<<<
與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖總結(jié)
- 上一篇: 为何ChatGPT的计算能力有限制?
- 下一篇: 一文搞懂临床研究常见类型