生信宝典文章集锦
定義和應(yīng)用生物信息學(xué)的核心能力以改善生物信息學(xué)的培訓(xùn)和教育
摘要
在生物醫(yī)學(xué)研究和建庫保健中, 生物信息學(xué)被認(rèn)為是許多職業(yè)道路的基本知識。但是,在領(lǐng)域內(nèi),對于生信知識的含義和如何最好地提供知識幾乎沒有共識。而且希望掌握這些知識的人群有不同的背景和不同的應(yīng)用目的,使得分歧加劇。有著不同背景和預(yù)期的應(yīng)用領(lǐng)域的大量需要生物信息學(xué)培訓(xùn)的人群,加劇了這些分歧。國際計算生物學(xué)學(xué)會(ISCB)教育委員會通過多方調(diào)查提供了生物信息學(xué)能力的評價標(biāo)準(zhǔn)、培訓(xùn)需求和課程框架,以便在一系列跨越許多用戶角色和培訓(xùn)計劃的生物信息學(xué)核心能力培訓(xùn)方面提供支持。
對生物信息學(xué)教育和培訓(xùn)的需求是巨大的,也是多樣的。目前存在廣泛的潛在培訓(xùn)受眾,每個人在需要什么樣的技能或知識以及深度上有不同的需求。
例如,若有人想成為一名生物信息學(xué)工程師(定義為一個積極參與生物信息學(xué)算法的開發(fā)和應(yīng)用的人)需要對現(xiàn)有算法有深入的認(rèn)識,理解它們是怎么運行的,怎么批判性地評估它們,以及如何去解釋結(jié)果。相比之下,一個生物信息學(xué)應(yīng)用者(定義為在某個背景如醫(yī)療實踐下應(yīng)用生物信息學(xué)資源的人)需要對方法的基本理解和對輸出的重點強(qiáng)調(diào)。
Label Competency
A General biology
B Depth in at least one area of biology (e.g., evolutionary biology, genetics, molecular biology, biochemistry,
anatomy, physiology).
C Biological data generation technologies.
D Details of the scientific discovery process and of the role of bioinformatics in it.
E Statistical research methods in the context of molecular biology, genomics, medical, and population genetics
research.
F Bioinformatics tools and their usage.
G The ability of a computer-based system, process, algorithm, component, or program to meet desired needs
in scientific environments/problem.
H Computing requirements appropriate to solve a given scientific problem (e.g., system, process, algorithm,
component or program; define algorithmic time and space complexities and hardware resources required to
solve a problem).
I GUI/Web-based computing skills appropriate to the discipline (e.g., effectively use bioinformatics and
analysis tools through web).
J Command line and scripting based computing skills appropriate to the discipline.
K Construction of software systems of varying complexity based on design and development principles.
L Local and global impact of bioinformatics and genomics on individuals, organizations, and society.
M Professional, ethical, legal, security, and social issues, and responsibilities of bioinformatics and genomic
data in the workplace.
N Effective communication of bioinformatics and genomics problem/issue/topics with a range of audiences,
including, but not limited to, other bioinformatics professionals.
O Effective teamwork to accomplish a common scientific goal.
P Engage in continuing professional development in bioinformatics.
生物信息學(xué)的核心能力的開發(fā)
正如ISCB課程任務(wù)組的一系列報告所述,他們承擔(dān)了確定一些生物信息學(xué)教育需求的廣度的任務(wù)。這項工作首先來自對當(dāng)前培訓(xùn)實踐和期望培訓(xùn)需求的一系列調(diào)查[2],這項調(diào)查確定了一系列廣泛的培訓(xùn)需求,而且在所教授的課程,如何以及為什么預(yù)期的目標(biāo)受眾有廣泛的差異。這些調(diào)查的結(jié)果是需要確定一套核心能力作為跨越不同計劃和培訓(xùn)需求的廣泛類別的技能和培訓(xùn),并且可以為討論計劃與預(yù)期成果之間的相似點和差異點提供基礎(chǔ)。這促進(jìn)了進(jìn)一步的工作,來確定一系列最初的核心能力[3],從而引發(fā)了一個密集的社區(qū)參與計劃,以提高這些能力,來更好地滿足生物信息學(xué)培訓(xùn)社區(qū)的廣泛需求。
核心能力的發(fā)展主要有三個步驟:(1)定義使用生物信息學(xué)所需的能力,(2)定義描述需要訓(xùn)練的不同子群的各種用戶配置文件,以及(3)定義能力將如何適用于每個用戶配置文件(評分)。核心能力框架是通過一個反復(fù)的過程開發(fā)的,此過程有來自不同與生物信息學(xué)有關(guān)的背景的多方參與。為了更廣泛地了解生物信息學(xué)界認(rèn)為哪些能力適用于不同生物信息學(xué)用戶的概況,ISCB課程任務(wù)組已經(jīng)在ISCB會議和其他生物信息學(xué)教育場所舉辦了多個能力研討會(定義能力及其應(yīng)用的討論會) ,如GOBLET(全球生物信息學(xué)習(xí),教育和培訓(xùn)組織)年度大會等。能力工作車間的每次重復(fù)不僅極大地提高了能力本身,而且還極大地提高了用戶配置文件[1]和能力使用案例評分機(jī)制的定義。
最初,將生物信息能力映射到受眾考慮了三個主要用戶配置文件:(1)生物信息學(xué)用戶;(2)生物信息科學(xué)家;以及(3)生物信息學(xué)工程師。早期的能力研討會很快就推測,這些用戶檔案分類太狹窄,而且并沒有充分地捕捉需要生物信息學(xué)能力和課程的人群的廣度。參與者花費了大部分的時間來定義生物信息學(xué)用戶或從生物信息學(xué)工程師中區(qū)分生物信息學(xué)科學(xué)家。隨后擴(kuò)大了用例角色,以更好地體現(xiàn)生物信息學(xué)用戶的廣泛性,包括醫(yī)生,實驗室技術(shù)人員,倫理學(xué)家和生物專家,科學(xué)家(包括發(fā)現(xiàn)生物學(xué)家,學(xué)術(shù)生物信息學(xué)研究人員和核心設(shè)施科學(xué)家)和工程師(可能是學(xué)術(shù)界的生物信息學(xué)家,研究機(jī)構(gòu)的生物信息學(xué)家或軟件工程師)。這個改變允許隨后的研討會參與者根據(jù)他們最佳識別的用戶類別自行選擇。
隨著用戶配置文件的定義更加清晰,能力研討會隨后與能力本身及其定義進(jìn)行了斗爭。 幾個早期的能力定義似乎有所重疊。例如,“運用適用于該學(xué)科的計算知識(例如,有效地利用生物信息學(xué)工具)”非常類似于“分析問題并確定和定義適合其解決方案的計算要求(例如,定義算法的時間和空間復(fù)雜性以及硬件資源需要解決一個問題)”。研討會參與者幫助我們將最初的生物信息學(xué)能力的冗余度從20個能力降低到16個能力的精煉集。
能力研討會還有助于修改每個用戶檔案的能力評分。早期的研討會通過簡單的是/否回答,將生物信息學(xué)能力的適用性評定為特定的個人資料,這不能讓人們對特定個人資料所需的能力深度進(jìn)行評估。這樣的評分方法雖然好于不評分,但在為特定用戶檔案開發(fā)課程時并不會有所幫助。隨后的研討會采用分?jǐn)?shù)評分方法,評分從1(不需要能力)到4(需要專業(yè)知識)。這也被證明太模糊,不能進(jìn)行有意義的討論和分類。評分方法因此再次修改為當(dāng)前的模型,該模型使用Bloom的修訂版分類[4]術(shù)語:知識,理解,應(yīng)用,分析,綜合和評估。雖然Bloom的分類標(biāo)準(zhǔn)在將能力水平映射到每個用戶檔案時很有用,但是這種變化需要對能力列表進(jìn)行細(xì)化,因為早期的一些能力中包含了Bloom的分類標(biāo)準(zhǔn)術(shù)語。
總的來說,能力研討會對于提高和改進(jìn)生物信息學(xué)能力是非常有價值的。通過這些研討會,ISCB課程任務(wù)組已經(jīng)能夠構(gòu)建一套有用的生物信息學(xué)能力,課程開發(fā)人員可以使用這些能力來開發(fā),比較和評估針對廣泛受眾的有影響力的生物信息學(xué)培訓(xùn)計劃,并最終幫助這些受眾建立生物信息學(xué)技能 [3]。
表1報告了通過這種社區(qū)參與過程制定和完善的能力的現(xiàn)狀。表2-4將這些精煉的能力映射到更廣泛的人物角色,在課程任務(wù)組的社區(qū)參與工作的過程中,通過Bloom的分類學(xué)術(shù)語提出。作為參考,表5提供了Bloom修訂后的分類術(shù)語的例子和定義。在下一節(jié)中,我們將舉例說明如何在多種培訓(xùn)環(huán)境中應(yīng)用能力。
使用案例
為了更好地說明能力的使用,我們在這里提出了一系列簡短的使用案例 —— 在定義,改進(jìn)或評估生物信息學(xué)培訓(xùn)機(jī)制方面,能力已經(jīng)被證明是有價值的。選擇這些使用案例是為了強(qiáng)調(diào)不同的培訓(xùn)需求,用戶角色,培訓(xùn)計劃類型和教育環(huán)境。本著這種精神,我們將舉例分為三類:(1)完整的學(xué)位課程,其能力已被證明對整體課程設(shè)計或改進(jìn)有價值(2)對現(xiàn)有學(xué)位課程的補(bǔ)充(即專業(yè),經(jīng)歷,證書);以及(3)具體學(xué)位課程以外的培訓(xùn)資源。
學(xué)位課程
非洲介紹和掌握生物信息學(xué)培訓(xùn):H3ABioNet。H3ABioNet(www.h3abionet.org)是泛非生物信息學(xué)網(wǎng)絡(luò),為非洲人類遺傳與健康協(xié)會(www.h3africa.org)的非洲科學(xué)家制定了生物信息學(xué)培訓(xùn)計劃。這涉及到廣泛受眾的生物信息學(xué)培訓(xùn),主要是在基因組數(shù)據(jù)分析,以及培養(yǎng)生物信息學(xué)科學(xué)家的新生物信息學(xué)學(xué)位的發(fā)展。雖然在非洲有一些機(jī)構(gòu)提供生物信息學(xué)研究生學(xué)位,但這僅限于少數(shù)幾個國家,許多其他機(jī)構(gòu)表示希望開發(fā)和提供這樣的學(xué)位,以培養(yǎng)下一代生物信息學(xué)學(xué)者。隨著課程任務(wù)組的成立,非洲建立了一個生物信息學(xué)教育委員會,負(fù)責(zé)設(shè)計一門生物信息學(xué)碩士課程。主題領(lǐng)域是從現(xiàn)有的碩士課程和提出的課程[3]中選擇的。從這些基礎(chǔ)上,根據(jù)研究重點,定義核心模塊并增加與特定機(jī)構(gòu)相關(guān)的其他選修模塊。課程任務(wù)組然后充實了每個模塊的詳細(xì)內(nèi)容,并開始將這些內(nèi)容映射到生物信息學(xué)專家所需的核心能力。盡管一些碩士課程的重點可能不同于更強(qiáng)調(diào)軟件工程的生物學(xué),但所有生物信息學(xué)碩士畢業(yè)生都應(yīng)該具備共同的能力。雖然一些非洲機(jī)構(gòu)有特定的研究重點領(lǐng)域,但這種感覺是所有接受生物信息學(xué)培訓(xùn)的學(xué)生都應(yīng)該接觸到一套符合ISCB建議的核心主題,而選修科目則傾向于依賴研究重點。這門擬議的課程已經(jīng)付諸實施,至少有兩所大學(xué)在過去的兩年里開始了他們的第一個碩士課程。
對于生物信息學(xué)用戶,H3ABioNet已成功開放多個專業(yè)短期課程,培訓(xùn)研究人員進(jìn)行子代序列分析,宏基因組學(xué),基因組關(guān)聯(lián)研究及其他主題。然而,通過與用戶的交互,出現(xiàn)了越來越多對基本的“生物信息學(xué)介紹”培訓(xùn)的需求。作為回應(yīng),H3ABioNet開發(fā)了一個生物信息學(xué)課程介紹課程,可以遠(yuǎn)程交付到多個國家的教室。課程主要來源于碩士課程使用的主題,但這次將其映射到了生物信息學(xué)用戶的能力,并以建?;蚓幊虨橹攸c來移除主題。因此,這些受眾的能力更關(guān)注于對該主題的基本理解,示例算法以及這些工具如何應(yīng)用于回答生物問題。實際操作還旨在使用戶能夠使用各種工具瀏覽并學(xué)習(xí)解釋輸出。此課程于2016年首次成功實行,并經(jīng)評估以確定所需核心能力是否已獲得。
利用上述兩種情況下的核心能力,課程組織者可以根據(jù)目標(biāo)受眾更好地定義每個模塊的詳細(xì)內(nèi)容,聯(lián)系時間和重點。我們也可以使用能力來定義學(xué)習(xí)成果并完善模塊評估。
美國研究型大學(xué)的本科和研究生學(xué)位課程:卡內(nèi)基梅隆大學(xué)計算生物學(xué)教育。卡內(nèi)基梅隆大學(xué)長期以來一直積極參與計算生物學(xué)和生物信息學(xué)教育,考慮到一般能力如何應(yīng)用,為不同人群提供了少數(shù)機(jī)會。這些經(jīng)驗包括計算生物學(xué)學(xué)位課程,包括計算生物學(xué)學(xué)士學(xué)位(自1989年起),計算生物學(xué)碩士學(xué)位(自1999年起),計算生物學(xué)博士學(xué)位(自2005年起與匹茲堡大學(xué)共同提供), 并要求在計算生物學(xué)方面進(jìn)行培訓(xùn),作為生物科學(xué)學(xué)士學(xué)位的核心部分,這是該大學(xué)的普通本科生物學(xué)專業(yè)。雖然所有這些課程都早于ISCB的能力,但考慮這些課程如何使學(xué)生在計算生物學(xué)方面的工作有不同程度的準(zhǔn)備,這些能力為此奠定了基礎(chǔ)。其中兩個項目——生物科學(xué)學(xué)士學(xué)位和計算生物學(xué)博士——被作為具有十分不同的學(xué)生人群和培訓(xùn)需求的項目進(jìn)行討論,這些項目可以根據(jù)能力進(jìn)行評估。
卡內(nèi)基梅隆大學(xué)的生物科學(xué)學(xué)士學(xué)位,展示了一種生物信息學(xué)培訓(xùn):主要培養(yǎng)學(xué)生在實驗生物學(xué)方面的工作??▋?nèi)基梅隆大學(xué)在2013年把“計算生物學(xué)導(dǎo)論”(ICB)作為每個本科生物科學(xué)專業(yè)的核心要求,這仍是不尋常的一步,它提供了一個機(jī)會,來探索如何設(shè)計一個班級是可訪問的,但是對一般生物學(xué)學(xué)生群體又是嚴(yán)格和有用的。因此,應(yīng)用這些能力需要學(xué)生有一門計算生物學(xué)課程的學(xué)習(xí)背景,同時又學(xué)習(xí)了完整的本科生物學(xué)課程。在一個計算生物學(xué)課程(C,D,F,I,J;見表1)中,在一個計算生物課上,一個實驗生物學(xué)家所需要的水平可以很好地涵蓋某些能力,主要是那些專注于計算生物學(xué)技術(shù)方面的能力。在其他重要領(lǐng)域,如更傳統(tǒng)的生物學(xué)知識,一些能力完全涵蓋在了本科生物科學(xué)課程的其他領(lǐng)域中,如遺傳學(xué),生物化學(xué)或細(xì)胞生物學(xué)(A,B)等更傳統(tǒng)的核心課程中都有詳細(xì)介紹。還有一些,如通信和職業(yè)發(fā)展中廣泛涉及的主題,在課程的其他地方通過課堂內(nèi)外的各種機(jī)制(M,N,O,P)被涵蓋到。還有一些領(lǐng)域超出了一門基礎(chǔ)課程的范圍,但在別處也沒有涉及。其中一些(G,H,K)是這類人群可能不需要的能力,但可以在ICB的修訂版中加以考慮。最有意思的主題是那些對于實驗生物學(xué)家至關(guān)重要的主題,它們在ICB中沒有被充分涵蓋,在其他地方(E,即生物統(tǒng)計學(xué))也沒有涉及。ICB給后者提供了足夠的覆蓋范圍,可以傳達(dá)生物信息學(xué)工作所需要的關(guān)鍵思想,但能力標(biāo)志著它成為一個整體課程需要進(jìn)一步發(fā)展的領(lǐng)域。
匹茲堡大學(xué)和卡內(nèi)基梅隆大學(xué)在計算生物學(xué)方面的聯(lián)合博士在另一個極端提供了例子:為期望成為計算生物學(xué)專家的學(xué)生,期望能夠領(lǐng)導(dǎo)獨立研究計劃的畢業(yè)生而制定的全年多年培訓(xùn)計劃, 在該領(lǐng)域教授計算生物學(xué),運行生物信息學(xué)核心設(shè)施,或追求類似要求的工作。與更傳統(tǒng)的學(xué)位課程相比,計算生物學(xué)課程面臨著一個特殊的挑戰(zhàn),即在本科層面缺乏明確的培訓(xùn)標(biāo)準(zhǔn),這意味著除了在生物學(xué)、計算機(jī)、數(shù)學(xué)方面的基礎(chǔ)能力之外,沒有什么人可以確保入學(xué)學(xué)生的背景知識。此外,由于博士課程是以研究為重點,面臨著學(xué)位時間限制的壓力,正式培訓(xùn)只能占用學(xué)生有限的時間,相當(dāng)于大約一年的全日制課程。在一定程度上,該方案可以依靠招生標(biāo)準(zhǔn),補(bǔ)救和自學(xué)來確保所有學(xué)生有基礎(chǔ)知識(A,F,I,J)。一些能力可以通過靈活的基于目錄的要求來處理,以適應(yīng)每個學(xué)生的個人需求和背景(B)的方式滿足能力要求。在另外一些學(xué)生中,每個學(xué)生都需要高水平的能力,而且必須為這類人群專門設(shè)計核心課程(C,D,E,G,H)。其他課程必須通過專業(yè)的開發(fā)機(jī)制以及論文顧問(K,L,M,N,O,P)的一對一輔導(dǎo)來實現(xiàn)。盡管如此,一些學(xué)生的能力,特別是依賴研究顧問指導(dǎo)的能力,可能會比其他學(xué)生更有效地獲得。這些能力再次表明,這些主題應(yīng)該被標(biāo)記出來,以便在將來進(jìn)行更正式的培訓(xùn)。此外,這個計劃面對的新來的學(xué)生的知識背景的挑戰(zhàn)表明,在本科階段接受能力的水平,可以使其在研究生階段最有效地利用時間。
澳大利亞大學(xué)的本科培訓(xùn):新南威爾士大學(xué)(UNSW)的生物信息學(xué)工程教育。新南威爾士大學(xué)(UNSW)(澳大利亞悉尼)擁有工程學(xué)(生物信息工程)學(xué)士學(xué)位課程,旨在幫助畢業(yè)生設(shè)計和實現(xiàn)生物信息學(xué)計算系統(tǒng),包括軟件算法以及數(shù)據(jù)管理和分析基礎(chǔ)設(shè)施。BE(生物信息工程)學(xué)位始于2001年,是澳大利亞歷史最悠久的本科生物信息學(xué)課程。它被澳大利亞工程師統(tǒng)一認(rèn)可為工程學(xué)位:在所有簽署華盛頓協(xié)議的國家,其畢業(yè)生都被認(rèn)為是入門級工程師,這是一個負(fù)責(zé)認(rèn)證工程學(xué)學(xué)位課程的機(jī)構(gòu)之間的國際協(xié)議[6]。該方案定期修訂,以保持其相關(guān)性,并由外部工程師每5年進(jìn)行一次審查,以確保符合認(rèn)證標(biāo)準(zhǔn)。課程內(nèi)容與ISCB和Engineers Australia核心能力以及大學(xué)畢業(yè)生屬性的課程映射是這一過程中的關(guān)鍵步驟。
該流程從整個課程層面開始,通過確定程序中的哪些課程可以顯著地解決特定的核心能力。 然后,針對每個核心能力,對相關(guān)課程的學(xué)習(xí)成果進(jìn)行審核和完善,以應(yīng)對這一能力。評估活動根據(jù)核心能力而定制,以確保在課程結(jié)束時,學(xué)生能夠證明他們達(dá)到了足夠的熟練程度。 每個核心能力都要重復(fù)這個過程,從而形成一個能力映射到課程的矩陣。此矩陣可能會顯示出不足之處,可以通過修改或替換課程來解決。 例如,在最近的修訂版本中,該程序被修改為用通用的選修課程來替代額外的設(shè)計項目課程和軟件工程研討會。為了便于評估與核心能力和本科生屬性相關(guān)的課程,學(xué)校的學(xué)術(shù)信息管理系統(tǒng)要求每個課程的描述都包括課程學(xué)習(xí)成果與評估任務(wù)和核心能力的映射。然后可以為每個課程在整個程序級別上自動生成能力映射矩陣。通過涉足每個核心能力學(xué)習(xí)成果的例子來擴(kuò)大ISCB課程指導(dǎo)方針將有助于這種分析,并提高課程設(shè)計和評估能力的有用性。
UNSW除了擁有存在已久的生物信息學(xué)工程學(xué)士學(xué)位之外,最近還推出了一個生物信息學(xué)學(xué)士學(xué)位,主修強(qiáng)調(diào)使用現(xiàn)有的生物信息學(xué)方法進(jìn)行生物學(xué)發(fā)現(xiàn),而不是設(shè)計新的生物信息學(xué)方法。 核心能力被用來指導(dǎo)程序的設(shè)計,通過確定與工程計劃(B,C和D)相關(guān)以及那些成就水平較低(G,H,J,K,M,O)的強(qiáng)調(diào)能力是否可接受。這反過來又引導(dǎo)了理學(xué)士學(xué)位課程的選擇。
一個小型文化藝術(shù)學(xué)院的生物信息學(xué)本科學(xué)位:圣文森特學(xué)院。賓夕法尼亞州西部的小型文化藝術(shù)學(xué)院——圣文森學(xué)院的生物信息學(xué)項目于2005年啟動。該方案規(guī)模小,專業(yè)人員不足20人,但從2009年至今每年至少有一名學(xué)生畢業(yè)。 最初,學(xué)士學(xué)位只有一套必修課程,其中包括編程(C ++),數(shù)據(jù)結(jié)構(gòu),離散結(jié)構(gòu),數(shù)據(jù)庫引進(jìn),生物統(tǒng)計學(xué),細(xì)胞生物學(xué),分子遺傳學(xué),基因組學(xué)和生物醫(yī)學(xué)信息學(xué)等課程。還有一個頂尖的三學(xué)期研究項目。 粗略地說,有三類學(xué)生參加了這個項目:(1)既具有生物學(xué)又有計算能力且都擅長的學(xué)生;(2)喜歡生物學(xué),但掙扎于編程課程的學(xué)生;以及(3)喜歡編程,但又掙扎于上層生物學(xué)課程的學(xué)生,特別是在實驗室中。該計劃傾向于將后兩組中的學(xué)生從此項目轉(zhuǎn)向生物學(xué)或計算機(jī)科學(xué)。 因此,在2013年,他們將課程分成兩個方向——生物學(xué)和計算機(jī)——以試圖吸納這些群體中的學(xué)生,并讓他們留在專業(yè)的學(xué)習(xí)領(lǐng)域。大約三分之二的課程在這兩個方向之間很常見,但是,例如,生物學(xué)方向只需要一個學(xué)期的C ++編程而計算機(jī)方向需要三個學(xué)期。
2015年,該計劃進(jìn)行了全面的計劃審查,包括內(nèi)部和外部審查人員。作為該計劃的初始報告的一部分,ISCB核心能力被用作評估課程和學(xué)生培訓(xùn)的標(biāo)準(zhǔn),這一點非常寶貴,因為如果沒有它們,則很難找到一種方法來根據(jù)外部標(biāo)準(zhǔn)評估課程的優(yōu)劣。審查中提出的其中一個問題是專業(yè)的學(xué)習(xí)目標(biāo),以及如何與這兩方向相關(guān),因為在實行這兩方向時,學(xué)習(xí)目標(biāo)沒有得到修訂。 粗略地說,這兩方向?qū)?yīng)于生物信息學(xué)用戶和生物信息學(xué)科學(xué)家的ISCB角色。根據(jù)能力考察,這些問題突出了小型課程的主要挑戰(zhàn):如何適應(yīng)兩種類型的學(xué)生,限制教師的數(shù)量,如何適應(yīng)不同部門提供的課程類型,招生等。
認(rèn)證,方向和專業(yè)化
認(rèn)證課程和專業(yè):俄亥俄大學(xué)。俄亥俄大學(xué)在本科生和研究生階段均提供生物信息學(xué)證書。 另外,BS,MS和PhD學(xué)位的計算機(jī)科學(xué)專業(yè)的學(xué)生可以通過選擇包含適當(dāng)?shù)纳飳W(xué)和生物信息學(xué)課程的學(xué)位課程來專攻生物信息學(xué)。為了完成本科生物信息學(xué)認(rèn)證,受訓(xùn)人員需參加以下課程:統(tǒng)計學(xué),離散數(shù)學(xué),數(shù)據(jù)結(jié)構(gòu),遺傳學(xué),實驗室生物學(xué),細(xì)胞生物學(xué),生物學(xué)選修課,生物信息學(xué)工具和數(shù)據(jù)采掘。 生物信息學(xué)研究生的證書的獲得,需完成生物化學(xué)研究生課程,遺傳學(xué)/分子生物學(xué)/系統(tǒng)學(xué)中的兩門選修課程,實驗室生物學(xué),生物信息學(xué)工具,計算基因組學(xué),數(shù)據(jù)采掘或生物信息學(xué)統(tǒng)計學(xué)基礎(chǔ)。同樣地,在計算機(jī)科學(xué)學(xué)位課程中,明確表示生物醫(yī)學(xué)信息學(xué)可以讓學(xué)生選擇一個結(jié)構(gòu)化的培訓(xùn)項目。
生物信息學(xué)工程師,科學(xué)家和用戶的培訓(xùn)類別的闡明需要審查俄亥俄州的項目。 雖然計算機(jī)科學(xué)學(xué)位課程中的生物信息學(xué)專業(yè)為生物信息學(xué)工程師提供了充分的培訓(xùn),但從一勞永逸的生物信息學(xué)證書課程轉(zhuǎn)移到培訓(xùn)生物信息學(xué)用戶,科學(xué)家和工程師的多方向課程將是有益的。證書計劃目前正在擴(kuò)大,以允許定制培訓(xùn)每個不同的生物信息學(xué)角色。 作為第一步,生物選修課程的要求正逐漸變成一個角色特定的選修課程的要求。 這將使生物信息學(xué)工程師能夠選擇算法分析,數(shù)據(jù)科學(xué),數(shù)據(jù)庫設(shè)計,機(jī)器學(xué)習(xí),人工智能,軟件工程,計算機(jī)安全和并行計算等選修課程。此外,生物信息學(xué)認(rèn)證計劃要求正在重新設(shè)計,以便為用戶,科學(xué)家和工程師提供特定的方向。 這個重新設(shè)計過程將得到生物信息學(xué)工程師的ISCB能力的幫助,可能會以樣本程序的形式(例如,[1]中討論的一個生物信息學(xué)項目調(diào)查的集合),或者通過將每個能力映射到建議的課程和 /或課程主題(例如,來自[1]中定義的受控詞匯)。
本科生物工程專業(yè)方向:伊利諾伊大學(xué)。在伊利諾伊大學(xué),本科生物工程專業(yè)選擇一個方向,其中之一是計算機(jī)和系統(tǒng)生物學(xué)(CSB)。 不在CSB方向的學(xué)生可以獲得少量的編程經(jīng)驗,但是在大二的時候可以選擇非專業(yè)的CS課程,讓他們接觸MATLAB和C編程。他們還可以參加初級課程,生物數(shù)據(jù)計算工具,涵蓋了基本概率和統(tǒng)計數(shù)據(jù); 假設(shè)檢驗; 建模與仿真; 和實驗設(shè)計,并將這些概念和技術(shù)應(yīng)用于人類基因組變異; 序列比對; 隱馬爾可夫模型和基因發(fā)現(xiàn); 癌癥基因組學(xué); 和基因調(diào)控網(wǎng)絡(luò)中。在CSB方向的學(xué)生采用上述的生物數(shù)據(jù)計算工具,但在數(shù)學(xué)和計算機(jī)科學(xué)方面有更嚴(yán)格的培訓(xùn)。 具體而言,CSB方向的學(xué)生會學(xué)習(xí)CS專業(yè)課程,包括介紹性編程,離散數(shù)學(xué),數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)挖掘和生物信息學(xué)??偟膩碚f,CSB的學(xué)生在數(shù)學(xué),概率,統(tǒng)計學(xué)和計算機(jī)科學(xué)方面都有嚴(yán)格的培訓(xùn),至少有兩門高級課程將這些學(xué)科的技術(shù)應(yīng)用于生物信息學(xué)分析。 這類人群的經(jīng)驗突出顯示了能力方面仍然存在差距,目前這類人群在它們的使用方面沒有得到充分的體現(xiàn)。 它為未來的工作提供了一個可能的方向,因為生物信息學(xué)工程師課程工作組可能會擴(kuò)展其指導(dǎo)方針,以更好地涵蓋生物工程領(lǐng)域。
其他培訓(xùn)指南和資源
生物信息學(xué)短期課程:歐洲生物信息學(xué)研究所(EMBL-EBI)和劍橋大學(xué)。EMBL-EBI(www.ebi.ac.uk/training)和劍橋大學(xué)(UCAM,http://bioinfotraining.bio.cam.ac.uk/)擁有大量的短期課程,使研究界獲得生物信息學(xué)的能力。這些課程與上述全日制課程不同,因為它們針對已經(jīng)從事研究工作的個人。 參加這些課程的大多數(shù)科學(xué)家是博士研究生,博士后研究人員,或者更高級的研究人員(學(xué)術(shù)界或者工業(yè)界),他們正在進(jìn)行數(shù)據(jù)密集型實驗,需要實驗設(shè)計指導(dǎo),數(shù)據(jù)分析和解釋。作為ELIXIR原理的證明,此原理為歐洲的分布式生物數(shù)據(jù)基礎(chǔ)設(shè)施和20個國家的節(jié)點,EMBL-EBI和UCAM最近進(jìn)行了一次練習(xí),將其課程計劃映射到ISCB能力框架。 其目標(biāo)是確定培訓(xùn)經(jīng)費的任何缺口,并迅速檢查能力概況的穩(wěn)健性——總共考察了UCAM提供的50門短期課程和EMBL-EBI的21門,涵蓋了主要針對生物信息學(xué)科學(xué)家和生物信息學(xué)用戶的大量主題。這兩個課程都涵蓋了所有的能力領(lǐng)域,只有很少的課程提高了到A的能力,普通生物學(xué)的能力(這在目標(biāo)讀者中已經(jīng)很完善了,其中許多人擁有生物科學(xué)的研究生學(xué)位) F課程的比例增加,生物信息學(xué)工具及其使用(來自UCAM的48門課程;來自EMBL-EBI的20門課程); D,科學(xué)發(fā)現(xiàn)過程的細(xì)節(jié)和生物信息學(xué)的作用(UCAM的34門課程; EMBL-EBI的20門課程); 和N,生物信息學(xué)問題,重要問題和主題的有效溝通(UCAM的28門課程; EMBL-EBI的20門課程)。確定了兩個能力領(lǐng)域,他們認(rèn)為現(xiàn)有框架沒有充分涵蓋這些領(lǐng)域,希望增加:傳播研究數(shù)據(jù)的數(shù)據(jù)管理(例如向公共數(shù)據(jù)庫提交數(shù)據(jù)集時所需的數(shù)據(jù)注釋,以及由對這些資源增值的專業(yè)生物人進(jìn)行的數(shù)據(jù)注釋)和用于研究數(shù)據(jù)的分析(例如,對新測序的基因組注釋以找到直系同源物/旁系同源物或獲得基因組功能概述)的數(shù)據(jù)管理。這次練習(xí),如果在所有ELIXIR節(jié)點上進(jìn)行,將有助于理解ELIXIR培訓(xùn)組合對于不同目標(biāo)受眾的影響,并將使他們能夠相應(yīng)地塑造我們的產(chǎn)品。 將現(xiàn)有的短期課程映射到生物信息學(xué)的核心能力也可以用來幫助個人沿著一條學(xué)習(xí)路線學(xué)習(xí),帶著他們從一個能力水平到另一個能力水平。
臨床生物信息學(xué):英國100000個基因組項目。當(dāng)前生物信息學(xué)滲透到臨床實踐的需要非常迫切,例如通過諸如在英國的100, 000個基因組項目(https://www.genomicsengland.co.uk/the-100000-genomes-project/)等程序加速,其將對100, 000個患者基因組進(jìn)行測序,目的是使用基因組數(shù)據(jù)通知臨床決策。這個項目會影響許多不同類型的醫(yī)療專業(yè)人員。 例如,??漆t(yī)療保健科學(xué)家需要培訓(xùn)來處理和解釋基因組數(shù)據(jù); 參與招募患者到100, 000基因組項目中的臨床工作人員需要培訓(xùn),以了解基因組測序的結(jié)果,并咨詢患者(及其親屬); 一般工作人員需要進(jìn)行培訓(xùn)以提高基因組藥物的知名度,以及如何改善患者護(hù)理。為了達(dá)到這個目的,2014年英國健康教育組織在臨床生物信息學(xué)方向召集了一個“任務(wù)和完成小組”,就培訓(xùn)要求提出建議,這不僅是作為100, 000基因組計劃的直接后果,而且還在整個醫(yī)療實踐中的生物分子數(shù)據(jù)增加。 該小組決定通過定義醫(yī)療保健專業(yè)人員所需的能力來解決眼前的問題,使他們能夠利用100, 000基因組計劃中提供的數(shù)據(jù)來為臨床決策提供信息。作為一個學(xué)科的證明,該組織還將這些能力映射到由英國健康教育委托的現(xiàn)有或新設(shè)計的培訓(xùn)項目,為未來的醫(yī)療保健專業(yè)人員的培訓(xùn)計劃提供信息。
作為一個起點,該小組利用ISCB的核心競爭力和一份政策文件,明確了臨床生物信息學(xué)家的作用,起草了一份能力清單; 該小組還創(chuàng)建了一個可能受到10萬基因組計劃影響的不同類型的醫(yī)療保健專業(yè)人員名單。然后,該小組的每個成員與同事和更廣闊的團(tuán)體進(jìn)行協(xié)商,要求他們提供關(guān)于使用100, 000基因組數(shù)據(jù)所需的能力的信息,并要求參與者考慮是否需要一些額外的能力。 每個職業(yè)至少有五名代表進(jìn)行了咨詢,所有輸入的數(shù)據(jù)結(jié)合在一起,形成了一致的能力概況。這個共識發(fā)表在白皮書“在NHS中開展臨床生物信息學(xué)培訓(xùn)”上(https://www.genomicseducation.hee.nhs.uk/images/publications/Developing_NHS_Clinical_Bioinformatics_Training.pdf),通過所列的職業(yè),不僅捕獲了哪些能力是必需的,也表明了所需的專業(yè)水平,從無知識到普遍意識和工作知識,再到專業(yè)知識。 該簡介沒有提供評估個人是否獲得了所需的各項能力所需證明的指導(dǎo),但這必將是下一步。
metacurricular資源的學(xué)習(xí)框架:CourseSource生物信息學(xué)學(xué)習(xí)框架。CourseSource(http://www.coursesource.org)是“本科生物科學(xué)同行評議的開放期刊”[7]。 CourseSource通過在生物學(xué)中發(fā)揮不可或缺的生物學(xué)科作用(例如,進(jìn)化,遺傳學(xué),分子生物學(xué),生物信息學(xué))來組織其資源。每個學(xué)科都有一個相關(guān)的學(xué)習(xí)目標(biāo)和框架,即生物科學(xué)的本科生在完成學(xué)業(yè)時應(yīng)該達(dá)到的目標(biāo)和目標(biāo)。 ISCB課程和能力指南被用作開發(fā)生物信息學(xué)習(xí)框架的模型。 該框架可以在http://www.coursesource.org/courses/bioinformatics查看。 它代表了指導(dǎo)方針的實際應(yīng)用,并將指導(dǎo)方針擬定到適合在課堂環(huán)境中實施的水平。
討論和結(jié)論
任務(wù)小組的工作確定了對生物信息學(xué)教育的迫切需求,但是在這個需求的細(xì)節(jié)方面也有巨大的變化,以及對于如何滿足不同目標(biāo)用戶群和培訓(xùn)環(huán)境普遍被混淆。開發(fā)和不斷完善生物信息學(xué)培訓(xùn)核心能力的工作力求通過提供一個概念框架來幫助這一領(lǐng)域的教育工作者,在這個框架下,該領(lǐng)域可以更有效地分享經(jīng)驗,并集中精力確定生物信息學(xué)教育的面向不同的需求和期望的最佳實踐方法。多年的社區(qū)參與努力和隨后的改進(jìn)使我們更加接近這一目標(biāo),從而更廣泛地認(rèn)識到需要生物信息學(xué)教育的用戶角色范圍以及更富有成效的語言,通過這些語言來識別和討論共同的需求和培訓(xùn)機(jī)制。正如這里介紹的用例所示,這個過程中產(chǎn)生的核心能力為生物信息學(xué)教育者提供了一個基礎(chǔ),盡管目標(biāo)和學(xué)生人數(shù)眾多,他們在設(shè)計,改進(jìn)和評估自己的培訓(xùn)方面有共同的經(jīng)驗。
需提醒的是,這些核心能力不是,也不準(zhǔn)備是針對一套具體的課程或課程標(biāo)準(zhǔn)的指示。雖然能力突出了培訓(xùn)情景中常見的重點,但很少有觀點可以避免異議。該領(lǐng)域仍在搞清楚在生物信息學(xué)方面的培訓(xùn)意味著什么,或者如何提供最好的培訓(xùn)。我們不期望這種情況在不久的將來結(jié)束。 盡管如此,我們希望有一個框架,在這個框架下,我們可以評估不同的計劃如何定義和服務(wù)于他們的培訓(xùn)需求,作為一門學(xué)科,這對于生物信息學(xué)的成熟是有價值的。
將來,任務(wù)小組計劃以類似于CourseSource框架的方式詳細(xì)說明其準(zhǔn)則。 具體來說,此計劃是提供能力和CourseSource框架之間的明確映射,這是為生命科學(xué)家量身定做。 此任務(wù)小組的最終目標(biāo)是在ISCB能力框架中為每個人物角色制定明確的課程對能力的映射。對于生命科學(xué)家(具有CourseSource框架)和臨床執(zhí)業(yè)者(具有NHS臨床生物信息學(xué)框架),這已經(jīng)在進(jìn)行中。在與其他框架有協(xié)同作用的地方,我們認(rèn)為有可能把這些框架映射到其他人物角色的課程上; 例如,數(shù)據(jù)科學(xué)的愛迪生框架有許多與生物信息學(xué)工程師有關(guān)的元素; ABET框架確實被用作制定ISCB能力框架的基礎(chǔ); 本手冊中描述的課程也提供了具體的例子,這些例子可以概括為生物信息學(xué)工程師的框架。
表1. 生物信息學(xué)的核心能力。 該表提供了當(dāng)前的能力列表社區(qū)參與。 它具體反映了為適應(yīng)能力而進(jìn)行的重大改進(jìn)按照布盧姆的分類標(biāo)準(zhǔn)進(jìn)行評分。
Label Competency
A General biology
B Depth in at least one area of biology (e.g., evolutionary biology, genetics, molecular biology, biochemistry,
anatomy, physiology).
C Biological data generation technologies.
D Details of the scientific discovery process and of the role of bioinformatics in it.
E Statistical research methods in the context of molecular biology, genomics, medical, and population genetics
research.
F Bioinformatics tools and their usage.
G The ability of a computer-based system, process, algorithm, component, or program to meet desired needs
in scientific environments/problem.
H Computing requirements appropriate to solve a given scientific problem (e.g., system, process, algorithm,
component or program; define algorithmic time and space complexities and hardware resources required to
solve a problem).
I GUI/Web-based computing skills appropriate to the discipline (e.g., effectively use bioinformatics and
analysis tools through web).
J Command line and scripting based computing skills appropriate to the discipline.
K Construction of software systems of varying complexity based on design and development principles.
L Local and global impact of bioinformatics and genomics on individuals, organizations, and society.
M Professional, ethical, legal, security, and social issues, and responsibilities of bioinformatics and genomic
data in the workplace.
N Effective communication of bioinformatics and genomics problem/issue/topics with a range of audiences,
including, but not limited to, other bioinformatics professionals.
O Effective teamwork to accomplish a common scientific goal.
P Engage in continuing professional development in bioinformatics.
https://doi.org/10.1371/journal.pcbi.1005772.t001
表2. 通過Bloom的分類標(biāo)準(zhǔn)將能力映射到生物信息學(xué)用戶角色。
總結(jié)
- 上一篇: 道友,来Rstudio里面看动画了
- 下一篇: scATAC-seq建库原理,质控方法和