芯片无忧的使用教程_HTA芯片(学徒探索任务)
年前我們布置過(guò)一個(gè) agilent芯片的探索任務(wù),很可惜,沒(méi)有人接單,也許是得等我某一天遇到了,或者時(shí)間充裕了會(huì)去解決它吧!現(xiàn)在再來(lái)一個(gè)疑難雜癥吧,就是生不逢時(shí)的Affymetrix Human Transcriptome Array 2.0芯片的數(shù)據(jù)處理。
前面我提到過(guò)[HTA-2_0] Affymetrix Human Transcriptome Array 2.0芯片的分析其實(shí)挺麻煩的,首先需要搞清楚下面3個(gè)平臺(tái)的差異:
GPL17586 ? ?[HTA-2_0] Affymetrix Human Transcriptome Array 2.0 [transcript (gene) version]
GPL19251 ? ?[HuGene-2_0-st] Affymetrix Human Gene 2.0 ST Array [probe set (exon) version]
GPL16686 ? ?[HuGene-2_0-st] Affymetrix Human Gene 2.0 ST Array [transcript (gene) version]
HTA芯片設(shè)計(jì)的時(shí)候覆蓋了 ~560?k exons and ~340?k exon-exon junctions , 而且比mRNA-Seq 便宜,穩(wěn)定性好。
看看TP53這個(gè)基因上面的探針設(shè)計(jì)
我們?cè)?https://www.easana.com/ 網(wǎng)頁(yè)搜索,可以看到主要的探針都集中在TP53中間的外顯子上面:
TP53基因上面的HTA芯片探針如果具體看探針的坐標(biāo),如下:
一個(gè)基因的全部探針的坐標(biāo)可以看到是29個(gè)探針,序列也清清楚楚,還可以csv下載,探針主要是集中是e5-e15, 跟TP53基因結(jié)構(gòu)示意圖吻合。
如果以外顯子為單位看表達(dá)差異
反正都是表達(dá)矩陣,以外顯子為單位和基因?yàn)閱挝?#xff0c;理論是差不多啦,沒(méi)有根據(jù)注釋文件映射到基因名字之前,都是一個(gè)ID而已。在 https://www.easana.com/ 網(wǎng)頁(yè)可視化如下:
以外顯子為單位看表達(dá)差異但是這樣的示意圖肯定沒(méi)辦法發(fā)表咯,你可以嘗試新的可視化花樣。
關(guān)于EASANA
其實(shí)EASANA是商業(yè)軟件genosplice的一個(gè)可視化功能而已,上面的示意圖比較好的介紹了HTA芯片的基因的多個(gè)探針的表達(dá)量差異情況。
我簡(jiǎn)單摸索了一下,沒(méi)有看到人家下載,看樣子是需要發(fā)郵件給這個(gè)商業(yè)軟件的銷售人員一對(duì)一的講解和獲取。一般來(lái)說(shuō),這樣的軟件在中國(guó)大陸是沒(méi)有市場(chǎng)的, 所以干脆略過(guò)了。
實(shí)際上affymetrix公司自己有TAC軟件
比如有一些文章里面就會(huì)明確寫出來(lái),采用的是affymetrix公司出品的軟件 TAC進(jìn)行處理。一般來(lái)說(shuō),購(gòu)買的如果是商業(yè)公司提供的芯片服務(wù),肯定是會(huì)有配套的數(shù)據(jù)分析。可惜的是,大多數(shù)情況下,真心想用好HTA芯片數(shù)據(jù)的小伙伴并不是購(gòu)買服務(wù)的人,而是想挖掘它背后價(jià)值的。
TAC軟件可以看到這個(gè)軟件有一個(gè)探索可變剪切的模塊,而且這個(gè)也的確是大量使用了HTA芯片的文章寫作落腳點(diǎn)。如果你發(fā)現(xiàn)你的領(lǐng)域有一個(gè)公共數(shù)據(jù)庫(kù)就是HTA芯片,但是創(chuàng)造數(shù)據(jù)集的研究者們并沒(méi)有落腳到可變剪切。那么你就應(yīng)該是意識(shí)到,這可能是你可以努力的方向。
另外一個(gè)商業(yè)軟件partek也很流行
partek這個(gè)軟件應(yīng)該是在海外非常流行,我看到不少文獻(xiàn)提到了partek,甚至跟affymetrix公司出品的軟件 TAC差不多的使用頻率。
image-20200205121009699當(dāng)然了,具體我也沒(méi)有用過(guò)啦。
學(xué)徒作業(yè)
跟agilent芯片一樣,agilent芯片需要摸索使用 Agi4x44PreProcess包完成E-MTAB-3017數(shù)據(jù)集的表達(dá)矩陣獲取。當(dāng)然了,也可以根據(jù)分組,走一下差異分析標(biāo)準(zhǔn)代碼。
而我們的HTA芯片,也是需要摸索一個(gè)包,好像還在GitHub上面,就是EventPointer,Romero et al. BMC Genomics (2016) 17:467 DOI 10.1186/s12864-016-2816-x 有時(shí)間,又想做一些挑戰(zhàn)性的數(shù)據(jù)分析的朋友可以考慮入坑!
走標(biāo)準(zhǔn)分析流程,火山圖,熱圖,GO/KEGG數(shù)據(jù)庫(kù)注釋等等。這些流程的視頻教程都在B站和GitHub了,目錄如下:
第一講:GEO,表達(dá)芯片與R
第二講:從GEO下載數(shù)據(jù)得到表達(dá)量矩陣
第三講:對(duì)表達(dá)量矩陣用GSEA軟件做分析
第四講:根據(jù)分組信息做差異分析
第五講:對(duì)差異基因結(jié)果做GO/KEGG超幾何分布檢驗(yàn)富集分析
第六講:指定基因分組boxplot指定基因list畫(huà)熱圖
感興趣可以細(xì)讀表達(dá)芯片的公共數(shù)據(jù)庫(kù)挖掘系列推文 ;
解讀GEO數(shù)據(jù)存放規(guī)律及下載,一文就夠
解讀SRA數(shù)據(jù)庫(kù)規(guī)律一文就夠
從GEO數(shù)據(jù)庫(kù)下載得到表達(dá)矩陣 一文就夠
GSEA分析一文就夠(單機(jī)版+R語(yǔ)言版)
根據(jù)分組信息做差異分析- 這個(gè)一文不夠的
差異分析得到的結(jié)果注釋一文就夠
生信技能樹(shù)的2019年終總結(jié)??這里面記錄著我博士期間抽空做的一點(diǎn)教程分享事業(yè)
2020學(xué)習(xí)主旋律,B站74小時(shí)免費(fèi)教學(xué)視頻為你領(lǐng)路?這里面記錄著我為生物信息學(xué)教學(xué)行業(yè)做的一點(diǎn)貢獻(xiàn)
總結(jié)
以上是生活随笔為你收集整理的芯片无忧的使用教程_HTA芯片(学徒探索任务)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: APP控制智能家居
- 下一篇: onvif客户端(转载)