mysql中vlookup函数_数据库合并函数vlookup介绍
昨天我們介紹了EXCEL當(dāng)中的IF函數(shù)以及COUNTIF函數(shù)在數(shù)據(jù)處理當(dāng)中的使用。今天來介紹另外一個我們在數(shù)據(jù)提取經(jīng)常用到的函數(shù):Vlookup。
實例介紹
我們在進行數(shù)據(jù)分析的時候,經(jīng)常需要對數(shù)據(jù)進行匹配。比如我們這里有一個胃癌相關(guān)患者的臨床信息的數(shù)據(jù)庫,這個數(shù)據(jù)庫包括這些患者的基本臨床信息,其中包括其年齡,性別,TMN分期。
同時我還有另外一個數(shù)據(jù)庫,這個數(shù)據(jù)庫是我做了一部分患者的TP53和RNF10表達的結(jié)果。
這兩個數(shù)據(jù)庫的樣本量都不一樣,但是其有一個相同的地方在于,這兩個數(shù)據(jù)庫都有一個患者ID。這個ID是唯一的。即我們可以通過ID號來查到每個患者的臨床信息,同時也能查到其基因表達的情況。這個時候,如果我想要分析TP53基因的表達和胃癌臨床信息的關(guān)系的話,那就需要把這兩個數(shù)據(jù)庫來進行合并成一個表格來進行分析。
如果是只有幾個樣本。那我們完全可以一個一個ID查找來進行合并。但是如果是有差不多幾百個樣本,那總不能查找?guī)装俅伟?。這個時候我們就可以使用vlookup函數(shù)來完成這個操作。
函數(shù)介紹
關(guān)于VLOOKUP而言,我們需要輸入以下幾個參數(shù)來完成操作VLOOKUP(想要查找的ID號, 想要在哪個范圍內(nèi)查找, 想要返回的列,是否是精確查找)。
例如上面的例子,我們想要把如果我們想要把基因的表達數(shù)據(jù)庫當(dāng)中的樣本的年齡信息匹配上。那就需要輸入=VLOOKUP(A2,Sheet1!A:F,2,FALSE)
通過以上的例子我們來解釋一下函數(shù)的輸入和輸出在函數(shù)的的第一個參數(shù)是想要查找的ID號,這里我們輸入的是A2。即想要查找在A2這個位置上的這個ID號(TCGA-VQ-AA6G-01A)的相關(guān)信息
第二個參數(shù)是我們想要查找的范圍。這里我們輸入是Sheet1!A:F(這里的數(shù)據(jù)內(nèi)容就是臨床信息的數(shù)據(jù))。這個的意思是,我們想要在哪個數(shù)據(jù)庫查找剛才輸入的唯一的ID號(TCGA-VQ-AA6G-01A)。
這里需要注意的是,對于這個數(shù)據(jù)庫的第一列一定要是唯一ID號。
第三個參數(shù)是我們想要返回的第幾列的數(shù)據(jù)。在想要查找的數(shù)據(jù)庫當(dāng)中,age在第二列,所以我們輸入2。就代表如果在這個數(shù)據(jù)庫當(dāng)中查找到目標(biāo)ID號(TCGA-VQ-AA6G-01A), 返回這個ID對應(yīng)的第二列的數(shù)據(jù)。
第四個參數(shù)代表對于ID和數(shù)據(jù)庫的匹配是否是精確匹配。這個參數(shù)接受兩個輸入TRUE是非精確匹配,FLASE是精確匹配。
通過以上的介紹,大致可能就明白VLOOKUP是怎么使用了吧。因此如果我們想要查找gender這里列的數(shù)據(jù)怎么辦。那就是把其中的第三個參數(shù)當(dāng)中的2改成3即可,即=VLOOKUP(A2,Sheet1!A:F,3,FALSE)。
以上的基本操作可以讓我們來進行不同數(shù)據(jù)庫的匹配,但是對于由于每次Vlookup的時候都需要輸入制定的返回列。因此我們只能一列一列的返回。如果我們有十幾或者上百的列需要匹配。那就很麻煩。所以更進階的方法。
多列數(shù)據(jù)的自動匹配
關(guān)于多列數(shù)據(jù)的自動匹配,這個時候就需要用到COLUMN函數(shù)了。這個函數(shù)返回每一個單元格的列數(shù)。例如我們輸入COLUMN(B1)。那就會返回2.如果輸入是COLUMN(C1)則返回3。如果輸入COLUMN(B100)那返回的還是2。
因此通過VLOOKUP和COLUMN函數(shù)進行組合就可以來進行隨著拖動自己匹配了。
在上面的操作我們使用到了絕對引用,關(guān)于絕對引用可以參照我們之前的帖子:?excel函數(shù)基礎(chǔ)
總結(jié)
以上是生活随笔為你收集整理的mysql中vlookup函数_数据库合并函数vlookup介绍的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 零基础怎样系统的学习Python
- 下一篇: MySQL 分库拆表方案