日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > 数据库 >内容正文

数据库

gff3转mysql_科学网-把GFF3文件导入MySQL数据库-闫双勇的博文

發布時間:2024/8/23 数据库 57 豆豆
生活随笔 收集整理的這篇文章主要介紹了 gff3转mysql_科学网-把GFF3文件导入MySQL数据库-闫双勇的博文 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

什么是GFF3?這個一種序列注釋文件的格式,基因組注釋數據常常會用這種格式來記錄序列注釋信息,關于這種格式的更多信息,可以在這里學習:http://www.sequenceontology.org/gff3.shtml

這里簡單說下,怎樣把GFF3文件導入MySQL數據庫,導入了以后使用比較方便。我用的是ubuntu 14.04系統。如果使用其它系統的,僅供參考。系統需要安裝MySQL數據庫以及bioperl,關于bioperl有興趣的朋友可以到這里序列(www.bioperl.org),關于perl和MySQL這里也提供點我云盤里的參考資料:http://yunpan.cn/cK3zPydGY6c7Q (提取碼:36ad)

1 在MySQL數據庫中建立一個用于儲存GFF3格式數據的數據庫

mysql> create database MUS_7 -u root -p ?XXXXXXXX;

其中create database是MySQL中的命令,MUS_7是新建的數據庫名,-u選項,表示用戶名,用戶名參數為root,-p 參數后接MySQL數據庫的密碼。這樣就能建立一個名為MUS_7的數據庫

2 將GFF3文件導入MySQL數據庫中

從網上下載GFF3格式的文件,如從rice_r7_all_tilling_path.gff3,然后用下列命令導入MySQL數據庫

bp_seqfeature_load -f ? -c -d MUS_r7 -u root -p xxxxxxxx all.gff3 all.con

bp_seqfeature_load是一個腳本文件,所以系統中需要有這個腳本文件。關于這個腳本的用法可以用命令bp_seqfeature_load查詢。-f選項的含義:

Activate fast loading. (default 0) Only available for some adaptors.

-c選項的含義:

Create the database and reinitialize it (default false) Note, this

will erase previous database contents, if any

如果是新建的數據庫需要用這個選項,如果是往已有的數據庫中添加數據,用這個選項就壞菜了,把原來數據都清除了

-d MUS_r7,表示導入的數據庫為MUS_r7,-u -p及后面的參數和上文含義相同。all.gff3為GFF3文件。all.com,為和gff3文件對應的參考序列。這個得配套,要不然肯定會報錯。

我傳的all.gff3文件大小為:78M,all.con文件為:365M。文件比較大,要把這些東西都傳上去,得花不少時間,總時間為:63245.07秒,17.5小時。插入后的效果圖如下。

我的MySQL數據庫中有三套水稻基因組的注釋數據。這三套數據,參考序列都是一樣的,但注釋數據則不一樣,所以對同一個水稻基因組序列,利用這三套數據同時分析,可能得到的信息會更多。當然,這個數據也可以和其它數據,如全基因組的多態信息進行整合,這樣使用更加方便

轉載本文請聯系原作者獲取授權,同時請注明本文來自閆雙勇科學網博客。

收藏

分享

分享到:

創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的gff3转mysql_科学网-把GFF3文件导入MySQL数据库-闫双勇的博文的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。