⑴ DNA資料庫的EMBL
歐洲生物信息學研究所(European Bioinformatics Institute, EBI)創建的一個核酸序列資料庫。EMBL的數據來源主要有兩部分,一部分由科研人員或某些基因組測序機構通過計算機網路直接提交,另一部分則來自科技文獻或專利(Stoesser等, 1998)。EMBL與DDBJ、GenBank建有合作關系,他們分別在全世界范圍內收集核酸序列信息,每天都將新發現或更新過的數據相互交換。
DNA資料庫的規模正在以指數方式增長,平均不到9個月就增加一倍。1998年1月,EMBL中收錄的序列數已超過一百萬,包括15,500個物種,其中模式生物的序列佔50%以上,它們包括人類(Homo sapiens), 線蟲(Caenorhabditis elegans),啤酒酵母(Saccharomyces cerevisiae),小鼠(Mus musculus)和擬南芥(Arabidopsis thalania)。
可以利用序列查詢系統 SRS(Sequence Retrieval System)從EMBL資料庫中提取有關信息(Etzold等,1996年)。SRS序列查詢系統通過超文本鏈接將DNA序列資料庫和蛋白質序列、功能位點、結構、基因圖譜以及文獻摘要MEDLINE等各種資料庫聯系在一起。利用EBI網站提供的BLAST或FastA程序,可以對EMBL資料庫進行未知序列同源性搜索。
⑵ 核酸序列資料庫(genbank)和基因組資料庫(ensemble)的區別
搜一下:核酸序列資料庫(genbank)和基因組資料庫(ensemble)的區別?
⑶ 是哪位科學家首次在世界上建立了蛋白質資料庫是哪位科學家首次在世界上建立了DNA序列資料庫
EMBL是歐洲生物信息學研究所
(European
Bioinformatics
Institute,
EBI)創建的一個核酸序列資料庫。EMBL的數據來源主要有兩部分,一部分由科研人員或某些基因組測序機構通過計算機網路直接提交,另一部分則來自科技文獻或專利(Stoesser等,
1998)。EMBL與DDBJ、GenBank建有合作關系,他們分別在全世界范圍內收集核酸序列信息,每天都將新發現或更新過的數據相互交換。
DNA資料庫的規模正在以指數方式增長,平均不到9個月就增加一倍。1998年1月,EMBL中收錄的序列數已超過一百萬,包括15,500個物種,其中模式生物的序列佔50%以上,它們包括人類(Homo
sapiens),
線蟲(Caenorhabditis
elegans),啤酒酵母(Saccharomyces
cerevisiae),小鼠(Mus
musculus)和擬南芥(Arabidopsis
thalania)。
可以利用序列查詢系統
SRS(Sequence
Retrieval
System)從EMBL資料庫中提取有關信息(Etzold等,1996年)。SRS序列查詢系統通過超文本鏈接將DNA序列資料庫和蛋白質序列、功能位點、結構、基因圖譜以及文獻摘要MEDLINE等各種資料庫聯系在一起。利用EBI網站提供的BLAST或FastA程序,可以對EMBL資料庫進行未知序列同源性搜索。
⑷ 核酸序列、結構資料庫有哪些
美國的核酸資料庫GenBank
http://www.ncbi.nlm.nih.gov
歐洲核酸序列資料庫EMBL
http://www.embl-heidelberg.de
日本核酸序列資料庫DDBJ
http://www.ddbj.nig.ac.jp
這是目前世界三大核酸資料庫.不本我們用的最多的還是NCBI,基本上是不用日本的!
⑸ DNA資料庫的EMBL
歐洲生物信息學研究所(European
Bioinformatics
Institute,
EBI)創建的一個核酸序列資料庫。EMBL的數據來源主要有兩部分,一部分由科研人員或某些基因組測序機構通過計算機網路直接提交,另一部分則來自科技文獻或專利(Stoesser等,
1998)。EMBL與DDBJ、GenBank建有合作關系,他們分別在全世界范圍內收集核酸序列信息,每天都將新發現或更新過的數據相互交換。
DNA資料庫的規模正在以指數方式增長,平均不到9個月就增加一倍。1998年1月,EMBL中收錄的序列數已超過一百萬,包括15,500個物種,其中模式生物的序列佔50%以上,它們包括人類(Homo
sapiens),
線蟲(Caenorhabditis
elegans),啤酒酵母(Saccharomyces
cerevisiae),小鼠(Mus
musculus)和擬南芥(Arabidopsis
thalania)。
可以利用序列查詢系統
SRS(Sequence
Retrieval
System)從EMBL資料庫中提取有關信息(Etzold等,1996年)。SRS序列查詢系統通過超文本鏈接將DNA序列資料庫和蛋白質序列、功能位點、結構、基因圖譜以及文獻摘要MEDLINE等各種資料庫聯系在一起。利用EBI網站提供的BLAST或FastA程序,可以對EMBL資料庫進行未知序列同源性搜索。
⑹ 核酸序列資料庫和基因組資料庫的區別
核酸序列資料庫(genbank)和基因組資料庫(ensemble)的區別:
1、GenBank
是一個有來自於70,000多種生物的核苷酸序列的資料庫。每條紀錄都有編碼區(CDS)特徵的注釋,還包括氨基酸的翻譯。GenBank屬於一個序列資料庫的國際合作組織,包括EMBL和DDBJ。
2、Ensemble資料庫可為葯物研發提供超過167,000種生物活性化合物包括化學結構在內的必要信息。本資料庫利用用戶容易掌握的界面將數據、文本和圖象資料有機地結合起來,便於查詢。Ensemble可從葯品專利開始,再通過其臨床前和臨床研究資料,直至注冊信息、市場概況及其他方面的相關資料來跟蹤葯物。資料庫每月更新一次,每年增加約10,000
種新化合物。
⑺ 轉錄測序中的nr,nt,swissprot,cog,kegg,go分別是什麼意思
NR庫屬於非冗餘蛋白序列資料庫,是NCBI官方的蛋白序列資料庫,數據來源於GenPept、SwissProt、PIR、PDF、PDB以及NCBI RefSeq,是默認的蛋白比對資料庫。
NT資料庫是美國國家生物技術信息中心NCBI官方的核酸序列資料庫,NT庫屬於非冗餘核酸序列資料庫,數據來源於GenBank、EMBL 以及 DDBJ,是NCBI默認的核酸blast比對資料庫。
SwissProt資料庫是檢查過的、手工注釋的蛋白資料庫,我們將Unigene注釋到SwissProt資料庫,以得到更加高質量的注釋結果。
COG (clusters of orthologous groups)主要是原核生物和單細胞真核生物的直系同源物,KOG(clusters of euKaryotic Orthologous Groups)資料庫包含了7個完整基因組的真核生物的直系同源家族蛋白, 構成每個 KOG 的蛋白集是被假定為來自於一個祖先蛋白,根據系統發生進行分類,一般COG指原核生物,KOG指真核生物,KOG與COG提供了相似的基因同源物的分類信息。
KEGG (Kyoto Encyclopedia of Genes and Genomes) 是處理基因組、生物通路、疾病、葯物和化學物質之間聯系的集成資料庫。 KEGG用於生物信息研究等,包括基因組,代謝組學等其他組學的數據分析,涵蓋了Drug Development(葯物開發)、 Cellular Processes(細胞過程)、 Environmental Information Processing(環境信息處理)、Genetic Information Processing(遺傳信息處理)、 Human Diseases(人類疾病), Metabolism(代謝)、 Organismal Systems(有機系統)等方面。
GO( Gene Ontology ): 基因本體。生物技術的發展迅速,數據越來越多,不同資料庫命名標准不統一,為了解決不同的生物學資料庫可能會使用不同的術語的問題,從而基因本體聯合會(Gene Onotology Consortium)開發GO來描述基因在分子、細胞和組織水平的功能體現。GO的基本描述單元是GO terms。GO主要包括三個分支: 生物過程(biological processes)、分子功能(molecular function)和細胞組成(cellular components),用於描述基因產物的功能。GO中使用了is_a、part_of和regulates三種互作關系。