當前位置:首頁 » 數據倉庫 » geo資料庫怎麼篩選數據
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

geo資料庫怎麼篩選數據

發布時間: 2022-11-27 05:14:11

A. 怎麼才能從凌亂的資料庫里篩選出需要的數據

這個需要根據條件檢索查詢的。檢索是資料庫最基本的一個功能。

比如我們可以查某年某月的數據或者查張三、李四的數據。根據不同條件去資料庫查詢,然後把符合條件的數據列出來。

B. 如何在GEO資料庫中找到需要的數據

假設這組數據在A1:A100這個區域 ,公式:
=INDEX(A:A,INT(RAND()*100)+1)

或者:
=OFFSET(A1,INT(RAND()*100),)

C. 資料庫怎麼篩選出同一項目下的所有數據

將Excel表格中單位名稱導入access中,表取名單位名稱,原有數據表名為單位(單位名稱、地址、電話),建查詢:將單位名稱和單位這兩個表都加到查詢設計窗格中,兩個共同欄位:單位名稱建立連接,單擊那條線—右鍵—選2,包括「單位名稱」中的所有記錄和「單位」中聯接欄位相等的那些記錄。然後單位名稱表選單位名稱,單位表選地址、電話。象下圖這樣,就可以了。

D. 如何對GEO資料庫中已有的數據進行分析

差異表達基因的篩選(閥值)以及後面的生物信息分析都可以做的。

差異表達基因篩選步驟:選擇GEO數據——下載晶元數據——差異分析(方法有很多:SAM法,R包處理,T-test檢驗等)——選擇想要的閾值(Fold change >4)

E. kegg資料庫和geo資料庫區別

GEO篩選差異,KOBAS注釋分析。
GEO資料庫來篩選差異表達基因,KOBAS進行KEGG注釋分析
利用基因在不同物種之間的保守性,任何基因組的數據都可以映射到這些資料庫中去。

F. geo資料庫有牛的嗎

GEO資料庫是一個儲存晶元、二代測序以及其他高通量測序數據的一個資料庫。利用這個資料庫,我們可以檢索到其他一些人上傳的一些實驗測序數據。
由於GEO資料庫和我們之前介紹的gene資料庫a以及我們常用來搜索文獻的pubmed都是一個機構的。使用這個資料庫,我們需要做的就是就是就是提供檢索式。檢索式可以是簡單的幾個關鍵詞,也可以是制定特殊的檢索式。我們一般可以用到的進一步篩選的過程就是:在樣本類型當中尋找自己想要的物種。由於GEO包括了很多不同組學的數據,如果我們有特定的檢索目的的話,我們可以在aStudyaType當中來選擇合適的數據類型。默認的檢索結果的排序是基於檢索相關性來排序的。而我們再找目標數據的時候。有時候需要看樣本量,一般來說樣本量越大其實也就越好的。所以我們可以改變一下檢索結果的排序。

G. 基因晶元數據分析-1: 使用GEOquery 包從GEO獲取數據

GEOquery 包使用指南

GEO(The NCBI Gene Expression Omnibus)是NCBI專門儲存高通量測序的庫。如基於晶元數據(mRNA、DNA、蛋白豐度),蛋白質質譜數據和高通量測序數據。
GEO數據主要有4種基本類型。Sample, Platform 和 Series是由作者上傳的數據,dataset是由GEO官方從做和提交的數據整理出來的。

## 1.1 Platforms
GEO 號:GPLxxx。
晶元的組成信息,例如 cDNAs, oligonucleotide probesets, ORFs, antibodies 。或者其它定量檢測平台信息,例如SAGE tags, peptides。

## 1.2 Samples
GEO 號: GSMxxx

描述單個樣本信息,處理步驟、處理條件以及實驗測得的結果。一個樣本可能屬於多個研究(Series)。

## 1.3 Series
GEO 號:GSExxx

涉及同一個研究的記錄,包括處理過的數據、總結和分析;信息可以從GSEMatrix文件解析快速得到。

##1.4 Datasets
GEO 號:GDSxxx

一套經過整理的GEO 數據集。每套數據都是可以進行生物學或者統計學上比較的樣本,是GEO自帶工具進行數據分析和展示的基礎。一個 GDS數據集來自同一個平台,數據分析和標准化都具有一致性。

getGEO 函數可以從GEO官網獲取數據或者將固定格式數據解析為R格式的數據。

GEOquery 數據結構大致分為兩類。第一種是GDS, GPL和GSM,他們的操作和數據類型差不多;第二種是GSE,GSE數據是由GSM和GPL整合而成。

## 3.1 GDS, GSM 和 GPL

這些數據類組成

可以使用show()查看這些數據類。

##3.2 GSE類

GSE類組成:

GEO datasets與limma 數據結構MAList 和Biobase數據結構 ExpressionSet比較相似。可以相互轉換:

## 4.1 Getting GSE Series Matrix files as an ExpressionSet
GEO Series是一套實驗數據的集合,有SOFT,MINiML格式文件,以及一個 Series Matrix File(s)文本。Series Matrix File是tab-delimited text, getGEO 函數可以解析,解析結果就是ExpressionSets。

一個GSE下如果存在多個GPL測序,篩選特定的GPL數據;GSE會有多個列表 gset[[idx]]

##4.2 Converting GDS to an ExpressionSet

##4.3 Converting GDS to an MAList
ExpressionSet不包含注釋信息, getGEO 可以幫助我們獲取。

與ExpressionSet不同,the limma MAList 包含基因注釋信息。上面的gpl包含注釋信息。

MAList不僅包含數據,還包含樣本信息,和注釋信息。

4.4 Converting GSE to an ExpressionSet
GSE轉換成ExpressionSet

這個GSE包含兩個GPLs,GPL96 和 GPL97。

篩選使用GPL96 的GSM。

獲取表達矩陣:

構造ExpressionSet

##6.1 Getting all Series Records for a Given Platform

英文版原文見:[Using the GEOquery Package

H. 如何在geo資料庫找想要的資料庫

1、首先GEO資料庫是個什麼鬼呢?
GEO資料庫全稱GENE EXPRESSION
OMNIBUS,是由美國國立生物技術信息中心NCBI創建並維護的基因表達資料庫。它創建於2000年,收錄了世界各國研究機構提交的高通量基因表達數據,也就是說只要是目前已經發表的論文,論文中涉及到的基因表達檢測的數據都可以通過這個資料庫中找到。
2、那GEO資料庫有哪些檢索入口呢?
最常用的有兩種方式,如果你知道GSE編號可以通過網址http://www.ncbi.nlm.nih.gov/geo直接進入,具體編號介紹文件下載方法見:https://www.omicsclass.com/article/1100
另外一種就是通過NCBI主頁的入口基因搜索下載。通常是不知道GEO編號,通過樣品類型,實驗處理,平台信息等搜索篩選想要的GEO數據:https://www.ncbi.nlm.nih.gov/,進入NCBI主頁,搜索數據選擇GEO DataSets,如果搜索某個基因表達量可選擇GEO Profiles。