Ⅰ 神經源性高血壓小鼠差異靶基因分析———基於GEO資料庫數據挖掘突出什麼問題
摘要 目的 通過分析GSE25076基因晶元數據,探索神經源性高血壓小鼠下丘腦的差異基因,嘗試尋找該病的潛在治療靶點.方法 在NCBI提供的GEO2R平台內檢索GSE25076,將全部數據下載保存為Excel格式,並進行差異基因分析.採用DAVID平台進行GO分析,京都基因與基因組網路全書(KEGG)平台進行KEGG通路分析,STRING平台進行基因互作(PPI)分析.結果 在GEO2R平台內對神經源性高血壓小鼠晶元數據進行分析,共獲得34760個差異基因,最終獲得28個符合條件的基因.這28個差異基因富集在磷脂分解代謝過程、水解酶活性調節等過程.KEGG分析表明其富集於RNA轉運通路.結論 真核翻譯起始因子(EIF)4A3和核糖核酸酶(POP4)最為可能是神經源性高血壓發生的基因層面的原因,通過RNA轉運通路,影響神經發育、血管生成及神經發生等過程,最終導致本病的發生發展.
Ⅱ 如何在geo資料庫找想要的資料庫
1、首先GEO資料庫是個什麼鬼呢?
GEO資料庫全稱GENE EXPRESSION
OMNIBUS,是由美國國立生物技術信息中心NCBI創建並維護的基因表達資料庫。它創建於2000年,收錄了世界各國研究機構提交的高通量基因表達數據,也就是說只要是目前已經發表的論文,論文中涉及到的基因表達檢測的數據都可以通過這個資料庫中找到。
2、那GEO資料庫有哪些檢索入口呢?
最常用的有兩種方式,如果你知道GSE編號可以通過網址http://www.ncbi.nlm.nih.gov/geo直接進入,具體編號介紹文件下載方法見:https://www.omicsclass.com/article/1100
另外一種就是通過NCBI主頁的入口基因搜索下載。通常是不知道GEO編號,通過樣品類型,實驗處理,平台信息等搜索篩選想要的GEO數據:https://www.ncbi.nlm.nih.gov/,進入NCBI主頁,搜索數據選擇GEO DataSets,如果搜索某個基因表達量可選擇GEO Profiles。
Ⅲ 如何對GEO資料庫中已有的數據進行分析
差異表達基因的篩選(閥值)以及後面的生物信息分析都可以做的。
差異表達基因篩選步驟:選擇GEO數據——下載晶元數據——差異分析(方法有很多:SAM法,R包處理,T-test檢驗等)——選擇想要的閾值(Fold change >4)
Ⅳ geo資料庫數據如何標准化
標准化的方法就是Counts值:
對給定的基因組參考區域,計算比對上的read數,又稱為raw count(RC)。
aw count作為原始的read計數矩陣是一個絕對值,而絕對值的特點是基因長度、測序深度不同不可以比較。所以我們要進行標准化把count矩陣轉變為相對值,去除基因長度、測序深度的影響,我們採用分析的。
標准化的三種方法得出的三種值:
RPM (Reads per million mapped reads):RPM方法:10^6標准化了測序深度的影響,但沒有考慮轉錄本的長度的影響。
RPKM/FPKM方法:
103標准化了基因長度的影響,106標准化了測序深度的影響。TCGA的數據分析多採用這種結果。
TPM (Transcript per million):TPM的計算方法也同RPKM/FPKM類似,TPM可以看作是RPKM/FPKM值的百分比。
具體判斷方法:
表達量是否需要重新標准化。
可以通過boxplot函數觀察一下樣本表達豐度值的分布是否整齊進行判斷。
是否需要log2:根據數據值的大小。
如果表達豐度的數值在50以內,通常是經過log2轉化的。如果數字在幾百幾千,則是未經轉化的。
Ⅳ geo資料庫差異基因怎麼在EXCEL里操作
geo資料庫篩選數據方法是:
1、首先,打開NCBI,選擇GEODatasets,輸入GDS5656,點擊Search。
2、點擊樣品分類號,我們可以看到該研究的詳情,包括文章研究內容、實驗方案設計、樣本詳情等。
3、點擊AnalyzewithGEO2R,利用在線工具進行數據分析。將4個樣本分成了兩組,分組完畢後,點擊saveallresults,獲取兩組之間的差異表達基因。
4、得到如下所示的文本內容,將其粘貼到記事本(例如,保存為result.txt),然後導入到excel中(數據→自文本,選擇result.txt文件導入),准備進行篩選。
5、下一步,我們需要對差異表達基因的數據進行進一步的篩選。
6、最後我們可以在EXCEL左下角的狀態欄看到,一共篩選出來738個條目。
Ⅵ 求助GEO資料庫中樣本解釋問題
附加到資料庫中,用語句導出到要顯示的控制項內就可以了,注意控制項和導出的圖形、屬性要匹配,如導出圖片最好用image控制項接收
Ⅶ geo資料庫有牛的嗎
GEO資料庫是一個儲存晶元、二代測序以及其他高通量測序數據的一個資料庫。利用這個資料庫,我們可以檢索到其他一些人上傳的一些實驗測序數據。
由於GEO資料庫和我們之前介紹的gene資料庫a以及我們常用來搜索文獻的pubmed都是一個機構的。使用這個資料庫,我們需要做的就是就是就是提供檢索式。檢索式可以是簡單的幾個關鍵詞,也可以是制定特殊的檢索式。我們一般可以用到的進一步篩選的過程就是:在樣本類型當中尋找自己想要的物種。由於GEO包括了很多不同組學的數據,如果我們有特定的檢索目的的話,我們可以在aStudyaType當中來選擇合適的數據類型。默認的檢索結果的排序是基於檢索相關性來排序的。而我們再找目標數據的時候。有時候需要看樣本量,一般來說樣本量越大其實也就越好的。所以我們可以改變一下檢索結果的排序。