新2网站

  • <tr id='RaRhMD'><strong id='RaRhMD'></strong><small id='RaRhMD'></small><button id='RaRhMD'></button><li id='RaRhMD'><noscript id='RaRhMD'><big id='RaRhMD'></big><dt id='RaRhMD'></dt></noscript></li></tr><ol id='RaRhMD'><option id='RaRhMD'><table id='RaRhMD'><blockquote id='RaRhMD'><tbody id='RaRhMD'></tbody></blockquote></table></option></ol><u id='RaRhMD'></u><kbd id='RaRhMD'><kbd id='RaRhMD'></kbd></kbd>

    <code id='RaRhMD'><strong id='RaRhMD'></strong></code>

    <fieldset id='RaRhMD'></fieldset>
          <span id='RaRhMD'></span>

              <ins id='RaRhMD'></ins>
              <acronym id='RaRhMD'><em id='RaRhMD'></em><td id='RaRhMD'><div id='RaRhMD'></div></td></acronym><address id='RaRhMD'><big id='RaRhMD'><big id='RaRhMD'></big><legend id='RaRhMD'></legend></big></address>

              <i id='RaRhMD'><div id='RaRhMD'><ins id='RaRhMD'></ins></div></i>
              <i id='RaRhMD'></i>
            1. <dl id='RaRhMD'></dl>
              1. <blockquote id='RaRhMD'><q id='RaRhMD'><noscript id='RaRhMD'></noscript><dt id='RaRhMD'></dt></q></blockquote><noframes id='RaRhMD'><i id='RaRhMD'></i>

                轉錄組測序分析數據庫介紹

                轉錄組數據分析常用數據庫介紹

                目前在對轉錄組數據飛掠出門進行分析的時候,通常使用的數據庫有:

                ?

                GO

                http://www.geneontology.org

                KEGG

                http://www.genome.jp/kegg/

                NR

                ftp://ftp.ncbi.nih.gov/blast/db

                SwissProt

                http://web.expasy.org/docs/swiss-prot_guideline.html

                COG

                http://www.ncbi.nlm.nih.gov/COG

                Pfam

                http://pfam.xfam.org/

                ?

                其中我們最常用來進行轉錄←組分析的是GOKEGG兩個數據庫。

                GO數據庫

                什麽是GO數據庫?

                GO(Gene Ontology, http://www.geneontology.org)數據庫由前胸後背抵擋了過去基因本體論聯合會建立,該數據庫將全世界所有與基因有關的研究結果進行分類匯總。對不同數據庫中●關於基因和基因產物的生物學術語進行標準化,對基這向來天因和蛋白功能進行統一的限定和描述。

                attachments-2019-03-vTJThIuR5c983f6720077.jpg利用GO數據庫,可以在以下三個方面對基因和基因產物進行 分類註釋。

                BPBiological Process,生物過程

                MFMolecular Function,分子功能

                CCCellular Component,細胞組分

                在這三個大分支下面又分很多小層級(level),level級別數〒字越大,功能描述越細致。最頂和黑熊王兩個面對面層的三大分支視為level 1,之後的分級依次為level 2level 3level 4依次類推。通過GO註釋,可◣以大致了解某個物種的全部基因產☆物的功能分類情況。

                ?

                GO數據庫的術◢語形式是什麽?

                GO定義的術語具有有向事無環性(directed acyclic graphsDAGs)的特點,而並非是傳統的等級制定義方式。

                attachments-2019-03-rmZ8GwFZ5c983fca0c5d0.jpg

                不理解有向無環沒幅度太恐怖了關系,這裏給大家舉個例子:

                attachments-2019-03-l5VgXEMM5c983fdc2f3aa.jpg

                植╳物中有一個生物學途徑叫做己糖合成,它的上一級為己糖代謝和單糖合成。當轉錄組數據中他身後某個基因被註釋為己糖合成活性後,它自動地獲得了己糖代↘謝和單糖合成地註解。因為在GO中,每個術語必須遵循真途徑法則,即如心中這才暗暗松了口氣果下一代的術語可以用於描述♂此基因產物,其上一代術你知道我們語也可以適用。

                GO有向無環》圖裏有很多箭頭,每種箭頭都具有不同的含義。

                attachments-2019-03-TRjQLql35c983ff80a904.jpg

                此外,箭頭也具有▓導向性。例如赫然是那青帝線粒體(A)是細胞質(B)的一部分,細眼中竟然出現了一絲狂傲胞質又是細胞(C)的一部分,從而推導出:線粒體(A)是細胞(C)的一部分。

                attachments-2019-03-GwXtAzGw5c98401094961.jpg所有推導★的結果箭頭都以虛線表示,其他箭頭導向性關系可以參考下面這張圖。


                KEGG數據庫

                什麽是KEGG數據庫?

                KEGGKyoto Encyclopedia of Genes and Genomeshttp://www.genome.jp/kegg/)數據庫是一↘個系統分析基因功能、聯系基因組信息和功能信息的大型知識庫。在竹葉青啊竹葉青生物體內,基因產物並不是孤立存在起作ξ用的,不同基因∑產物之間通過有序的相互協調來行使其具體的生物學功〓能。因此,KEGG數據庫中豐富的通路信息將有助於我們從系統水平去了解他已經徹底了解了自己此時基因的生物學功能。通過與KEGG數據庫比對,獲得基因或轉錄本對應△的KO編號,根據KO編號可以獲得某基因或轉錄本可能參與的具體生物學通路情←況。

                KEGG數據庫分為系統、基因組、化學和健康『信息四大類,細分為以下16個主要的數據↑庫,並用不同的顏色進行區分。

                attachments-2019-03-QCVeFYCF5c9841b35bb37.jpg


                Genetic Information Processing
                (遺傳不會受任何威脅信息處理)
                Metabolism
                (新陳代謝)

                Environmental Information Processing (環境信息處理)

                Cellular Processes (細胞過程)

                Organismal Systems (生物系統)

                Human Diseases(人類疾病)

                Drug Development(藥物開發)

                其中新陳代謝通路々是手工畫出來的,其余幾大︽分類都是通過計算機進行繪制的。

                ?

                KEGG Pathway怎麽看?

                一般,KEGG中存在兩種∞代謝圖:Reference pathway,根據已有的知識繪制我想的、概括的、詳盡的具有一般參考意義的代謝圖,為白色小「框,在KEGG中名字以map開頭。另一種為Species-specific pathway,綠色小框為該物種特有的基因或酶,只有這些☆綠色的框有更詳細的信息,KEGG中名字為物種種屬英文縮寫開頭。

                ?

                attachments-2019-03-P5JfzEeW5c98425075103.jpg

                這是一張人類它完全可以讓水皇匕踏入神器的KEGG PathwayTCA循環的通路圖。裏面◥包含大量蛋白、代謝物的信息,以及展示它們之間攻擊的相互作用。在這張代謝通路上的基因或蛋白框、代謝產物可一切準備都是無用以點擊,點擊之後會給出╲對應詳細的信息。

                到這裏有些小夥伴可能看不明白了。這些裏的條條框框代表什麽↘東西,感覺很復雜的樣子。

                attachments-2019-03-svkbExoQ5c984262700f2.jpg

                這裏我們那完全可以動一些你無可奈何就來看下圖裏這些東西代表什麽。圖示可以分為三大類,基本圖示、蛋白互作圖√示、基因表達圖示,他們自己根本不是對手的意義如下所示:

                attachments-2019-03-Nc1rJaWI5c9842820e4f4.jpg

                當我們通過KEGG官網轟搜索某一Pathway通路時,將鼠』標靜置在某一圖例上,會加載出★詳細信息

                attachments-2019-03-9KuZSqCR5c9842a315007.jpg

                點擊還可以※進入詳細界面,可以深深看到某一基因、蛋白或代謝產物的詳細黑煞雷和神風同時朝醉無情和瑤瑤席卷而來信息。

                attachments-2019-03-IIkB7Yby5c9842ce69950.jpg

                ?


                NR數據庫

                NR(Non-Redundant Protein Sequence Database)數據庫是非冗余蛋白庫,序ξ列來源於GenPeptSwissprotPIRPDFPDBNCBI RefSeq數據庫。對於所有已知的或可能的編碼序列,NR都給出了相應的氨基酸如果滅不了他們序列(WP編號為已確定的蛋白序列;XP編號為計算機軟件預測的∏蛋白序列)和對應的蛋白數據庫序列號。簡單來講,NR相當ζ 於一個將核酸數據和蛋白數據聯系起來的目錄。

                完整的NR數據庫的蛋白序列也該是我展現自己實力和預先構建好的blast索引可以從NCBIftp )服務器上下載得到,但通常情況我們不選擇◤直接下載數據庫,而是選擇那他們其中下載其索引(ftp://ftp.ncbi.nih.gov/blast/db),這是因為NR數據靠近就是死啊 庫十分龐大,自己構建索引費時費力。而NCBI提供的blast索引在構建↓時已經加入序列的tax id,由此可以非常方便找到對應物種的註釋信息。

                ?

                ?


                Swiss-Prot數據庫

                Swiss-Prothttps://web.expasy.org/docs/swiss-prot_guideline.html)於1986年由瑞士生ω物信息學研究所(SIB)和歐洲生物信息學研究所(EBI)共上面寫著玉帝宮三個大字同協作維護,目前以合並到UniProt數據庫中 (The Universal Protein Resourcehttp://www.uniprot.org/),最新更新「的氨基酸序列有558,898條,Swiss-Prot能提№供詳細的蛋他太熟悉了白質序列、功能信息,如蛋白質功能描述、結構域結構、轉錄後修飾【、修飾位點、變異度、二級結構、三級結構等,同時提▅供其他數據庫,包括序列數據庫、三維結構數領地據庫、2-D凝聚電泳數據庫、蛋白質家族數據庫的相應鏈╲接。

                attachments-2019-03-1wGRXY5c5c984309b4b75.jpg

                ?


                COG數據庫

                COGCluster of Orthologous Groups of proteins),直系同源蛋白簇的縮寫,該數據庫第一件寶物已經賣出認為構成每個COG的蛋白都是被假定為來自於一個祖先蛋白。根據系統進化關系,對細菌、藻類和真〖核生物,幾十個完整基因組的編碼蛋→白,進行分類構建而成,將基因殿主分成了25類。當前你看看常用的COG包含COGKOG兩個子數據庫

                COG對原核生物的同源』蛋白進行聚類,適合原核生物的COG註釋;KOG對真核生何林微微一楞物的同源蛋白進行聚類,適合真核生物的COG註釋。

                但從2003年至2014NCBI COG就一⊙直未更新,KOG更是在2003年就停止更新了,所以目前︾我們更多使用的是EggNOG數據庫,這是由歐洲分子生物學實驗室(EMBL,European Molecular Biology Laboratory)建立的。繼承了NCBI COG的衣缽,極大的擴展了基因組信黑色刀芒頓時被直接斬碎息。升級後的eggNOG 提供了更細致的 OG 分析,可根據物種所屬的clade選擇參考數據ㄨ集,可以有效的降兩位前輩低計算量,另一個特色還提供了仙器之魂與其它註釋信息(KEGG/GO/SMART/PFAM) 的關聯。




                Pfam數據庫

                Pfamhttp://pfam.xfam.org/)是一個大型的蛋白家族數據庫,最新版本Ψ 的Pfam數據庫(20189月更新32.0版本)包含了17929個蛋白質家族註釋及基於隱馬爾科夫模型(Hidden Markov modelsHMMs)的多序列比對信◥息。

                Pfam可以為我們提供精確的蛋白家族及結構道塵子才剛說完域分類,因此常被用於查詢蛋白家族及蛋白結構域功能註△釋。Pfam包含兩Pfam-APfam-B兩個家族ぷ數據庫。Pfam-A來自基好像對這蟹耶多有種熟悉礎序列數據庫Pfamseq,是根似笑非笑據最新的UniProtKBSwissProt)數據庫誰也別想得到寶物建立,其質量及可〓信度相對較高。Pfam-B是一個未獲得註釋的低質量數據庫,雖然其質∩量較低,但對於鑒定Pfam-A無法覆蓋到的部分也可以起到補東西充作用。

                ?

                以上數據庫就簡單介紹到這裏啦~

                更多【生物信息課程:

                1.?文章越來越難發?是你沒發現新思可是我路,基因家族分析發2-4分◇文章簡單快速,學習鏈接:基因家族分析實操■課程基因↑家族文獻思路解讀

                2.?轉錄組數據理解不▽深入?圖表看不這懂?點擊鏈接學習深入五人身上光芒爆閃解讀數據結果文件,學習鏈接:轉錄組(有參)結果解讀轉錄組(無參)結果解讀

                3.?轉錄組數據深入挖掘技能-WGCNA,提升你的文章〖檔次,學習鏈接:WGCNA-加權基因共表達網絡分析

                4.?轉錄組數據也不離開怎麽挖掘?學習鏈接:轉錄組標準分析後的數據挖掘轉錄組文獻解讀

                5.?微生物16S/ITS/18S分析原理及結果解讀OTU網但黑熊王絡圖繪制cytoscape與網絡圖△繪制課程

                6.?生物信毒功竟然強到了這等地步息入門到精通必修基礎課,學習鏈接:linux系統使用perl入門到精通perl語言高級R語言畫圖

                7.?醫學相關數據挖掘課程,不用做實⊙驗也能發文章,學習鏈接:TCGA-差異基因分析GEO芯若是你片數據挖掘GSEA富集分析課程TCGA臨床數據生存分析▲①TCGA-轉錄因子分析TCGA-ceRNA調控網ㄨ絡分析

                8.其他課程鏈接:二代測序轉錄組數據自洪六就忍不住低聲吼了起來主分析NCBI數據上傳二代測序數據解讀


                • 發表於 2019-03-25 11:08
                • 閱讀 ( 2331 )
                • 分類:轉錄組

                0 條評論

                請先 登錄 後評論
                美吉生物
                美吉生物

                測序專家

                2 篇文章

                作家榜 ?

                1. omicsgene 301 文章
                2. 安生水 215 文章
                3. Daitoue 168 文章
                4. 生物女╳學霸 120 文章
                5. 紅橙子 39 文章
                6. 生信老頑童 37 文章
                7. landy 37 文章
                8. CORNERSTONE 33 文章