-
如何預測新基因編碼蛋白的氨基酸序列
發布時間: 2021-08-21 點擊次數: 2301次當我們想研究一個新基因的功能時,我們首先預測一下它是否編碼蛋白,如果編碼蛋白,那編碼出的蛋白的最有可能的氨基酸序列是什么?
當我們預測出該基因編碼的蛋白的氨基酸序列后,在數據庫中比對,如果比對出了一個高度相似的已知蛋白,那我們可以根據該蛋白的功能來大概的推測我們要研究的新基因所編碼的蛋白的功能,這將為我們之后研究該新基因的功能提供方向。
接下來我們就來說一下怎樣預測一個新基因編碼的蛋白的氨基酸序列。首先我們需要做的就是通過 5’- and 3’-RACE 技術得到該基因的全長 cDNA 序列,然后按以下步驟進行即可。
1.首先打開:web.expasy.org/translate/
2.將 DNA/RNA 序列輸入白色框中(應輸入 cDNA 序列)
3.點擊下方的 TRANSLATE SEQUENCE。
4.點擊 TRANSLATE SEQUENCE 后會看到如下結果(紅色部分為可能的該段 DNA 序列的 ORF 編碼的氨基酸,因為輸入 cDNA 序列后,并不是該段序列上的所有堿基都用來編碼氨基酸, 而是只有位于 ORF 框內的堿基用來編碼氨基酸,ORF 是不確定,所以編碼的蛋白也不確定,那我們現在要做的就是得到最有可能的 氨基酸序列,紅色區域為各種可能)。
5.一般我們認為紅色最多(即最長)的就是該段 cDNA 序列編碼的氨基酸序列。
6.因為第一個紅色最多(即最長),那接下來就點擊第一個。
7.點擊進入后會看到以下結果,我們會看到紅色中有許多的藍色字母(畫紅線的部分),如果我們仔細看了之后會發現藍色部分就是M---甲硫氨酸,我們都知道真核蛋白的起始氨基酸都是甲硫氨酸,也就是說畫紅線的部分就是可能的起始氨基酸部分,那只有一個是最有可能的,那就是使氨基酸序列最長的。因為下圖的結果中只有一個終止------在最后面,那我們選擇第一個劃線的 M 作為起始氨基酸使編碼的氨基酸序列最長 ,所以第一個M 最有可能是起始氨基酸。
8.那接下來就點擊第一個藍色的M,點擊后進入會看到以下結果(紅色框內即為該段cDNA序列最有可能編碼的氨基酸序列)
9.我們還可以看到在結果的的最下方有一些工具(點擊第一個劃線部分可以得到該段氨基酸序列的 Fast 格式。那下方的四個劃線部分就是一些分析蛋白氨基酸序列的一些工具,比如可以拿該段氨基酸序列在數據庫中 Blast,劃線部分的這些工具就是對該段氨基酸序列進行進一步的分析,得到有關該段氨基酸序列更多的信息)。