Aritalab:Lecture/Biochem/Protein

From Metabolomics.JP
< Aritalab:Lecture | Biochem(Difference between revisions)
Jump to: navigation, search
m (ドメインによる分類)
m (構造の分類と測定)
 
(21 intermediate revisions by one user not shown)
Line 1: Line 1:
[[File:Lecture-Biochem-Protein-PeptideBond.png|thumb|ペプチド結合 ([http://ja.wikipedia.org/wiki/%E3%83%9A%E3%83%97%E3%83%81%E3%83%89%E7%B5%90%E5%90%88 Wikipedia]より)]]
 
 
 
{| style="float:right"
 
{| style="float:right"
 
| __TOC__
 
| __TOC__
 
|}
 
|}
  
タンパク質は20種類のアミノ酸が連なったポリペプチドです。
+
==タンパク質のみかた==
 +
 
 +
タンパク質は20種類の[[Aritalab:Lecture/Biochem/Amino_Acid|アミノ酸]]が連なったポリペプチドです。
  
 
タンパク質を大きく分けると表のようになります。
 
タンパク質を大きく分けると表のようになります。
 
{| class="wikitable"
 
{| class="wikitable"
|rowspan="2"| 水溶性タンパク || 球状 (globular) || 酵素や転写因子など。分子内部は疎水性、外部は親水性。
+
|rowspan="2"| 水溶性タンパク || 球状 (globular) || 酵素や転写因子で、細胞質のようなゾル内で機能するタンパク質です。分子内部は疎水性、外部は親水性アミノ酸が分布しています。
 
|-
 
|-
| 不定形 (disordered) || 真核生物に多い不定構造。親水性アミノ酸が多い。とりわけEPQSRKを含む。
+
| 不定形 (disordered) || 真核生物に多い構造不定のタンパク質です。親水性アミノ酸(とりわけKEPQRS)が多く、転写因子などの相互作用にその性質が利用されるといわれています。
 +
 
 
|-
 
|-
|colspan="2"| 膜タンパク || 受容体、トランスポーターなど。疎水性アミノ酸が多い。とりわけ膜貫通領域は疎水性。
+
|colspan="2"| 膜タンパク || 受容体、トランスポーターなど、脂質二重膜に付着したり埋没した形で機能するタンパク質です。疎水性アミノ酸が多く、とりわけ膜貫通領域は疎水性です。全タンパク質の 3 割ほどを占めるにもかかわらず、結晶化しにくく構造がほとんどわかっていません。
 
|}
 
|}
  
===タンパク質の構造===
+
==アミノ酸指標==
タンパク質は20種類のアミノ酸から構成され、アミノ酸どうしはアミノ基とカルボキシル基の間にペプチド結合を形成します。
+
Kyte と Doolittle は 1982 年に疎水性スケール (hydropathy scale) というアミノ酸毎の疎水度を求めました。<ref>Kyte J, Doolittle R (1982) "A simple method for displaying the hydropathic character of a protein" J Mol Biol 157:105-132</ref> アミノ酸配列をこの数値に変換し、5 から 7 残基のウィンドウで平均化するとタンパク質表面にある領域を予測できます。またウィンドウを 19 から 21 残基にとることで膜貫通領域の予測もできます。(後者の場合、平均値が 1.6 以上が目安とされています。)
この結合は共鳴によって二重結合性を帯びるので平面構造をとります。
+
C&alpha;(アミノ酸の中心炭素)の間に炭素と窒素が1個ずつ入りますが、平面が固定されるのでC<sub>&alpha;</sub>-N結合角(&phi; ファイ)とC<sub>&alpha;</sub>-C結合角は(&psi; プサイ)の二結合ぶんで立体配置を決定できます。
+
  
====一次構造====
+
この後、様々な類似の指標が発表されました。例えばHopp-Woods指標は抗体の抗原部分を予測するために発表されたもので基本的に Kyte-Doolittle の符号が逆転している事がわかります。<ref>Hopp TP, Woods KR (1983) "A computer program for predicting protein antigenic determinants" Mol Immunol 20(4):483-489</ref>また Engelman 指標は Kyte-Doolittle と同様に疎水性の指標として現在も使われています。<ref>Engelman DM, Steitz TA, Goldman A (1986) "Identifying
ペプチド結合によって連結されたアミノ酸の配列を一次構造といいます。コドンの並び順で最初にくるアミノ酸側がアミノ基末端 (N末端)、最後のアミノ酸側がカルボキシル末端 (C末端) となります。
+
nonpolar transbilayer helices in amino acid sequences of membrane proteins" Annu Rev Biophys Biophys Chem 15:321-353</ref> Kyte-Doolittle とは、S, T, W などの値が異なるところが特徴です。これらで計算される値はあくまで「傾向」であり、正確に予測するものではありません。
  
代表的な一次構造のデータベースには以下のものがあります。いずれも特徴的なアミノ酸配列という形式で機能や構造を表現しています。
+
何百と発表されてきたアミノ酸指標は、[http://www.genome.jp/dbget/aaindex.html AAIndex] データベースで検索可能です。
 
+
* [http://prosite.expasy.org/ Prosite] ... タンパク質のドメインや機能モチーフ
+
* [http://smart.embl-heidelberg.de/ Smart] ... ドメインやタンパク質相互作用の計算機による予測サーバー
+
* [http://www.ncbi.nlm.nih.gov/cdd/ CDD] ... 機能、構造ドメインのメタデータベース
+
 
+
====二次構造====
+
タンパク質のドメインは、二次構造という単位で理解されます。二次構造は水素結合や分子間力で構成されるため、加熱や pH、尿素などの変性剤、界面活性剤などで変化します。
+
 
+
水素結合のエネルギーは、1結合あたり 2 &sim; 10 kcal/mol と見積もられており、共有結合と比較すると 1/10 以下になります。
+
 
+
 
+
二次構造の予測にはニューラルネットワークや隠れマルコフモデルが使われます。
+
予測ツールでは[http://www.ebi.ac.uk/Tools/pfa/iprscan/ InterProScan] がよく知られています。これは既存のツール 10 種以上による予測結果をまとめてE-mailで返してくれるシステムで、メタツールと呼ばれます。おおよそ 80 % 程度の精度で二次構造が予測できると考えられています。
+
 
+
* &alpha;-へリックス
+
アミノ酸が平均3.6残基で右巻きにらせんを巻いた構造です。(左巻きもありますが、数は少なくなります。)
+
''n'' 番目のアミノ酸におけるペプチド結合の -C(=O)- 部分が、''n'' + 4 番目のアミノ酸におけるペプチド結合の -N(H)- と水素結合して形成されます。この一般系を 4-&alpha; へリックスと呼びます。
+
このほか 3 アミノ酸、5 アミノ酸で一周する構造もあり、それぞれ 3<sub>10</sub> へリックス、&pi; へリックスと呼ばれます。
+
 
+
* &beta;-シート
+
伸長したアミノ酸が並行に並んだストランド構造です。
+
シートの間で-C(=O)- 部分が -N(H)- と水素結合して形成されます。
+
ストランドが同じ向きに並んだ場合を並行 &beta; シート、互い違いに並んだ場合を逆並行 &beta; シートといいます。
+
 
+
*ループ領域、ターン領域
+
&alpha;-へリックスや&beta;-シートは、特定の構造をとるループや、構造が不定のディスオーダー領域で連結されます。細胞外にある多くのタンパク質では、硫黄を含むシステインどうし間にS-S架橋をつくったジスルフィド結合が立体構造を安定化させます<ref><細胞内のタンパク質は</ref>。
+
また、金属イオンと結合して構造を形成するタンパク質(例. ジンクフィンガータンパク質)もあります。
+
 
+
 
+
====三次構造====
+
いわゆるタンパク質の立体構造を三次構造といい、原子の座標であらわします。三次構造の形成にはアミノ酸側鎖どうしの疎水結合力が大きな役割を果たし、疎水性アミノ酸がタンパク質のコアを形成します。
+
 
+
[http://www.pdbj.org/ Protein Data Bank] (PDB) は代表的な立体構造のデータベースで、およそ 10 万のタンパク質構造が登録されています。
+
正確な立体構造はX線結晶解析やNMRで決定するしかありませんが、進化の観点から、構造既知の配列に似ている配列は、立体構造も似ていると仮定できます。
+
  
 +
{|
 +
|
 
{| class="wikitable"
 
{| class="wikitable"
 +
!colspan=2| Amino acids
 +
! Kyte-Doolittle
 +
! Hopp-Woods
 +
! Engelman
 
|-
 
|-
! アミノ酸の保存率 || 検出できる代表的ソフトウェア || 進化的な考察
+
| A || Alanine || 1.80 || -0.50 || 1.60
 
|-
 
|-
| 30% 以上 || 殆どの配列解析ソフト || 同一祖先由来のホモロジーを持つ
+
| C || Cysteine || 2.50 || -1.00 || 2.00
 
|-
 
|-
| 25%近辺  || Blast (E-value 10<sup>-4</sup>) || トワイライトゾーン。配列解析ソフトの限界
+
| D || Aspartic acid || -3.50 || 3.00 || -9.20
 
|-
 
|-
| 20%以下 || PSI-Blast (E-value 10<sup>-4</sup>) || 立体構造比較が必須。
+
| E || Glutamic acid || -3.50 || 3.00 || -8.20
 +
|-
 +
| F || Phenylalanine || 2.80 || -2.50 || 3.70
 +
|-
 +
| G || Glycine || -0.40 || 0.00 || 1.00
 +
|-
 +
| H || Histidine || -3.20 || -0.50 || -3.00
 +
|-
 +
| I || Isoleucine || 4.50 || -1.80 || 3.10
 +
|-
 +
| K || Lysine || -3.90 || 3.00 || -8.80
 +
|-
 +
| L || Leucine || 3.80 || -1.80 || 2.80
 +
|}
 +
|
 +
{| class="wikitable"
 +
!colspan=2| Amino acids
 +
! Kyte-Doolittle
 +
! Hopp-Woods
 +
! Engelman
 +
|-
 +
| M || Methionine || 1.90 || -1.30 || 3.40
 +
|-
 +
| N || Asparagine || -3.50 || 0.20 || -4.80
 +
|-
 +
| P || Proline || -1.60 || 0.00 || -0.20
 +
|-
 +
| Q || Glutamine || -3.50 || 0.20 || -4.10
 +
|-
 +
| R || Arginine || -4.50 || 3.00 || -12.3
 +
|-
 +
| S || Serine || -0.80 || 0.30 || 0.60
 +
|-
 +
| T || Threonine || -0.70 || -0.40 || 1.20
 +
|-
 +
| V || Valine || 4.20 || -1.50 || 2.60
 +
|-
 +
| W || Tryptophan || -0.90 || -3.40 || 1.90
 +
|-
 +
| Y || Tyrosine || -1.30 || -2.30 || -0.70
 +
|}
 
|}
 
|}
  
 
+
==ラマチャンドランプロット==
====四次構造====
+
 
+
複数のタンパク質サブユニットの空間配置を四次構造といいます。
+
 
+
===二面角===
+
アミノ酸の中心に位置する炭素 (C<sub>&alpha;</sub>) に注目すると、側鎖の他にそれぞれがペプチド結合に関わる -C(=O)- と -N(H)- が接続しています。
+
ペプチド結合は平面構造をとりますが、それぞれが -C-C<sub>&alpha;</sub> 軸と C<sub>&alpha;</sub>-N- 軸を中心に回転できます。
+
その回転角度 &phi;, &psi; は &plusmn;180 &deg; の間をとることができ、二面角と呼ばれます<ref>
+
タンパク質の構造を表現する二面角に対するギリシャ文字は常に
+
: アミノ基側の結合がファイ &phi; ... C(i-1)&minus;N(i)&minus;C<sub>&alpha;</sub>(i)&minus;C(i)
+
: カルボキシル基側の結合がプサイ &psi; ... N(i)&minus;C<sub>&alpha;</sub>(i)&minus;C(i)&minus;N(i+1)
+
を用います。
+
</ref>。
+
 
+
====ラマチャンドランプロット====
+
  
 
{|
 
{|
Line 94: Line 90:
  
 
ラマチャンドラン (Gopalasamudram Narayana Ramachandran) は、インド出身の生物物理学者です。
 
ラマチャンドラン (Gopalasamudram Narayana Ramachandran) は、インド出身の生物物理学者です。
ペプチド鎖の特徴をみるのに、各アミノ酸の&phi;角度と&psi;角度を平面にプロットする方法を考え出しました。
+
ペプチド鎖の特徴をみるのに、各アミノ酸の&phi;角度と&psi;角度を平面にプロットする方法を考え出しました。角度はそれぞれ&alpha;炭素からアミノ基(C-N結合)とカルボキシル基(C-C結合)を見たとき時計回りに何度ねじれているかを表現しています。180°ずれると互い違いのトランス配置を取ると憶えておくと楽です。タンパク質構造の場合、ペプチド結合の平面が互い違いに平面に揃う場合が&plusmn;180°です。
こうするとへリックスとシート構造がきれいに分離され、タンパク質の構造分類に使えます。
+
 
| [[Image:JSBi-Ramaplot.png|250px]]
+
二面角をプロットするとへリックスとシート構造がきれいに分離され、タンパク質の構造分類に使えます。
 +
 
 +
* &alpha;ヘリックス ... 二面角をプロットすると (&phi;, &psi;)=(&minus;60°,&minus;45°)を中心に分布します。
 +
* (逆)並行&beta;シート ... 二面角は (&phi;, &psi;)=(&minus;130°,&minus;120°)を中心に分布します。平面に近い構造なので二面角が180に近づきます。
 +
 
 +
| [[Image:JSBi-Ramaplot.png|250px]](図は[http://ja.wikipedia.org/wiki/%E4%BA%8C%E6%AC%A1%E6%A7%8B%E9%80%A0 ウィキペディア]より)
 
|}
 
|}
  
====コンタクトマップ====
+
==コンタクトマップ==
 +
[[File:JSBi-contactmap.png|right]]
 
縦(上から下にN&rarr;C)横(左から右にN&rarr;C)にペプチド鎖を並べ、C<sub>&alpha;</sub>原子間の距離が10オングストローム以内であれば色を塗ったものをコンタクトマップと呼びます。
 
縦(上から下にN&rarr;C)横(左から右にN&rarr;C)にペプチド鎖を並べ、C<sub>&alpha;</sub>原子間の距離が10オングストローム以内であれば色を塗ったものをコンタクトマップと呼びます。
対角線は同一の残基がくるので黒くなります。&alpha;-へリックスはこの対角線上に重なる形で表示されます。
+
対角線は同一の残基がくるので黒くなります。&alpha;-へリックスは、およそ3.6残基で一周してその径が12オングストローム程度なので、この対角線上に重なるように表示されます。
平行&beta;-シートは対角線から離れた位置に同じ角度で現れ、逆平行&beta;-シートは、対角線と直行する角度で現れます。
+
  
 +
平行&beta;-シートは対角線から離れた位置に対角線と同じ角度で現れます。逆平行&beta;-シートの場合、向きが逆になるので対角線と直行する角度に現れます。
  
==タンパク質構造の分類と測定==
+
==構造の分類と測定==
 +
タンパク質立体構造の研究はミオグロビン(myoglobin: 筋肉にある赤いタンパク質)から始まりました。ジョン・ケンドリュー(John Kendrew)がX線回折で世界ではじめてタンパク質の構造を明らかにしたのは1960年です(そんなに昔ではないのです。予測した構造の
 +
写真が[http://www2.mrc-lmb.cam.ac.uk/photo-archive/john-kendrew-lecturing/ ここ]にあります。)。立体構造解析に対する功績により、ケンドリューはわずか2年後の1962年にノーベル化学賞を授与されています(ペルーツと共同)。
  
===ドメインによる分類===
+
[[Image:Lecture-biochem-protein-myoglobin.jpg|thumb|PDB (1mbn) Myoglobin]]
  
タンパク質の構造は、長さが 50-150アミノ酸程度のドメインと呼ばれるブロックに分けて考えます。各ドメインは機能部位や疎水性コアを持ち、ドメイン間では二次構造があまり近接しません。ドメインとはつまり、タンパク質の構造(および機能)モジュールと捉えられます。
+
DNAに比較すると、タンパク質の構造は遥かに複雑で理解が難しいものでした。
  
立体構造を分類するデータベースには、手作業で構造を分けた [http://scop.mrc-lmb.cam.ac.uk/scop/ SCOP] (structural classification of proteins) や [http://www.cathdb.info/ CATH] があります。いずれもドメインを考慮した分類を採用しており、大きく分けると以下のようになります。(図はCATH DBより)
+
現在、タンパク質の構造は、長さが 50-150アミノ酸程度(平均100)のドメインと呼ばれるブロックに分けて考えます。各ドメインは機能部位や疎水性コアを持ち、ドメイン間の二次構造どうしは近接しません。ドメインとはつまり、タンパク質の構造(および機能)モジュールと捉えられます。金属イオンと結合して構造を形成するドメイン(例. ジンクフィンガー)もあります。
 +
 
 +
 
 +
立体構造を分類するデータベースには、手作業で構造を分けた [http://scop.mrc-lmb.cam.ac.uk/scop/ SCOP] (structural classification of proteins) や [http://www.cathdb.info/ CATH] があります。いずれもドメインを考慮した分類を採用しており、大きく分けると以下のようになります。(図はCATH DBより)より詳しくは [[Aritalab:Lecture/Biochem/ProteinStructure|構造のページ]]をみてください。
  
 
{|
 
{|
Line 120: Line 127:
 
|}
 
|}
  
===測定方法===
+
==測定方法==
 
;ゲル電気泳動
 
;ゲル電気泳動
 
タンパク質は帯電しているので、ポリアクリルアミド電気泳動 (PAGE) で分離できます。
 
タンパク質は帯電しているので、ポリアクリルアミド電気泳動 (PAGE) で分離できます。
Line 130: Line 137:
 
;NMR解析
 
;NMR解析
 
NMRとはNuclear Magnetic Resonanceの略で、原子核の磁気共鳴を用いて原子の位置を特定します。
 
NMRとはNuclear Magnetic Resonanceの略で、原子核の磁気共鳴を用いて原子の位置を特定します。
 
==タンパク質の構造計算==
 
===Ab Initio構造予測===
 
 
どのフォルドを取るかあらかじめ決めずに配列から構造を予測します。
 
* 分子力学 ... エネルギーが低くなる方向に原子を移動して最適化
 
* 分子動力学 ... 原子をニュートンの運動方程式に従って動かして最適化
 
* フラグメントアセンブリ ... 9残基など決められたウィンドウ毎に既知構造ライブラリの中から形状を切り出し、ランダムに入れ替えながら構造を最適化。(ランダムに入れ替えるのでモンテカルロ法の一種)
 
 
===RMSD===
 
RMSD (root mean square deviation) は二つの点集合
 
<math>X = { x_1, x_2, \cdots, x_N} </math> と
 
<math>Y = { y_1, y_2, \cdots, y_N} </math>
 
(具体的にはタンパク質を構成するポリペプチドのC<sub>&alpha;</sub>座標) の間に定義される距離の平均値という意味で、次の式であらわされます。
 
 
<math>
 
\mbox{RMSD}(X,Y) = \sqrt{\frac{1}{N}\sum (x_i - y_i)^{2} }
 
</math>
 
 
例えば PDB に登録されている二つのタンパク質の構造類似度を測るには、ポリペプチドのC<sub>&alpha;</sub> 座標群を回転・平行移動させてできるだけ重ね合わせたときの RMSD を用います。
 
 
===分子の力場===
 
タンパク質は巨大なため、構造を量子力学の立場で記述するとあまりに複雑です。
 
そのため C<sub>&alpha;</sub> 座標のみを用いた力学系で解釈する分子力学がよく使われます。
 
代表的な分子力場のモデルには CHARMM (Chemistry at Harvard using Molecular Mechanics) や AMBER (Assisted Model Building with Energy Refinement) があります。
 
 
まず分子全体のエネルギーを以下のように表します。アミノ酸 ''N'' 個の座標を <math>r^N</math> と表現します。
 
 
<math>
 
\begin{align}
 
V(r^N) &= \Big( \sum_{i} \frac{k_i}{2} (l_i - l_{i0})^2
 
+ \sum_{j} \frac{k_j}{2} (\theta_j - \theta_{j0})^2
 
+ \sum \frac{V_n}{2} ( 1 + \cos (n\omega - \gamma) ) \Big)\\
 
&+ \sum_{i=1}^N \sum_{j=i+1}^N \frac{q_iq_j}{4\pi \epsilon_0 r_{ij}}\\
 
&+ \sum_{i=1}^N \sum_{j=i+1}^N 4 \epsilon_{ij} \Big[ \Big( \frac{\sigma_{ij}}{r_{ij}} \Big)^{12} - \Big( \frac{\sigma_{ij}}{r_{ij}} \Big)^6 \Big]
 
\end{align}
 
</math>
 
 
最初の項は共有結合によるエネルギーです。さらに、結合距離、結合角度、結合のねじれに関するエネルギーから構成されます。
 
* 結合距離 (bond distance)
 
原子間の結合に対して定められる基準距離 <math>l_0</math> から伸縮して生成するエネルギーはフックの法則に従うと考えます。パラメータは <math>l_i</math> です。
 
* 原子価角度 (valence angle)
 
C<sub>&alpha;</sub> が接続する角度がねじれて生成するエネルギーも、フックの法則(二次式)に従うと考えます。同様に <math>\theta_i</math> がパラメータです。
 
* ねじれ角
 
ここにおける <math>V_n, \ n, \ \gamma</math> は原子の種類や配置によって決まる定数で、二面角 <math>\omega</math> がパラメータになります。
 
ねじれ角のエネルギーは結合距離や原子価角度によるものより小さく、二面角は立体構造の中で柔軟に動きうる部分です。
 
 
二項目がクーロン力で、全ての C<sub>&alpha;</sub> 間に定義される長距離相互作用になります。電荷 <math> q_i,\ q_j</math> が距離 <math>r_{ij}</math> だけ0離れたときのエネルギーを計算しています。<math>\epsilon_0</math> は真空の誘電率です。 最後の項は、ファンデルワールス相互作用で、 Lennard-Jones の12-6ポテンシャルという概念に従うと考えます。
 
 
 
===スレッディング===
 
あらかじめ正解の構造がデータベース中にあると仮定して、類似配列を検索する手法です。
 
* ホモロジーモデリング ... アミノ酸が30%以上保存されるような配列を検索
 
* 3D-1D法 ... タンパク質の立体構造を考える上で、20種のアミノ酸を区別する必然性は無いことに注目します。各アミノ酸に環境(極性か非極性か、タンパク質の内側か外側か)分類と二次構造のカテゴリーを割り当て、翻訳されたスコアに基づいて配列相同性をみます。
 
  
  
;解説、参考
+
;参考
 
<references/>
 
<references/>

Latest revision as of 19:55, 15 November 2019

Contents

[edit] タンパク質のみかた

タンパク質は20種類のアミノ酸が連なったポリペプチドです。

タンパク質を大きく分けると表のようになります。

水溶性タンパク 球状 (globular) 酵素や転写因子で、細胞質のようなゾル内で機能するタンパク質です。分子内部は疎水性、外部は親水性アミノ酸が分布しています。
不定形 (disordered) 真核生物に多い構造不定のタンパク質です。親水性アミノ酸(とりわけKEPQRS)が多く、転写因子などの相互作用にその性質が利用されるといわれています。
膜タンパク 受容体、トランスポーターなど、脂質二重膜に付着したり埋没した形で機能するタンパク質です。疎水性アミノ酸が多く、とりわけ膜貫通領域は疎水性です。全タンパク質の 3 割ほどを占めるにもかかわらず、結晶化しにくく構造がほとんどわかっていません。

[edit] アミノ酸指標

Kyte と Doolittle は 1982 年に疎水性スケール (hydropathy scale) というアミノ酸毎の疎水度を求めました。[1] アミノ酸配列をこの数値に変換し、5 から 7 残基のウィンドウで平均化するとタンパク質表面にある領域を予測できます。またウィンドウを 19 から 21 残基にとることで膜貫通領域の予測もできます。(後者の場合、平均値が 1.6 以上が目安とされています。)

この後、様々な類似の指標が発表されました。例えばHopp-Woods指標は抗体の抗原部分を予測するために発表されたもので基本的に Kyte-Doolittle の符号が逆転している事がわかります。[2]また Engelman 指標は Kyte-Doolittle と同様に疎水性の指標として現在も使われています。[3] Kyte-Doolittle とは、S, T, W などの値が異なるところが特徴です。これらで計算される値はあくまで「傾向」であり、正確に予測するものではありません。

何百と発表されてきたアミノ酸指標は、AAIndex データベースで検索可能です。

Amino acids Kyte-Doolittle Hopp-Woods Engelman
A Alanine 1.80 -0.50 1.60
C Cysteine 2.50 -1.00 2.00
D Aspartic acid -3.50 3.00 -9.20
E Glutamic acid -3.50 3.00 -8.20
F Phenylalanine 2.80 -2.50 3.70
G Glycine -0.40 0.00 1.00
H Histidine -3.20 -0.50 -3.00
I Isoleucine 4.50 -1.80 3.10
K Lysine -3.90 3.00 -8.80
L Leucine 3.80 -1.80 2.80
Amino acids Kyte-Doolittle Hopp-Woods Engelman
M Methionine 1.90 -1.30 3.40
N Asparagine -3.50 0.20 -4.80
P Proline -1.60 0.00 -0.20
Q Glutamine -3.50 0.20 -4.10
R Arginine -4.50 3.00 -12.3
S Serine -0.80 0.30 0.60
T Threonine -0.70 -0.40 1.20
V Valine 4.20 -1.50 2.60
W Tryptophan -0.90 -3.40 1.90
Y Tyrosine -1.30 -2.30 -0.70

[edit] ラマチャンドランプロット

アミノ酸配列は、ペプチド結合における二面角のリスト φ1, ψ1, φ2, ψ2, ..., φN, ψN で表すことができます。 この値を平面に散布図としてプロットしたものをラマチャンドラン (Ramachandran) プロットと呼びます。

ラマチャンドラン (Gopalasamudram Narayana Ramachandran) は、インド出身の生物物理学者です。 ペプチド鎖の特徴をみるのに、各アミノ酸のφ角度とψ角度を平面にプロットする方法を考え出しました。角度はそれぞれα炭素からアミノ基(C-N結合)とカルボキシル基(C-C結合)を見たとき時計回りに何度ねじれているかを表現しています。180°ずれると互い違いのトランス配置を取ると憶えておくと楽です。タンパク質構造の場合、ペプチド結合の平面が互い違いに平面に揃う場合が±180°です。

二面角をプロットするとへリックスとシート構造がきれいに分離され、タンパク質の構造分類に使えます。

  • αヘリックス ... 二面角をプロットすると (φ, ψ)=(−60°,−45°)を中心に分布します。
  • (逆)並行βシート ... 二面角は (φ, ψ)=(−130°,−120°)を中心に分布します。平面に近い構造なので二面角が180に近づきます。
JSBi-Ramaplot.png(図はウィキペディアより)

[edit] コンタクトマップ

JSBi-contactmap.png

縦(上から下にN→C)横(左から右にN→C)にペプチド鎖を並べ、Cα原子間の距離が10オングストローム以内であれば色を塗ったものをコンタクトマップと呼びます。 対角線は同一の残基がくるので黒くなります。α-へリックスは、およそ3.6残基で一周してその径が12オングストローム程度なので、この対角線上に重なるように表示されます。

平行β-シートは対角線から離れた位置に対角線と同じ角度で現れます。逆平行β-シートの場合、向きが逆になるので対角線と直行する角度に現れます。

[edit] 構造の分類と測定

タンパク質立体構造の研究はミオグロビン(myoglobin: 筋肉にある赤いタンパク質)から始まりました。ジョン・ケンドリュー(John Kendrew)がX線回折で世界ではじめてタンパク質の構造を明らかにしたのは1960年です(そんなに昔ではないのです。予測した構造の 写真がここにあります。)。立体構造解析に対する功績により、ケンドリューはわずか2年後の1962年にノーベル化学賞を授与されています(ペルーツと共同)。

PDB (1mbn) Myoglobin

DNAに比較すると、タンパク質の構造は遥かに複雑で理解が難しいものでした。

現在、タンパク質の構造は、長さが 50-150アミノ酸程度(平均100)のドメインと呼ばれるブロックに分けて考えます。各ドメインは機能部位や疎水性コアを持ち、ドメイン間の二次構造どうしは近接しません。ドメインとはつまり、タンパク質の構造(および機能)モジュールと捉えられます。金属イオンと結合して構造を形成するドメイン(例. ジンクフィンガー)もあります。


立体構造を分類するデータベースには、手作業で構造を分けた SCOP (structural classification of proteins) や CATH があります。いずれもドメインを考慮した分類を採用しており、大きく分けると以下のようになります。(図はCATH DBより)より詳しくは 構造のページをみてください。

mainly α
Lecture-Biochem-Protein-MainlyA.gif
mainly β
Lecture-Biochem-Protein-MainlyB.gif
α and β
Lecture-Biochem-Protein-MainlyAB.gif
few structures
Lecture-Biochem-Protein-NoAB.gif

[edit] 測定方法

ゲル電気泳動

タンパク質は帯電しているので、ポリアクリルアミド電気泳動 (PAGE) で分離できます。

X線回折

タンパク質を結晶化させられる場合はX線結晶解析により原子位置を特定できます。 粒子加速器から得られるX線を用いると、Cαほか、重い原子の位置を計算できます。水素の位置はわかりません。

NMR解析

NMRとはNuclear Magnetic Resonanceの略で、原子核の磁気共鳴を用いて原子の位置を特定します。


参考
  1. Kyte J, Doolittle R (1982) "A simple method for displaying the hydropathic character of a protein" J Mol Biol 157:105-132
  2. Hopp TP, Woods KR (1983) "A computer program for predicting protein antigenic determinants" Mol Immunol 20(4):483-489
  3. Engelman DM, Steitz TA, Goldman A (1986) "Identifying nonpolar transbilayer helices in amino acid sequences of membrane proteins" Annu Rev Biophys Biophys Chem 15:321-353
Personal tools
Namespaces

Variants
Actions
Navigation
metabolites
Toolbox