用語集
Adenylate kinase isoenzyme 1(アデニレートキナーゼアイソザイムワン):アデニル酸キナーゼ、ADPの再利用に作用する酵素
hypothetical protein(ハイポセティカルプロテイン):仮定的タンパク質
peptide tol.(ペプチドトル):ペプチドの分子量の誤差範囲
アクセッションID:アミノ酸配列に与えられた固有の番号
ゲノム:全遺伝情報
ゲノムプロジェクト:ある生物の全DNA配列を決定する取り組み
メチオニン:アミノ酸の1種
字幕
1
00:00:05,605 --> 00:00:13,79
北大の 「Mascot Server」にアクセス
2
00:00:13,79 --> 00:00:20,787
左上の「Mascot」をクリック
3
00:00:20,787 --> 00:00:23,89
Peptide Mass Fingerprint
というのが
4
00:00:23,89 --> 00:00:26,760
これから行う PMF
5
00:00:26,760 --> 00:00:31,197
PMFは Peptide Mass Fingerprint
の略になります
6
00:00:31,197 --> 00:00:33,400
これをクリックすると
7
00:00:33,400 --> 00:00:34,467
入力画面になります
8
00:00:34,467 --> 00:00:37,837
1番下の大きい入力欄に
9
00:00:37,837 --> 00:00:48,314
(エクセルからのデータを)
貼り付けます
10
00:00:48,314 --> 00:00:53,19
そのほかの様々な設定を
適切に行います
11
00:00:53,19 --> 00:01:03,296
Databaseは
「NCBIcarp」を選択します
12
00:01:03,296 --> 00:01:10,937
その下の
Taxonomy(分類)は そのまま
13
00:01:10,937 --> 00:01:19,346
その下の Enzyme(酵素)は
使ったプロテアーゼの 「Trypsin」を選びます
14
00:01:19,346 --> 00:01:25,618
Allow up to 1 missed cleavages
というのは
15
00:01:25,618 --> 00:01:34,127
タンパク質をリジンとアルギニンのC末端で
切ったときに トリプシンが切り逃すことがあります
16
00:01:34,127 --> 00:01:40,200
リジンやアルギニンがあるけれども
そこで切らなかったということが ありえます
17
00:01:40,200 --> 00:01:47,741
1個 切り逃したペプチドの存在を想定する
設定になります
18
00:01:47,741 --> 00:02:02,722
2とすると 切り逃したリジンやアルギニンが
1か所 または2か所あることを想定した設定になります
19
00:02:02,722 --> 00:02:10,163
0から9まで設定できるので
デフォルトで まず検索してみて
20
00:02:10,163 --> 00:02:16,269
うまく同定できない人は
この数値を変えて やり直してみてください
21
00:02:16,269 --> 00:02:21,207
それから その下に modifications
というのが左と右にあります
22
00:02:21,207 --> 00:02:26,813
右の方(Variable modifications)を
スクロールしていくと
23
00:02:26,813 --> 00:02:31,918
「Oxidation(M)」(酸化)
というのがあります
24
00:02:31,918 --> 00:02:35,455
(M)と(HW) というのがあります
25
00:02:35,455 --> 00:02:40,794
M H W は
アミノ酸の1文字略号です
26
00:02:40,794 --> 00:02:48,501
Mはメチオニンです
メチオニンが 酸化されているかもしれない
27
00:02:48,501 --> 00:02:52,372
左側の内容は 必ず酸化されています
28
00:02:52,372 --> 00:02:58,345
右側の内容は 酸化されているかもしれない
という指定になります
29
00:02:58,345 --> 00:03:03,817
右の方だけ
「Oxidation(M)」を選んでください
30
00:03:03,817 --> 00:03:09,155
それから すごく大事なのが
その下の peptide tol. と書いてあるところです
31
00:03:09,155 --> 00:03:11,491
これは誤差です
32
00:03:11,491 --> 00:03:18,231
何の誤差かというと
先週分析した 質量分析の誤差になります
33
00:03:18,231 --> 00:03:22,802
誤差の数字が
大きすぎたり 小さすぎたりすると
34
00:03:22,802 --> 00:03:27,273
(タンパク質の)同定が
できたり できなかったりします
35
00:03:27,273 --> 00:03:35,148
この実験では
標準のペプチドを分析して校正をやったので
36
00:03:35,148 --> 00:03:39,753
精度は 非常に良くなっていると思います
37
00:03:39,753 --> 00:03:42,789
ここはデフォルトで
1.2となっていますが
38
00:03:42,789 --> 00:03:48,94
0.25 にしてください
39
00:03:48,94 --> 00:03:52,298
(設定を)確認したら
左下の 「Start Search」を押します
40
00:03:52,298 --> 00:03:55,802
サーバーがデータベースの中から
41
00:03:55,802 --> 00:04:05,812
入力した質量スペクトルを
与えるような配列を検索します
42
00:04:05,812 --> 00:04:08,615
これが検索結果画面になります
43
00:04:08,615 --> 00:04:12,18
画面の真ん中の辺りに
ヒストグラムがあります
44
00:04:12,18 --> 00:04:15,588
緑の斜線の四角があります
45
00:04:15,588 --> 00:04:20,860
その斜線の四角よりも右の方に
赤い棒が立っていると
46
00:04:20,860 --> 00:04:24,330
有意な同定ができた
ということになります
47
00:04:24,330 --> 00:04:28,968
もし緑の四角の中にしか
赤い棒がなかったら
48
00:04:28,968 --> 00:04:30,370
タンパク質が見つからない
49
00:04:30,370 --> 00:04:32,372
同定できなかった
ということになります
50
00:04:32,372 --> 00:04:36,710
その時は
前の画面に戻って
51
00:04:36,710 --> 00:04:41,314
パラメーターを変更して
また「Start Search」をクリックして
52
00:04:41,314 --> 00:04:47,220
なんとか赤い棒が緑の枠から出るように
試行錯誤します
53
00:04:47,220 --> 00:04:48,488
(Mascot searchの検索結果画面の)
下の方には
54
00:04:48,488 --> 00:04:52,692
何がヒットしたのか
という情報が書かれています
55
00:04:52,692 --> 00:04:56,596
赤い字でスコアが書かれているのが
有意なヒットということになります
56
00:04:56,596 --> 00:05:04,37
Adenylate kinase isoenzyme 1
という名前が出ています
57
00:05:04,37 --> 00:05:12,45
これが sp11の(バンドの)
タンパク質ということになります
58
00:05:12,45 --> 00:05:16,549
ここに青いリンクになっている
アクセッションIDがあります
59
00:05:16,549 --> 00:05:19,953
(アクセッションIDとタンパク質名)を
(エクセルの)表に入れます
60
00:05:19,953 --> 00:05:22,789
今はタンパク質名が
表示されましたが
61
00:05:22,789 --> 00:05:26,259
タンパク質名が
表示されないことがあります
62
00:05:26,259 --> 00:05:32,665
名前が出ないで
hypothetical protein (仮定的タンパク質)
63
00:05:32,665 --> 00:05:37,70
(名前ではなく)
数字しか出ないです
64
00:05:37,70 --> 00:05:42,208
それから predicted と
出ることもあります
65
00:05:42,208 --> 00:05:45,378
仮定的タンパク質(という表示)は
どういうことかというと
66
00:05:45,378 --> 00:05:47,714
そのようなタンパク質があると
仮定できるけれども
67
00:05:47,714 --> 00:05:51,418
本当にあるかどうか
まだ実験的に証明されていない
68
00:05:51,418 --> 00:05:54,554
という意味になります
69
00:05:54,554 --> 00:06:00,960
コイなどでも
ゲノムプロジェクトが進行していて
70
00:06:00,960 --> 00:06:06,733
全ゲノムの塩基配列を
どんどん分析していきましょう
71
00:06:06,733 --> 00:06:09,703
ということが 今行われています
72
00:06:09,703 --> 00:06:14,107
そのデータが
どんどん蓄積されていっているところです
73
00:06:14,107 --> 00:06:19,312
その塩基配列を機械的に
アミノ酸配列に翻訳してやると
74
00:06:19,312 --> 00:06:23,249
いろいろなタンパク質らしき
アミノ酸配列が たくさん出てきます
75
00:06:23,249 --> 00:06:28,655
そのアミノ酸配列を
データベースに登録しています
76
00:06:28,655 --> 00:06:31,791
だから 何というタンパク質か
わからないけれど
77
00:06:31,791 --> 00:06:35,228
とにかく コイの細胞の中に
そういうタンパク質があって
78
00:06:35,228 --> 00:06:39,999
発現していることが
仮定できますという意味です
79
00:06:39,999 --> 00:06:44,4
タンパク質の名前までは
はっきり示さないで
80
00:06:44,4 --> 00:06:46,906
配列がたくさん登録されています
81
00:06:46,906 --> 00:06:51,378
そして アクセッションIDは
与えられている
82
00:06:51,378 --> 00:06:55,15
というようなことが あります
83
00:06:55,15 --> 00:06:56,516
こういうとき どうするのか
84
00:06:56,516 --> 00:06:59,52
この場合は 一番上に
名前がついている(タンパク質)が ありましたし
85
00:06:59,52 --> 00:07:02,355
それが一番高いスコアを
与えたので 問題ありませんでした
86
00:07:02,355 --> 00:07:04,190
(タンパク質の名前がない)とき
どうするかというのは
87
00:07:04,190 --> 00:07:07,594
この青いリンクをクリックしたときに
88
00:07:07,594 --> 00:07:20,273
上の方に
NCBI BLAST search of KTF93928.1
89
00:07:20,273 --> 00:07:28,214
これは仮定的タンパク質についた
アクセッションIDです
90
00:07:28,214 --> 00:07:30,550
そういう表記が得られます
91
00:07:30,550 --> 00:07:33,586
仮定的タンパク質のアクセッションIDを
クリックして
92
00:07:33,586 --> 00:07:37,991
下にあるのが仮定的タンパク質の
アミノ酸配列です
93
00:07:37,991 --> 00:07:41,227
それが 既に入力された形で
94
00:07:41,227 --> 00:07:43,763
BLASTというページの
95
00:07:43,763 --> 00:07:47,567
ここに アクセッションID
またはアミノ酸配列を入力
96
00:07:47,567 --> 00:07:50,303
というのが済んだ状態で
表示されます