さて、いよいよ2009年も年末に近づき、このブログの更新も滞り・・・、って、言っていてはいけませんので、今年の論文で目にとまったもの今更ながらプレイバックしたいと思います。個人的にはクレイグベンターが新しい生物を作ることを期待していたのですが・・・。
今日の一報は
Real-time DNA sequencing from single polymerase molecules.Science. 323:133-8. (2009)
です。
最近、FLX, illumina, SOLiD, と次世代シークエンサーの名前を聞くことが多いですが、これらは従来のキャピラリーシークエンサーに比べて読める長さは短いものの、それを超並列化することでトータルの長さを稼いでいます(詳しい比較は
幻影随想さん:次世代ゲノムシーケンサの本命は?)。
その次、次々世代シークエンサーということで、一分子でDNAを読むことで、さらに並列化と低コスト化を加速させ、究極的にはヒトゲノムを24時間以内に1000ドル以下で読もう!という目標もあるそうです。ABI 3100の愛用者としては、遠い夢物語ににも思っていましたが、この論文を読んで近い将来、それも
5年後や10年後とかにできている可能性は十分にあるなあと思いました。
この方法は
PacificBioscience(PacBio)が開発したもので、
4色で蛍光標識されたヌクレオチドの中でDNAポリメラーゼ1分子に鋳型の複製をさせれば、合成の際にヌクレオチドがポリメラーゼにトラップされ蛍光が観察されるので、シークエンスがカラーコードとして見える、というものです。このアイディア自体は他のHeliScopeというテクノロジーでも使われているものですが、違う点としてはポリメラーゼのフリーランを見れるところ(HeliScopeでは1塩基読むごとに化学修飾などの時間とコストのかかる操作が必要)で、速く、長く、安くシークエンス出来るということです。

以下、テクニカルな側面を見てみます。
・キーテクノロジーこの1分子シークエンスをするのに重要なブレークスルーとして、
・ZMW(zero-mode-waveguides)
・phospholinked-nucleotide
がありました。
・ZMW(zero-mode-waveguides)一分子からの蛍光を観察するために必要なのは、今や検出器の感度ではありません(検出器には十分な感度がある)。必要なのは
バックグラウンドを低くするための工夫です。
(昼間、星が見えないのは、人間の目の感度が悪いからではありません。夜なら、十分に星を見ることができます。昼間は、星は太陽のバックグラウンドに埋もれて見えないだけです。夜でも都会の空は明るいので、暗い星は見えませんよね。)
ZMWはバックグラウンドの低減に非常に役に立っています。
で、バックグラウンドを低くする工夫として、
「励起する領域を小さくする」アプローチがとられます。励起する領域が小さくなると、そこに含まれる見たい蛍光分子(この場合、DNAポリメラーゼにトラップされた蛍光標識ヌクレオチド)とバックグラウンドのもとになる分子(フリーの蛍光標識ヌクレオチド)の比率は見たい蛍光分子に寄るため、バックグラウンドが低くなります。
この応用として、一分子イメージングに用いられる全反射顕微鏡(TIRFM)とかがあります。TIRFMではエバネッセント場を使うことでカバーグラスから100nm程度しか励起光が当たらない仕組みになっています。しかし、この方法でもバックグラウンドになる分子の濃度が濃くなれば、バックグラウンドは上がることになり、特にDNAポリメラーゼが合成をおこなうのに必要な濃度(~mM)ではバックは高くなってしまいます。
そこで、
さらにバックグラウンドを下げるためのアイディアがZMWなのです。
これはTIRFMよりもさらに励起光があたる領域をせまくしたもので、ゼプトリットル(10の-21乗)レベル、つまりカバーグラスの表面スレスレに存在する蛍光分子しか励起されません。例えば1mMの蛍光分子の溶液の場合、この領域に入っている分子の数は・・・
6x10^23x10^-3x10^-21=0.6個
ということで、カバーグラス表面にいるDNAポリメラーゼがトラップした蛍光標識ヌクレオチドが効率よく見えることになります。
さて、どうやってゼプトリットルでしか励起光が当たらないようにしているのか、ということですが、ZMWは励起光の波長よりも小さな穴のメッシュのことです。すると、このメッシュは励起光を通さなくなります。それは、ちょうど電子レンジの窓にマイクロウェーブの波長よりも小さな穴のメッシュが貼ってあるのでこちら側にマイクロウェーブが漏れてこず、自分たちは沸騰せずにすむの同じ原理です。
しかし、メッシュの穴の中にはわずかながら漏れこみます。その漏れこみ具合がちょうどいい具合に界面スレスレでしか起こりません。それでゼプトリットルレベルの励起が可能になっているのです。

・phospholinked-nucleotide以上の解説で力が尽きてきたのでごく簡単に・・・
従来の蛍光標識ヌクレオチドは塩基が蛍光標識されていたため、それを取りこんでしまうと立体障害のためにDNA合成がストップしてしまいました。それを利用して電気泳動で分離しているのが普通のシークエンサーの原理なのですが、一分子DNAポリメラーゼのフリーランを見るには向いていません。また、蛍光色素がDNA鎖に取り込まれてしまうと、これまたバックグラウンドの原因になります。
そこで、3つ並んだリン酸基の端っこに蛍光標識をすると、
DNA合成でリン酸基をつなげた際に蛍光標識は脱離していってくれます。また、この標識の場合はDNAポリメラーゼもhappyに合成を続けてくれるようです。だから上の2つの障害は取り除かれたことになります。
上にあげた2つの他にも「どうやって4色の蛍光標識を光学的に分離しているのか?」とか「どうやってDNAポリメラーゼを底面にくっつけるのか?」といった点でもおもしろい技術が使われています。また、このPacBioの方法の以外の一分子シークエンスとして、FRETを使った方法(VisiGen)、ナノナイフと塩基の間のトンネル電流を読む方法(Reveo)、ナノポアを使った方法、などなどあるのですが、それはまた機会があれば・・・
また、PacBioはすでにこの方法を応用して
DNAのメチル化の検出やRNAのシークエンスにも成功しており、単一細胞からのDNA・RNAの抽出とくみあわせることで、エピジェネティクスやRNAの解析など、
さまざまな研究の質が変わってくると思います。
最後はデータ処理能力か・・・この方法だと、原理的にはかなりの速い速度でヒトゲノムを読むことができ(
PacBIoは2013年までに15分を目指しているとか・・・)、使われれば使われるほどコストも下がっていくことだと思います。本当に1000ドルを切ると、数百万、数千万のゲノムデータが読まれる可能性は十分にあります。すると、問題は、そのデータをどこに貯え、どうやって管理し、どう解析するか、ということになります。どこかで読んだ話、今現在世界中の配列データベースを合わせても数千億塩基程度、ヒトゲノム100人分程度とか。もちろん、個人差のある部分だけを登録すれば1/100程度にはなるだろうし、他にもいろいろやり方はあるだろうが、それを凌駕するデータ量に埋もれてしまう可能性もあるのではないでしょうか?