次世代シーケンサーお悩みカウンセリングTOP

マッピングツール

マッピングは、シーケンサーから出てきた大量のリードについて、参照配列(ゲノム配列)中の該当する箇所を見つける処理です。参照配列自体からして、何百万文字~何十億文字という長さなので、その中から1つのリードと同じ文字列を探すのだけでもそれなりに時間がかかります。そのような処理を何千万リードについて繰り返し行うので、大量の計算が必要になります。

現在、マッピングツールとして以下の3つが有力と言われています。

  • Bowtie
  • BWA
  • SOAP2

そして、これらは全てBurrows-Wheeler変換を利用しています。つい最近まで主流だった,インデックスを利用したアルゴリズムでは、次世代シーケンサーのデータに使うには速度の面で厳しかったのですが、それなりのスペックのサーバーでBurrows-Wheeler変換を利用したソフトを動かせば、十分に対応できるようになりました。

とはいえ、これから登場する第3世代のシーケンサーは、さらに大量のデータが出力される予定です。アルゴリズムの改良が期待されている状態ですが、サーバーのスペックもさらに高いものが要求されそうです。

次世代シーケンサーお悩みカウンセリングTOP