DNAのメチレーションの状態を、ゲノムワイドで解析したものです。メチレーションは転写制御やリプログラミングに関わっている、現在とてもホットな分野です。
エピゲノムを解析するための手法は以下のように多数開発されており、それぞれ一長一短があるようです。また、手法ごとに、求められるアルゴリズムも異なっています。
バイサルファイトシーケンス | ゲノムDNAにバイサルファイト処理を行うと、メチル化されていないシトシンはウラシルに変換されますが、メチル化されたシトシンは変換されにくいことを利用します。バイサルファイト処理をしたゲノムDNAの配列を解読して、元のゲノムDNAと比較することで、シトシンがメチル化されているかいないかを1塩基レベルで判定することができます。 |
---|---|
MeDIP-Seq | メチル化シトシンを認識する抗体を用いた免疫沈降法によりメチル化DNAを回収しシーケンスする方法です。ゲノムのうち、リードがマッピングされた領域がメチル化されている領域だと分かります。 |
メチル化DNAの濃縮 | 断片化されたメチル化DNAを濃縮する方法を用いて回収されたDNAをシーケンスする方法です。ゲノムのうち、リードがマッピングされた領域がメチル化されている領域だと分かります。 |
これらを含めたメチレーション解析の方法が、最初の参考文献にまとめられています。
他のエピゲノム解析手法のデータはChIP-Seq用のツール等を流用することで原則解析できますが、バイサルファイトシーケンスには特殊なソフトが必要です。バイサルファイトシーケンスでは、以下の図のようにメチル化されていないシトシンはウラシルに変換されますが、メチル化されたシトシンは変換されにくいことを利用します。しかし、シーケンスされたリードでは、非メチル化Cの箇所がTとなってしまうため、そのままではミスマッチとなり上手くマッピングできません。
バイサルファイトシーケンスのためのソフトウエアでは、非メチル化シトシンの箇所で、リファレンスがCであるのに対して、リードではTとなっているため、これらを上手くマッピングするための工夫がされています。
HP | http://pellegrini.mcdb.ucla.edu/BS_Seeker/BS_Seeker.html |
---|---|
文献 | BS Seeker: precise mapping for bisulfite sequencing. BMC Bioinformatics 2010 |
OS | Linux、Mac OS |
解説 | CとTを同一の文字として扱いマッピングする方法です。リファレンス配列、リード配列のCをTに変換する処理を行い、bowtieでマッピングした後、変換前のリファレンスと比較することでメチル化の有無を判定します。 |
HP | http://code.google.com/p/bsmap/ |
---|---|
文献 | BSMAP: whole genome bisulfite sequence MAPping program. BMC Bioinformatics 2009 |
OS | Linux、Mac OS |
解説 | マッピングソフトのSOAPを改良して作成されたソフトで、BS Seekerとは異なり、マッピングの際にCとTを同一に扱います。 |