次世代シーケンサーお悩みカウンセリングTOP

RNA-Seq

RNA-Seqとは?

細胞の中のmRNAやmiRNAの配列を解読して、発現量の定量、新規転写配列の発見ができる手法です。細胞内のRNAの絶対量を数えることができるようになる可能性があるため、従来の発現量の計測手法であるマイクロアレイを置き換えるとも言われています。

実験

細胞から抽出したRNAをpolyAの有無で選別します(polyA)。また、最近(2009年10月)cDNAに逆転写せずに、直接RNA配列を計測する方法も報告されていてDirect RNA sequencing. Nature 2009、ますます目が離せない分野になりそうです。

ソフトウェア

Splicingを受けた後のmRNAの配列を解読しているため、リードをゲノムにマッピングすると、リードが大量にマッピングされる所と、何もマッピングされないところが交互に繰り返すし、これがそれぞれエキソン、イントロンに該当することがわかります。リードの分布から、エキソン、イントロン構造を推定したり、発現量を定量化したりするソフトウェアが求められています。

Cufflinks

HP http://cufflinks.cbcb.umd.edu/
文献 Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nature Biotechnology 2010
OS Linux、Mac OS
解説 ペアエンドのリードをアセンブルすることで、事前に遺伝子モデルを与えなくとも、アイソフォームごとにエキソンの座標と発現量を算出してくれます。FPKM (Fragments Per Kilobase of transcript per Million fragments sequenced)という単位で出力されます。

ERANGE

HP http://woldlab.caltech.edu/rnaseq/
文献 Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nature Method 2008
OS Linux
解説 参照配列にマッピングされたリードを、既存の遺伝子モデルごとに数え上げることで、発現量を計算してくれるツールです。遺伝子の長さと、リード量で正規化した、RPKM(Reads Per Kilobase of exon Model per million mapped reads)という単位で出力されます。

TopHat

HP http://tophat.cbcb.umd.edu/
文献 TopHat: discovering splice junctions with RNA-Seq. Bioinformatics 2009
OS Linux
解説 splice junctionの位置を推定してくれるツールです。Splice junctionをまたぐリードは参照配列にはマッピングされません。そこで、参照配列にマッピングできなかったリードをsplice junctionの候補配列とアラインメントしてみて、本当にアラインメントされた候補を、splice junctionとする、というアルゴリズムになっています。

参考文献

Direct RNA sequencing. Nature 2009
Helicos社が、自社の一分子シーケンサーであるHeliscope(TM)を使って、酵母の細胞中のmRNAをダイレクトにシーケンスしました。
Mapping and quantifying mammalian transcriptomes by RNA-Seq. Nature Method 2008
CaltechのWold研が行った、RNA-Seqの先駆的な研究成果です。マウスの各組織のサンプルについて行ったRNA-Seqの実験手法についてだけでなく、定量化のための手法も解説しています。この論文の中で、定量化の単位としてRPKMを提唱しています。また、RNA-Seqの有名なソフトウェアであるERANGEは、Wold研がこの実験のために作成したソフトウェアです。

次世代シーケンサーお悩みカウンセリングTOP