ゲノム上で、転写因子等のDNA結合タンパク質が結合する所、あるいはヒストン修飾を受けている箇所を検出する手法です。
切断処理されたゲノムDNAに対して、DNA結合タンパク質、あるいは修飾されたヒストンに特異的な抗体を用いて免疫沈降を行うことにより、ゲノムDNAとタンパク質の複合体が得られます。このゲノムDNAをシーケンスすることで、転写因子の結合部位やヒストン修飾の箇所がわかります。
リードをゲノムにマッピングすると、免疫沈降された箇所は、リードが山状に重なります。この山状に重なった部分を検出するアルゴリズムの開発に力が入れられているようです。他の解析のアルゴリズムに比べると比較的簡単で、またこういったシグナル検出は、情報科学の分野では昔から研究されている分野ですので、既にChIP-Seq用のソフトがいくつも出ている状況です。
HP | http://liulab.dfci.harvard.edu/MACS/ |
---|---|
文献 | Model-based Analysis of ChIP-Seq (MACS). Genome Biology 2008 |
OS | Linux、Mac OS |
解説 | タグの分布をポアソン分布を用いてモデル化します。ChIPされたフラグメントのどちらかの側から配列が解読されるため、ゲノム配列に対してforward方向のリードから成るピーク、revser方向のリードから成るピークが離れた位置に検出されます。MACSでは2つのピークをずらす(タグシフト)ことにより正しいピーク位置を算出します。 |
HP | http://www.biostat.jhsph.edu/~hji/cisgenome/index.htm |
---|---|
文献 | An integrated software system for analyzing ChIP-chip and ChIP-seq data. Nature Biotechnology 2008 |
OS | Windows(R)、Mac OS、Linux |
解説 | ChIP-Seqのサンプルとコントロールのデータを用いて、ピークを検出します。FDR (False Discover Rate)の計算にNegative binominal modelを使用しているのが特徴です。Windows版にはGUIも付いています。 |
HP | http://vancouvershortr.sourceforge.net/ |
---|---|
文献 | FindPeaks 3.1: a tool for identifying areas of enrichment from massively parallel short-read sequencing technology. Bioinformatics 2008 |
OS | Linux |
解説 | ChIP-Seqのサンプルとコントロールのデータを用いて、ピークを検出します。 |