Metagenomics standard operating procedure v2

http://www.360doc.com/content/20/0823/10/71250389_931761136.shtml

https://github.com/LangilleLab/microbiome_helper/wiki/Metagenomics-standard-operating-procedure-v2

Note that this workflow is continually being updated. If you want to use the below commands be sure to keep track of them locally.

Last updated: 9 Oct 2018 (see revisions above for earlier minor versions and Metagenomics SOPs on the SOP for earlier major versions)

Important points to keep in mind:

The […]

Chip seq

何謂ChIP-Seq?

ChIP–seq ( Chromatin immunoprecipitation sequencing )是指染色質免疫沉澱後,所獲得的DNA片段進行高通量定序,並將此片段利用生物資訊的軟體對回至基因體,可以瞭解DNA-binding proteins及histone modifications的狀況,進而得知染色質及相结合的調控因子之間的相互作用關係。

ChIP-chip與ChIP-Seq差異?

次世代定序較ChIP-chip提供更高的解析度,較少的雜訊,較少的ChIP-DNA的量,及可偵測的動態範圍及基因體範圍較廣,因此可呈現較真實的基因調控及表觀遺傳學現況。

如何分析ChIP-Seq資料?

從次世代定序儀所得到的影像檔,會轉換成核苷酸序列,並計算每個核苷酸的錯誤率,將正確性高的序列對到基因體,找到Peak後,與對照組(通常是Input DNA)比較,利用統計學的計算此Enriched region的錯誤率,之後可進行其它的分析。

如何找到Protein binding site?

DNA是雙股的結構,因此ChIP-Seq是從DNA的5’端定序,會對到基因體的正反股,如下圖可看到藍色序列對到的是正股,紅色序列對到的是反股,因序列的數量畫出常態分佈後找到Peak,而兩者高峰處之間為Protein binding site (可稱為Enriched region)。

ChIP-Seq對照組

(1) Input DNA:免疫沉澱實驗前,取打斷的DNA當對照組,

(2) Mock IP DNA:打斷的DNA有經過免疫沈殿的實驗,但沒有加入抗體。

(3) Nonspecific IP DNA:打斷的DNA經過免疫沉澱的實驗,但有加入IgG。

這3個對照組最常用的是Input DNA,是為了矯正DNA打斷及PCR產生的bias。另外,也可以藉由Input DNA核苷酸序列的數量以及免疫沉澱後的核苷酸序列的數量之間比較,瞭解ChIP的效率,如下圖,而此圖也可以瞭解ChIP-Seq及ChIP-chip差異,前者可獲得高解析度及高敏感性的資料。

[…]

Illumina MiSeq 与GS FLX/Junior、Ion Torrent PGM性能比较

Illumina MiSeq 与GS FLX/Junior性能比较表

Illumina MiSeq

GS FLX/Junior

实验流程和周期 提供最快的二代测序的实验流程, 可在8小时内完成从DNA样本其实到分析后的数据,比GS FLX/Junior快5倍。流程包括:l 文库制备:1.5小时,使用快速、transposon-based Nextera方法

l 在一个仪器系统内、以不到4.5小时(1 X 36 bp)的时间完成从自动话的簇生成到测序

l 在同一个仪器系统内,以不到2小时的时间完成初级和次级测序数据分析

l 2 X 150 bp运行约需27小时* GS FLX/Junior 完整实验流程需要几天,包括:l 建库: 1 天

l emPCR: off-instrument and labor-intensive, 2-3 天手工操作

l 测序:10 hours

l 初级和次级测序数据分析8小时(GS FLX), >2 小时(GS Junior) 通量 最高通量的个人化测序仪:l 每次运行可产出1-1.5 […]

第三代测序技术

如果有人告诉你用显微镜实时观测单分子DNA聚合酶复制DNA,并用它来测序,你一定会 认为他异想天开,没有一点生物的sense。 我最初就是这样认为的,然而它不仅可以实现,而且已经实现了!这个就是被称为第三 代的测序技术,Pacific Biosciences公司推出的“Single Molecule Real Time (SMRT ™) DNA Sequencing”(单分子实时DNA测序)。 我有幸在NIH听到了这个技术发明人Stephen Turner博士的讲座,根据自己粗浅的理解 记录整理一下。

要实现单分子实时测序,有三个关键的技术。 第一个是荧光标记的脱氧核苷酸。显微镜现在再厉害,也不可能真的实时看到“单分子 ”。但是它可以实时记录荧光的强度变化。当荧光标记的脱氧核苷酸被掺入DNA链的时 候,它的荧光就同时能在DNA链上探测到。当它与DNA链形成化学键的时候,它的荧光基 团就被DNA聚合酶切除,荧光消失。这种荧光标记的脱氧核苷酸不会影响DNA聚合酶的活 性,并且在荧光被切除之后,合成的DNA链和天然的DNA链完全一样。 第二个是纳米微孔。因为在显微镜实时记录DNA链上的荧光的时候,DNA链周围的众多的 荧光标记的脱氧核苷酸形成了非常强大的荧光背景。这种强大的荧光背景使单分子的荧 光探测成为不可能。Pacific Biosciences公司发明了一种直径只有几十纳米的纳米孔[ zero-mode waveguides (ZMWs)],单分子的DNA聚合酶被固定在这个孔内。在这么小的 孔内,DNA链周围的荧光标记的脱氧核苷酸有限,而且由于A,T,C,G这四种荧光标记 的脱氧核苷酸非常快速地从外面进入到孔内又出去,它们形成了非常稳定的背景荧光信 号。而当某一种荧光标记的脱氧核苷酸被掺入到DNA链时,这种特定颜色的荧光会持续 一小段时间,直到新的化学键形成,荧光基团被DNA聚合酶切除为止(见图)。 第三个是共聚焦显微镜实时地快速地对集成在板上的无数的纳米小孔同时进行记录。由 于我对显微原理的物理知识匮乏,而Pacific Biosciences公司又没有非常强调在这方 面的发明,不做进一步探讨。

他们还对这一技术进行进一步的优化。 第一个是把双链DNA环化反复测序。人们可以在双链DNA的两头连上发夹结构的DNA adaptor,从而使DNA环化。而DNA聚合酶就能够以环化的DNA作为模板滚环复制,反复测 一段DNA序列。这种反复测序,纠正了偶尔出现的复制错误,从而使测序精度非常高。 第二个是激发光中断测序法。DNA聚合酶虽然很稳定,但是在强大的激发光作用下酶也 是有一定寿命的。如果把激发光中断一段时间,在这段时间内DNA聚合酶继续复制DNA, 当激发光重新开启以后,人们就可以测到长DNA链后面的序列。

第三代测序技术非常可怕。1、它实现了DNA聚合酶内在自身的反应速度,一秒可以测10 个碱基,测序速度是化学法测序的2万倍。2、它实现了DNA聚合酶内在自身的 processivity(延续性,也就是DNA聚合酶一次可以合成很长的片段),一个反应就可 以测非常长的序列。 二代测序现在可以测到上百个碱基,但是三代测序现在就可以测 几千个碱基。这为基因组的重复序列的拼接提供了非常好的条件。3、它的精度非常高 ,达到99.9999%。 此外,它还有两个应用是二代测序所不具备的。 第一个是直接测RNA的序列。既然DNA聚合酶能够实时观测,那么以RNA为模板复制DNA的 逆转录酶也同样可以。RNA的直接测序,将大大降低体外逆转录产生的系统误差。 第二个是直接测甲基化的DNA序列。实际上DNA聚合酶复制A、T、C、G的速度是不一样的 。正常的C或者甲基化的C为模板,DNA聚合酶停顿的时间不同。根据这个不同的时间, […]