鸿源韬生物

CUT&Tag生信分析报告

1.项目简介

1.1 样本信息

合同编号 RSHi-C
实验技术 Hi-C
物种名称 水稻
拉丁名 Oryza sativa
参考基因组 rice
内切酶 MboI
报告生成日期 2025年06月09日
客户送样名称 测序数据名称 分组
MN MN MN
MD MD MD


1.2 实验原理及流程

Hi-C(High-throughput Chromosome Conformation Capture)是一种基于高通量测序的三维基因组研究技术,用于解析染色质在细胞核内的空间组织及远距离DNA相互作用(Durand NC et al., 2016)。该方法基于染色质构象捕获(Chromosome Conformation Capture, 3C)技术,通过全基因组范围内的染色质互作检测,揭示染色体拓扑结构,如染色质环(Chromatin loops)、拓扑关联结构域(Topologically Associating Domains, TADs)和A/B染色质区室(Compartments)等。

Hi-C 实验原理


染色体作为遗传信息的载体,在细胞核内并非随机分布,而是占据特定的核区域,并形成高度有序的三维结构(LANCTOT C et al., 2007)。染色质的空间构象在细胞的生长、分化及基因调控过程中起着关键作用,其变化可能直接影响基因的表达调控及生物体的发育(SEXTON T et al., 2007)。Hi-C技术源于染色体构象捕获(Chromosome Conformation Capture, 3C)技术,是一种全基因组范围内的三维基因组学研究方法。该技术以整个细胞核为研究对象,结合高通量测序和生物信息学分析,解析染色质DNA在核空间中的互作关系(VAN BERKUM N L et al., 2010)。染色质的空间相互作用对于维持细胞正常功能至关重要,不同染色质区域之间的互作可能影响基因的转录活性、增强子-启动子调控及染色质高级结构的形成(SELVARAJ S et al., 2013)。

Hi-C数据分析可以揭示基因组不同位点之间的交互关系。通常,基因组被划分为固定大小的bin(如5kb、10kb或更大的窗口),以计算两个bin之间的交互强度。交互频率较高的区域可能代表染色质环(chromatin loops)或拓扑关联结构域(TADs),这些结构对于基因表达调控至关重要(FORTIN J P et al., 2015)。Hi-C数据能够与多种组学数据(如ChIP-Seq、转录组测序等)进行系统性整合分析,从而在基因调控网络和表观遗传调控的框架下,深入解析基因表达调控的分子机制及其在生物性状形成中的关键作用。通过多层次的数据整合,研究者能够揭示远程基因调控元件的功能、疾病相关的染色质结构重排事件,以及细胞分化过程中染色质三维构象的动态演变规律。这种整合分析方法为理解复杂生物过程中的染色质空间组织与功能调控提供了重要的研究工具和理论依据。


1.3 实验流程

Hi-C 的实验流程主要包括以下步骤:
a.染色质交联(Crosslinking):通过甲醛(formaldehyde)处理细胞,交联细胞内染色质,使空间上相互接近的DNA片段共价结合,从而保留其天然的三维结构。
b.基因组酶切(Digestion):使用限制性内切酶(如HindIII、MboI或DpnII)切割基因组DNA,产生粘性末端,使得原本相互接近的DNA片段被切割成小片段。
c.粘性末端填充(End Filling)与生物素标记(Biotin Labeling):采用DNA聚合酶填充酶切产生的粘性末端,同时加入生物素标记的dCTP(Biotin-14-dCTP),以便后续富集特定片段。
d.DNA片段连接(Ligation):通过DNA连接酶(T4 DNA ligase)在稀释条件下进行片段连接,使得原本三维空间上相互靠近的DNA片段更可能发生连接,形成嵌合片段(chimeric fragments)。
e.去交联、DNA纯化(Reverse Crosslinking & Purification):通过高温和蛋白酶K消除甲醛交联,释放DNA,同时进行RNA酶和蛋白酶处理,纯化DNA。
f.生物素富集(Biotin Pull-Down):通过链霉亲和素(streptavidin)磁珠特异性富集含有生物素标记的片段,从而去除未成功标记的背景DNA,提高后续测序的特异性。
g.文库构建与测序(Library Preparation & Sequencing):采用高通量测序平台(如Illumina NovaSeq)对富集后的DNA片段进行建库和测序,通常采用双端测序(paired-end sequencing)模式,以便更好地解析DNA片段的配对关系。

1.4 分析流程

获得测序原始数据(raw data)后,首先对原始数据进行过滤,获得高质量的测序数据(clean data),将测序数据(clean data)比对到项目物种的参考基因组上,对比对结果进行鉴定出可用的相互作用(valid pair)。根据valid pair在一定窗口(分辨率)大小下构建全基因组交互矩阵,然后统计特定分辨率矩阵的交互频率、统计 Trans 和 Cis 的数量,对染色体相互作用分析;之后在不同分辨率下进行A/B compartment、TAD 分析和Loop分析。


Hi-C生物信息学分析流程



2. 数据质控

我们交付的原始数据为fastq(简称fq)格式文件的压缩包,文件名后缀通常为 “.fq.gz”。交付数据前我们会计算每个压缩文件的md5值。在您拿到数据之后,请您先校>验每个压缩文件的md5值,Linux下可以在数据目录使用“md5sum -c <*md5.txt>”命令进行校验,Windows下可使用hashmyfiles等校验工具,如发现压缩文件md5值与附在数据文件目录下的md5文档中的不一致则说明文件可能在传输的过程中被损坏。数据文件大小为文件占用磁盘空间的大小,文件的大小通常与磁盘格式、压缩比例等因素有关,与测序数据量(碱基数)的多少无对应关系,因此对应PE测序的 read1和read2两个文件大小也可能不相同。

将高通量测序得到的原始图像数据经过Base Calling 转化为序列数据,即FASTQ格式,得到最原始的测序数据文件。FASTQ 格式文件可记录所测读段(read)的碱基及其质量分数。FASTQ 格式以测序读段为单位进行存储,每条读段占 4 行,第一行是序列标识(read ID)以及相关的描述信息,以“@” 开头;第二行即为碱基序列,长度由测序策略决定;第三行以“+”开头,后面是序列标示符、描述信息,或者什么也不加; 第四行是测序质量值(phred),与第二行一一对应,phred值以ASCII码标记,对应的 ASCII 值减去33,即为第二行对应碱基的测序质量值,示例如下:

@HWI-ST1276:71:C1162ACXX:1:1101:1208:2458 1:N:0:CGATGT
NAAGAACACGTTCGGTCACCTCAGCACACTTGTGAATGTCATGGGATCCAT
+
#55???BBBBB?BA@DEEFFCFFHHFFCFFHHHHHHHFAE0ECFFD/AEHH

测序错误率用e表示, 平台测得数据的碱基质量值用Qphred表示,则有:Qphred=-10log10(e)。软件中碱基识别正确率与Phred分值之间的简明对应关系见下表:

Phred分值不正确的碱基识别碱基正确识别率Q-score
101/1090%Q10
201/10099%Q20
301/100099.9%Q30

测序Reads的错误率往往会随着测序接近尾声而升高,这是由测序过程中化学试剂的消耗造成共有的特征。



2.1 原始数据质控

Hi-C实验基于第二代测序(NGS)平台完成,采用双端测序文库构建策略。我们需要对原始测序数据进行质量评估与过滤,以确保后续分析的可靠性。首先,我们使用FastQC(version 0.12.1)(Andrews, 2010)对原始测序数据(raw data)进行全局质量分析,包括碱基质量分布(Phred score)、碱基组成平衡性(base content uniformity)、重复序列比例(duplication level)及GC含量偏差等指标,以全面评估测序质量。
我们使用Fastp(version 0.24.0)(Chen et al., 2018)对原始测序数据进行以下过滤操作。
接头序列去除:识别并切除双端reads中的接头序列;
低复杂度序列过滤:剔除含模糊碱基(N碱基占比≥10%)的reads;
动态质量修剪:通过滑动窗口法(5 bp窗口步长)评估局部序列质量,当窗口平均Phred score小于20时,执行3'端截断;
长度筛选:保留长度≥25 bp的paired-end reads,长度不足的reads及其匹配reads(R1/R2)均被排除。
原始和过滤后质控结果请详见result/01.qc文件夹,raw为原始数据质控结果,clean为过滤后质控结果。



图2.1 各个样本平均测序碱基质量分数,横坐标代表150 bp长度序列中各个位置,纵坐标为该位置平均的碱基质量值Q;盒形图中间的红线表示中位数(median value);黄色部分代表四分位距(25-75%);上下分割线代表 90%和 10%的上下临界值;蓝色的线代表碱基质量的平均值。


图2.2 各个样本碱基平衡性,图中四条线代表A T C G在每个位置平均含量。理论上,A和T应该相等,G和C应该相等,且4种碱基平行且接近分布。正常情况下四种碱基的出现频率应该是接近的,而且没有位置差异。因此好的样本中四条线应该平行且接近。当部分位置碱基的比例出现 bias 时,即四条线波动较大时可能存在测序数据或者文库污染。如果所有位置的碱基比例一致的表现出bias 时,即四条线平行但分开,往往代表文库有 bias (建库过程或本身特点),或者是测序中的系统误差。测序刚开始由于测序仪状态不稳定,在15bp之前很可能出现波动。


图2.3 各个样本重复序列水平,测序深度越高,越容易产生一定程度的重复(duplication),这属于正常的现象。但如果duplication 的程度很高,就提示我们可能有 bias 的存在(如建库过程中由于 PCR 扩增引起的duplication)。横坐标为 reads 重复的次数,纵坐标为重复次数对应的 reads 占 unique reads 的比例,以unique reads 的总数作为 100%。这里,我们仅对文件前 2000000 个reads 进行统计:对长度小于75bp 的reads 将其截短为 50bp,用于统计重复。


2.2 过滤后数据质控

这里展示Fastp过滤后的数据质控结果,图片内容与上面raw data类似。

图2.4 各个样本平均测序碱基质量分数,横坐标代表150 bp长度序列中各个位置,纵坐标为该位置平均的碱基质量值Q;盒形图中间的红线表示中位数(median value);黄色部分代表四分位距(25-75%);上下分割线代表 90%和 10%的上下临界值;蓝色的线代表碱基质量的平均值。

图2.5 各个样本碱基平衡性,图中四条线代表A T C G在每个位置平均含量。理论上,A和T应该相等,G和C应该相等,且4种碱基平行且接近分布。正常情况下四种碱基的出现频率应该是接近的,而且没有位置差异。因此好的样本中四条线应该平行且接近。当部分位置碱基的比例出现 bias 时,即四条线在某些位置波动较大时,可能测序数据或者文库存在污染。当所有位置的碱基比例一致的表现出bias 时,即四条线平行但分开,往往代表文库有 bias (建库过程或本身特点),或者是测序中的系统误差。一般测序的时候,刚开始测序仪状态不稳定,在15bp之前很可能出现波动。

图2.6 各个样本重复序列水平,测序深度越高,越容易产生一定程度的重复(duplication),这属于正常的现象。但如果duplication 的程度很高,就提示我们可能有 bias 的存在(如建库过程中由于 PCR 扩增引起的duplication)。横坐标为 reads 重复的次数,纵坐标为重复次数对应的 reads 占 unique reads 的比例,以unique reads 的总数作为 100%。这里,我们仅对文件前 2000000 个reads 进行统计:对长度小于75bp 的reads 将其截短为 50bp,用于统计重复。



2.3 数据过滤结果统计

我们对数据过滤结果进行统计,如下表所示:

Sample Raw_Total_Reads Raw_Total_Bases Raw_Q20_Rate Raw_Q30_Rate Raw_GC_Content Clean_Total_Reads Clean_Total_Bases Clean_Q20_Rate Clean_Q30_Rate Clean_GC_Content
MD 339.58M 50937.36M 0.979 0.941 0.436 336.46M 48996.48M 0.983 0.948 0.432
MN 368.65M 55297.66M 0.978 0.936 0.423 365.54M 53570.76M 0.981 0.942 0.420

表 2.1数据过滤结果统计:
Sample:样品名称;
Raw_Total_Reads/Clean_Total_Reads:过滤前后样本总reads数量,单位为百万;
Raw_Total_Bases/Clean_Total_Bases:过滤前后样本总碱基数量,单位为百万;
Raw_Q20_Rate/Clean_Q20_Rate:过滤前后样本Q20碱基比例;
Raw_Q30_Rate/Clean_Q30_Rate:过滤前后样本Q30碱基比例;
Raw_GC_Content/Clean_GC_Content:过滤前后样本GC含量。







3. 比对参考基因组

我们将各样品过滤后的clean data的reads与参考基因组进行比对,获取Reads在参考基因组上的定位信息,这里使用的软件是集成在HiCPro(version 3.1)(Servant N et al., 2015)中的Bowtie2(version 2.4.5)(Langmead B. et al., 2018)。具体流程如下:分别将Reads1和Reads2与参考基因组进行单端比对;对于未能比对的reads,若检测到ligation-site(酶切后文库的连接位点),则截取ligation-site之后的部分进行二次比对。最后,合并两次比对结果,筛选出两端均唯一比对到基因组特定位置的Reads Pair。去掉未比对、自环、再连等非有效数据,以及去掉重复数据,之后根据valid reads pair在一定窗口(分辨率)大小下构建全基因组交互矩阵。


HiCPro比对流程

3.1 比对参考基因组情况

sample Total_pairs_processed Unmapped_pairs Low_qual_pairs Unique_paired_alignments Multiple_pairs_alignments Pairs_with_singleton Low_qual_singleton Unique_singleton_alignments Multiple_singleton_alignments Reported_pairs
MD 168227844 11240000 63648003 44543904 0 48795937 0 0 0 44543904
MN 182772213 10465916 68575042 54702625 0 49028630 0 0 0 54702625

表 3.1 Bowtie2比对情况:
1.sample:样本名称;
2.Total_pairs_processed:输入的总pairs数量;
3.Unmapped_pairs:未比对上的pairs;
4.Low_qual_pairs:比对质量MAPQ低于10pairs;
5.Unique_paired_alignments:比对在基因组中唯一区域的pairs;
6.Multiple_pairs_alignments:比对在多个区域的pairs;
7.Pairs_with_singleton:双端数据中只有一端数据比对上的pairs;
8.Low_qual_singleton:低比对质量且单端比对;
9.Unique_singleton_alignments:单端比对中唯一比对pairs;
10.Multiple_singleton_alignments:单端比对中多重比对pairs;
11.Reported_pairs:可用的pairs数量;





3.2 分子类型统计

由于Hi-C建库的特殊性,Hi-C建库会产生不同的分子类型(BELTON J M et al., 2012),包括自环(Self Circle)、边缘悬挂(Dangling End)、有效互作对(Valid Pair)。不同的分子类型,read1和read2的方向存在差异,Valid Pairs呈现四种类型的比对方向,即FF(两个正向),RR(两个反向),FR和RF,但read1和read2来自不同的酶切片段,Dangling End呈现FR,Self Circle呈现RF,此两种分子类型reads序列来自同一个酶切片段。


sample Valid_interaction_pairs Valid_interaction_pairs_FF Valid_interaction_pairs_RR Valid_interaction_pairs_RF Valid_interaction_pairs_FR Dangling_end_pairs Religation_pairs Self_Cycle_pairs Single-end_pairs Filtered_pairs Dumped_pairs
MD 36169649 10186664 7802399 8084623 10095963 7323965 967937 75010 0 0 7343
MN 44243382 12581066 9273382 9625097 12763837 8444330 1897373 106479 0 0 11061

表 3.1 文库pairs类型:
1.sample:样本名称;
2.Valid_interaction_pairs:合格的pairs数量;
3.Valid_interaction_pairs_F/R:F代表前向链,R代表反向链,来自各个链的互作对数量;
4.Dangling_end_pairs:边缘悬挂,检测到的连接点的末端,但未找到与之连接的另一个末端的pairs;Religation_pairs:重连接对,由于DNA断裂后重新连接产生的pairs;
5.Self_Cycle_pairs:自环对,检测到的连接点与自身连接成环的pairs;
6.Single-end_pairs:单端对,只有一个末端与其他连接点连接的pairs;
7.Filtered_pairs:过滤对,数据分析过程中被过滤的pairs;
8.Dumped_pairs:丢弃对,实验或数据处理过程中被丢弃的pairs。



图3.1 各样本文库pair类型统计。3个柱状图分别是所有比对的片段(All Pairs)、有效 3C 配对(Valid 3C Pairs)和无效 3C 配对(Invalid 3C Pairs)。其中,All Pairs 代表所有测序得到的 Hi-C 片段,部分成功比对到参考基因组,部分因低质量或无匹配区域未能比对。Valid 3C Pairs 是符合 Hi-C 实验要求的有效配对,通常经过质量控制和筛选,而 Invalid 3C Pairs 代表未能通过筛选的片段,可能由于比对错误、低质量数据或不符合 Hi-C 片段要求。不同颜色表示数据的不同分类,如唯一比对、多重比对、未比对和低质量比对等。




3.3 顺反作用统计

Cis表示Paired reads位于同一条染色体上的顺式相互作用(intra-chromosomal interactions),而Trans表示Paired reads位于不同染色体上的反式相互作用(inter-chromosomal interactions)。顺式相互作用可进一步分为长距互作(两端距离大于等于20 kb)和短距互作(两端距离小于20 kb)。在全基因组交互矩阵中,顺式相互作用表现为沿对角线的染色体内交互信号较强,而染色体间交互信号较弱。这种现象部分归因于染色体在细胞核中的物理分离,占据独立的核区域。基于此特征,可通过顺式与反式交互的比例初步评估数据质量。若矩阵中存在随机背景连接等噪音,可能导致顺式与反式交互比例接近。

sample valid_interaction valid_interaction_rmdup trans_interaction cis_interaction cis_shortRange cis_longRange
MD 36169649 28447688 12269382 16178306 4898893 11279413
MN 44243382 32302457 12763566 19538891 7188770 12350121

表 3.2 顺反作用统计:
1.sample:样本名称;
2.valid_interaction:合格的pairs数量;
3.valid_interaction_rmdup:去重重复后可用pairs数量;
4.trans_interaction:染色质之间反式互作数量;
5.cis_interaction:染色质内部顺式互作数量;
6.cis_shortRange:短距离(小于20kb)顺式互作数量;
7.cis_longRange:长距离顺式互作数量。



图3.2 各样本顺反作用统计。左侧Duplicates代表被去除的重复pairs,ValidInteractions代表可用的pairs。右侧代表顺式/反式作用比例。



3.4 样本相关性

我们计算各文库之间pearson相关性,并绘制成heatmap热图:


图3.3 各文库之间pearson相关性热图


3.5 比对可视化

全基因组范围染色体相互作用结果保存为hic格式文件(位于report/result/02.map文件夹中),hic文件是压缩的⼆进制⽂件,无法直接作为文本打开查看。客户可以使用软件Juicebox对hic等文件进行可视化浏览。对于bedpe/bed/bam等格式可以使用IGV浏览,IGV浏览器使用方法可参考我们提供的使用说明文档IGV快速上手







4. 染色质互作分析

4.1 染色质互作频率

普遍而言,Hi-C实验获得的染色质相互作用频率(chromatin interaction frequencies, IFs)在一个给定范围内随着距离的增大而衰减,一般使用交互衰减指数(Interaction decay exponents, IDEs)来描述IFs衰减的斜率陡度。染色质相互作用强度随距离衰减图如下:


图4.1 相互作用强度随距离衰减曲线。如果出现末端翘起代表超过了单条染色体长度,末端部分可以忽视。



4.2 染色体间相互作用

一般情况下,绝大多数的位点间交互分布在同一染色体内部,占比较少的染色体间交互表明染色体并不是随机分布在细胞核内。因此我们进行了染色体间相互作用分析,以发掘不同染色体间交互的基本情况。我们采用Heatmap展示全基因组染色体之间的交互(Valid Reads Pair数取log值),横纵坐标表示不同的染色体;交互强度随颜色深度逐渐增强。各样本全基因组互作图谱请见report/result/03.matplot/wholegenome文件夹。



图4.2 全基因组互作图谱



为了更直观的展示反式相互作用,我们用绘制弦图展示染色体间的交互,下图展示了交互强度排名前1000的bin pair之间的交互。Circos图外围表示基因组上不同染色体;Circos内的曲线表示交互强度前1000 bin pair的位置,各样本弦图请见report/result/03.matplot/ciscir文件夹。



图4.3 染色体间反式相互作用弦图



4.3 染色体内部相互作用

我在这里采用Heatmap展示各个染色体内部之间的顺式相互作用。下面只展示部分染色体的热图,各样本各染色体热图请见report/result/03.matplot/chrmat文件夹。

图4.4 部分染色体内部相互作用热图



5. A/B Compartments

Lieberman-Aiden等在人的Hi-C研究中发现,在Mb级别分辨率下基因组可以划分为两类compartments,称作A/B compartments,Loci之间的交互很多发生在相同的compartments(LIEBERMAN-AIDEN E et al., 2009)。研究发现A compartments和开放染色质区域联系比较紧密,B compartments和封闭染色质区域联系比较紧密。A/B compartments具有细胞特异性,在不同的组织细胞内能够发生转换,这种转换和基因表达调控有一定关系。我们使用HiCExplorer(version 3.7.2)(RAMIREZ F et al., 2018)进行A/B compartments鉴定。

5.1 样本A/B Compartments分析

对于Hi-C实验得到的染色体各位点间(Bin pair)的交互(Valid reads对数)矩阵,我们称作Raw 矩阵,也称作Observed矩阵。HiC实验文库构建的过程中,由于酶切片段间随机性连接的存在,Observed矩阵通常被认为含有背景噪音。要较为真实反映染色体各位点间(Bin pair)的空间交互强弱,Observed矩阵需进行Observed/Expected(O/E)标准化处理。之后对O/E标准化后的矩阵进行Pearson相关性分析,会发现热图存在明暗相间的两种区域,它们对应的基因组区域就是两种compartment。我们对Pearson Correlation矩阵进行分析,得到染色体各位置(Bin)的第一特征向量(First eigenvector)和第二特征向量(Second eigenvector)。一般Bin的First eigenvector的正负两类标签分别代表了A/B compartments的划分。如果First eigenvector不能进行划分,可借助Second eigenvector进行区分。Pearson Correlation 热图与第一特征向量展示图请见report/result/04.ab/pearson文件夹。


图5.1 部分染色体Pearson Correlation 热图与第一特征向量展示图。PC1中标示的正值代表一类compartments、负值代表另一类compartments。结合两类compartments的基因密度、基因表达或表观组学等数据,一般把基因密度、基因表达高或染色质开放性高的一类compartment定义为A compartments,另一类定义为B compartments。



5.2 样本A/B Compartments转换

我们根据前面鉴定到的AB Compartments结果,比较不同样本之间A/B的差异,如果染色体某区域在对照组中是“A”,而在实验组中是“B”,那么我们就称之为发生了“A到B的转变”,转变区域信息记录在bed文件中,请见report/result/04.ab/diffab文件夹。



图5.2 样本之间AB转变区域统计饼图。AA:在实验组和对照组都是A的区域;BB:在实验组和对照组都是B的区域;AtoB:在对照组中为A,在实验组中为B的区域;BtoA:在对照组中为B,在实验组中为A的区域。



图5.3 转变区域在各染色体分布。nodiff:在实验组和对照组都是A或都是B的区域;AtoB:在对照组中为A,在实验组中为B的区域;BtoA:在对照组中为B,在实验组中为A的区域。





6. TAD分析

6.1 各样本TAD分析

在40kb左右分辨率的Hi-C交互热图中,我们能够观察到热图中呈现明显的三角形结。这些三角形的结构被命名为拓扑相关结构域(Topologically associated domains,TAD)。这些结构域之间具有明显的边界,研究表明CTCF和Cohesin等结构蛋白对于TAD边界结构的形成具有重要作用。研究发现TAD结构在不同时空下(组织、发育阶段等)具有一定的保守性,同时也存在一些动态变化。TAD内部之间相互作用比内部与外部相比更加活跃,TAD的边界可能对内外部互作在空间有阻碍作用,当TAD边界变动时,该区域基因表达可能收到影响。我们使用HiCExplorer进行TAD鉴定。


图6.1 TAD结构示意图



在分析过程中我们选用了Insulation的算法来鉴定TAD的边界。Insulation的算法原理是:我们按照一定的分辨率将基因组划分成n个大小相同的bin,对于每个bin,我们以该bin为中心划定一个(500kb-3500kb)左右的范围作为“社区”,计算该bin与“社区内”其他bin交互的总数作为其“社区活跃度”(community contacts),为了衡量该bin在整条染色体的社区活跃水平, 会计算所有bin的“社区活跃度“的均值(mean),并通过公式log2(community contacts/mean)计算该 bin的insulation score(绝缘分数)。在TAD的边界,这些区域的insulation score较低,而TAD内部的区域互作程度较高,因此它们的insulation score 较高。


图6.2 绝缘分数计算示意图



我们使用HiCExplorer算法进行TAD鉴定,结果请见report/result/05.tad文件夹。
其中*domains.bed记录各个TAD位置,这是一组不重叠的基因组坐标文件;*_boundaries.bed/gff记录了TAD边界的位置,基因组坐标与鉴定的分辨率相对应,gff文件内容包含了bed内容并增加了p值和delta值;*_score.bedgraph是记录了TAD分离分数的可视化文件。chrplot文件夹下为各染色体TAD分布以及分离分数。

图6.3 部分染色体TAD分布以及分离分数,全部染色体结果请见chrplot文件夹。下方折线图为Separation score(分离分数,即insulation score),上方染色体互作热图中TAD边界用黑线框标注。



6.2 样本间TAD差异

差异TAD分析原理是对于两个样本的TAD分别进行TAD左边界、TAD右边界和TAD内部Wilcoxon rank-sum test,3个区域p值全部小于0.01则认为两个TAD是不同的。完整结果请见report/result/05.tad/difftad文件夹。其中*accepted.diff_tad代表两个样本相同的TAD,*rejected.diff_tad代表样本特有的TAD,chrplot文件夹为各染色体差异TAD分布。



图6.4 部分染色体样本特异性TAD分布。





7. Loop分析

7.1 各样本Loop分析

染色质环(Chromatin loop)是二维基因组坐标上并不相邻但交互信号强烈的染色质空间结构。我们使用Juicer(version 2.20)(Durand NC et al., 2016)中HiCCUPS (Hi-C Computational Unbiased Peak Search)功能对鉴定样本染色质环并比较样本之间差异loop。它的工作原理是检查Hi-C接触矩阵中的每个像素,并将像素中的接触数量与像素周围一系列区域中的接触数量进行比较,loop两端锚点区域接触频率应该显著高于四周区域。
各样本鉴定loop结果请见report/result/06.loop文件夹,*_loops.bedpe是各样本记录loop信息可视化文件,可在基因组浏览器IGV中可视化。


图7.1 HiCCUPS原理



显示前100行 (共506行)
10 10010000 10020000 10.1 10090000 10100000 . ..1 ..2 ..3 0,255,255 32.0 0.0 1.9475557 5.433665 3.547403 4.3418603E-28 3.883699E-23 4.5933707E-10 6.9230366E-15 3 10018333 10088333 7454
10 19110000 19115000 10 19145000 19150000 . . . . 0,255,255 36.000 14.946 11.791 13.098 15.711 0.000 0.000 0.001 0.013 2 19110000 19150000 3536
10 20210000 20215000 10 20260000 20265000 . . . . 0,255,255 25.000 3.415 4.070 6.018 1.943 0.000 0.000 0.000 0.000 2 20212500 20257500 5000
10 21470000 21480000 10 21520000 21530000 . . . . 0,255,255 48.000 22.789 16.627 19.348 18.980 0.003 0.000 0.000 0.000 2 21475000 21530000 5000
10 14850000 14855000 10 14885000 14890000 . . . . 0,255,255 12.000 0.914 0.756 0.986 0.466 0.001 0.003 0.001 0.002 1 14852500 14887500 0
10 20790000 20800000 10 20850000 20860000 . . . . 0,255,255 70.000 18.869 18.756 34.158 16.824 0.000 0.000 0.000 0.000 2 20800000 20855000 5000
10 11990000 12000000 10 12090000 12100000 . . . . 0,255,255 17.000 4.512 4.114 3.433 3.291 0.006 0.008 0.001 0.001 1 11995000 12095000 0
10 12210000 12220000 10 12260000 12270000 . . . . 0,255,255 15.000 3.073 2.691 3.374 0.578 0.001 0.001 0.007 0.000 1 12215000 12265000 0
10 22425000 22430000 10 22460000 22465000 . . . . 0,255,255 48.000 18.467 20.157 19.478 19.501 0.000 0.000 0.000 0.000 2 22427500 22465000 2500
10 22125000 22130000 10 22160000 22165000 . . . . 0,255,255 28.000 13.164 9.489 11.049 11.063 0.070 0.000 0.010 0.010 2 22127500 22165000 2500
10 18590000 18595000 10 18630000 18635000 . . . . 0,255,255 14.000 3.248 2.362 1.509 1.508 0.019 0.000 0.000 0.000 1 18592500 18632500 0
10 13050000 13055000 10 13085000 13090000 . . . . 0,255,255 29.000 10.557 7.313 9.017 7.640 0.003 0.000 0.000 0.000 6 13047500 13089166 6666
10 16200000 16205000 10 16235000 16240000 . . . . 0,255,255 37.000 11.555 6.681 9.482 10.505 0.000 0.000 0.000 0.000 1 16202500 16237500 0
10 20730000 20735000 10 20765000 20770000 . . . . 0,255,255 22.000 7.449 9.020 6.790 8.759 0.006 0.034 0.006 0.051 2 20727500 20767500 5000
10 20820000 20825000 10 20855000 20860000 . . . . 0,255,255 28.000 8.707 10.818 9.384 9.298 0.000 0.006 0.000 0.001 1 20822500 20857500 0
10 11195000 11200000 10 11250000 11255000 . . . . 0,255,255 33.000 13.658 14.386 14.446 12.741 0.003 0.002 0.005 0.005 3 11194166 11247500 10541
10 3000000 3010000 10 3110000 3120000 . . . . 0,255,255 22.000 5.833 5.606 6.519 6.259 0.000 0.000 0.007 0.008 1 3005000 3115000 0
10 22875000 22880000 10 22910000 22915000 . . . . 0,255,255 26.000 9.851 7.553 8.367 10.286 0.027 0.000 0.002 0.036 2 22877500 22917500 5000
10 15810000 15820000 10 15870000 15880000 . . . . 0,255,255 31.000 12.139 12.110 13.214 11.140 0.002 0.002 0.035 0.002 2 15820000 15875000 5000
10 13160000 13170000 10 13230000 13240000 . . . . 0,255,255 19.000 1.664 3.800 4.550 5.449 0.000 0.000 0.001 0.009 1 13165000 13235000 0
10 19915000 19920000 10 19955000 19960000 . . . . 0,255,255 25.000 9.369 7.747 8.934 5.668 0.006 0.000 0.005 0.000 2 19917500 19955000 2500
11 4920000 4930000 11 4970000 4980000 . . . . 0,255,255 33.000 6.347 8.394 12.684 2.529 0.000 0.000 0.012 0.000 3 4928333 4988333 13743
11 17070000 17075000 11 17210000 17215000 . . . . 0,255,255 16.000 0.677 2.676 4.359 3.008 0.000 0.000 0.021 0.000 2 17065000 17215000 7906
11 170000 175000 11 210000 215000 . . . . 0,255,255 22.000 7.725 8.425 7.914 9.092 0.006 0.034 0.047 0.051 2 167500 207500 7071
11 19880000 19890000 11 19940000 19950000 . . . . 0,255,255 27.000 8.885 7.802 10.382 7.436 0.001 0.000 0.032 0.000 2 19880000 19945000 5000
11 27120000 27130000 11 28720000 28730000 . . . . 0,255,255 33.000 0.879 0.805 1.517 0.876 0.000 0.000 0.000 0.000 4 27125000 28727500 22500
11 11010000 11020000 11 11200000 11210000 . . . . 0,255,255 28.000 5.509 5.521 3.606 9.603 0.000 0.000 0.000 0.001 2 11020000 11205000 5000
11 20770000 20780000 11 20900000 20910000 . . . . 0,255,255 15.000 3.437 3.954 2.518 4.128 0.007 0.053 0.001 0.049 2 20770000 20905000 5000
11 1330000 1335000 11 1365000 1370000 . . . . 0,255,255 21.000 3.080 4.169 3.951 3.450 0.000 0.000 0.000 0.000 1 1332500 1367500 0
11 10600000 10605000 11 10645000 10650000 . . . . 0,255,255 16.000 2.785 3.060 1.454 3.101 0.000 0.000 0.000 0.000 1 10602500 10647500 0
11 17070000 17075000 11 17235000 17240000 . . . . 0,255,255 19.000 1.364 2.140 5.673 2.158 0.000 0.000 0.009 0.000 4 17080000 17245000 10607
11 4800000 4810000 11 7950000 7960000 . . . . 0,255,255 11.000 0.286 0.192 0.092 1.270 0.002 0.007 0.006 0.002 2 4815000 7955000 10000
11 1150000 1160000 11 1220000 1230000 . . . . 0,255,255 27.000 8.444 8.431 8.622 8.794 0.001 0.001 0.002 0.002 1 1155000 1225000 0
11 16480000 16490000 11 16530000 16540000 . . . . 0,255,255 11.000 0.698 1.509 1.347 1.483 0.002 0.002 0.002 0.002 1 16485000 16535000 0
11 5430000 5435000 11 5465000 5470000 . . . . 0,255,255 29.000 7.751 7.218 7.330 7.930 0.000 0.000 0.000 0.000 3 5427500 5467500 5000
11 24930000 24940000 11 24980000 24990000 . . . . 0,255,255 53.000 18.729 16.796 20.981 15.358 0.000 0.000 0.000 0.000 1 24935000 24985000 0
11 1070000 1080000 11 1120000 1130000 . . . . 0,255,255 55.000 24.277 26.332 24.122 26.095 0.000 0.004 0.000 0.005 1 1075000 1125000 0
11 480000 485000 11 530000 535000 . . . . 0,255,255 25.000 7.041 6.870 9.569 6.146 0.000 0.000 0.005 0.000 1 482500 532500 0
11 18780000 18790000 11 18830000 18840000 . . . . 0,255,255 39.000 15.459 12.615 11.747 17.454 0.000 0.000 0.000 0.008 1 18785000 18835000 0
11 27235000 27240000 11 27335000 27340000 . . . . 0,255,255 91.000 4.206 9.031 6.478 8.701 0.000 0.000 0.000 0.000 10 27248500 27335500 36056
11 14880000 14890000 11 14960000 14970000 . . . . 0,255,255 50.000 24.913 22.351 6.164 20.154 0.049 0.001 0.000 0.001 2 14885000 14970000 5000
11 940000 950000 11 1050000 1060000 . . . . 0,255,255 21.000 5.198 5.447 6.897 5.584 0.001 0.001 0.016 0.001 1 945000 1055000 0
11 27220000 27225000 11 27255000 27260000 . . . . 0,255,255 76.000 20.133 30.284 34.472 29.210 0.000 0.000 0.000 0.000 2 27222500 27260000 2500
11 16945000 16950000 11 17030000 17035000 . . . . 0,255,255 21.000 5.842 4.612 7.215 5.324 0.001 0.000 0.014 0.001 1 16947500 17032500 0
11 2905000 2910000 11 2950000 2955000 . . . . 0,255,255 34.000 14.847 15.007 18.930 13.601 0.001 0.001 0.041 0.002 2 2907500 2950000 2500
11 2380000 2385000 11 2415000 2420000 . . . . 0,255,255 29.000 5.665 8.360 7.356 8.490 0.000 0.000 0.000 0.000 2 2380000 2417500 2500
11 14620000 14630000 11 14680000 14690000 . . . . 0,255,255 31.000 6.152 4.640 7.927 3.118 0.000 0.000 0.000 0.000 2 14625000 14690000 5000
11 22680000 22690000 11 25220000 25230000 . . . . 0,255,255 14.000 0.058 0.076 0.563 0.037 0.000 0.000 0.000 0.000 1 22685000 25225000 0
11 7870000 7875000 11 7905000 7910000 . . . . 0,255,255 48.000 11.676 8.986 9.242 9.704 0.000 0.000 0.000 0.000 1 7872500 7907500 0
12 24870000 24880000 12 24920000 24930000 . . . . 0,255,255 66.000 23.047 24.426 26.382 24.474 0.000 0.000 0.000 0.000 1 24875000 24925000 0
12 5065000 5070000 12 5100000 5105000 . . . . 0,255,255 25.000 3.172 6.738 7.409 7.564 0.000 0.000 0.000 0.000 1 5067500 5102500 0
12 9800000 9810000 12 9910000 9920000 . . . . 0,255,255 44.000 14.725 14.372 20.549 15.743 0.000 0.000 0.019 0.000 1 9805000 9915000 0
12 9310000 9315000 12 9350000 9355000 . . . . 0,255,255 35.000 16.385 15.559 12.945 17.356 0.014 0.001 0.001 0.022 2 9312500 9350000 2500
12 17360000 17365000 12 17405000 17410000 . . . . 0,255,255 54.000 2.159 4.854 3.018 10.542 0.000 0.000 0.000 0.000 1 17362500 17407500 0
12 11860000 11870000 12 11920000 11930000 . . . . 0,255,255 87.000 11.216 9.789 2.190 21.887 0.000 0.000 0.000 0.000 2 11870000 11925000 5000
12 1210000 1220000 12 1260000 1270000 . . . . 0,255,255 52.000 19.576 22.234 22.087 23.411 0.000 0.000 0.000 0.000 4 1210000 1270000 7071
12 25830000 25840000 12 25890000 25900000 . . . . 0,255,255 51.000 24.260 20.579 23.840 18.003 0.000 0.000 0.000 0.000 1 25835000 25895000 0
12 25330000 25340000 12 25450000 25460000 . . . . 0,255,255 44.000 15.931 16.367 23.878 14.401 0.000 0.000 0.019 0.000 1 25335000 25455000 0
12 4220000 4230000 12 4450000 4460000 . . . . 0,255,255 26.000 9.521 6.107 6.347 5.873 0.003 0.000 0.000 0.000 1 4225000 4455000 0
12 11740000 11750000 12 11870000 11880000 . . . . 0,255,255 21.000 4.154 4.501 6.011 3.040 0.000 0.000 0.001 0.000 1 11745000 11875000 0
12 27340000 27345000 12 27375000 27380000 . . . . 0,255,255 24.000 3.955 4.803 5.339 4.642 0.000 0.000 0.000 0.000 2 27335000 27382500 9014
12 9460000 9470000 12 9530000 9540000 . . . . 0,255,255 67.000 27.938 29.187 29.944 30.492 0.000 0.000 0.000 0.000 2 9465000 9530000 5000
12 9365000 9370000 12 9430000 9435000 . . . . 0,255,255 25.000 5.384 5.240 7.801 8.753 0.000 0.000 0.000 0.006 3 9372500 9432500 7071
12 6800000 6810000 12 6940000 6950000 . . . . 0,255,255 20.000 4.377 4.974 4.699 5.803 0.000 0.003 0.000 0.003 1 6805000 6945000 0
12 23190000 23200000 12 23240000 23250000 . . . . 0,255,255 75.000 26.149 27.816 23.385 24.885 0.000 0.000 0.000 0.000 1 23195000 23245000 0
12 17925000 17930000 12 17960000 17965000 . . . . 0,255,255 26.000 6.898 6.766 6.393 8.068 0.000 0.000 0.000 0.003 1 17927500 17962500 0
12 23350000 23355000 12 23390000 23395000 . . . . 0,255,255 16.000 1.124 2.475 1.078 4.507 0.000 0.000 0.000 0.018 1 23352500 23392500 0
12 720000 730000 12 780000 790000 . . . . 0,255,255 43.000 18.374 16.312 19.406 15.146 0.001 0.001 0.001 0.000 1 725000 785000 0
12 23845000 23850000 12 23890000 23895000 . . . . 0,255,255 30.000 10.740 10.682 14.186 8.790 0.002 0.001 0.033 0.000 3 23844166 23884166 8976
12 10770000 10780000 12 10840000 10850000 . . . . 0,255,255 35.000 9.833 9.693 12.873 9.291 0.000 0.000 0.003 0.000 1 10775000 10845000 0
12 24415000 24420000 12 24455000 24460000 . . . . 0,255,255 73.000 26.070 20.546 23.933 19.968 0.000 0.000 0.000 0.000 2 24417500 24460000 2500
12 1595000 1600000 12 1650000 1655000 . . . . 0,255,255 27.000 7.954 7.255 5.932 4.520 0.001 0.000 0.000 0.000 3 1600833 1650833 3727
12 27280000 27290000 12 27330000 27340000 . . . . 0,255,255 42.000 17.513 14.487 12.929 18.664 0.001 0.000 0.000 0.001 1 27285000 27335000 0
12 24520000 24530000 12 24700000 24710000 . . . . 0,255,255 17.000 1.635 1.598 2.584 1.873 0.000 0.000 0.000 0.000 1 24525000 24705000 0
12 19780000 19790000 12 19830000 19840000 . . . . 0,255,255 68.000 16.044 31.131 23.154 16.236 0.000 0.001 0.000 0.000 1 19785000 19835000 0
12 25340000 25350000 12 25420000 25430000 . . . . 0,255,255 64.000 22.303 23.525 35.724 21.567 0.000 0.000 0.007 0.000 4 25340000 25430000 7071
12 14450000 14460000 12 14500000 14510000 . . . . 0,255,255 39.000 13.211 14.432 13.820 15.772 0.000 0.000 0.000 0.008 1 14455000 14505000 0
12 19570000 19580000 12 19620000 19630000 . . . . 0,255,255 35.000 7.827 5.737 4.731 7.201 0.000 0.000 0.000 0.000 1 19575000 19625000 0
12 690000 695000 12 1015000 1020000 . . . . 0,255,255 24.000 0.401 2.539 4.094 2.943 0.000 0.000 0.000 0.000 9 685833 1014166 19509
1 3995000 4000000 1 4030000 4035000 . . . . 0,255,255 34.000 10.525 9.202 9.538 9.137 0.000 0.000 0.000 0.000 3 3995833 4037500 6009
1 40235000 40240000 1 40275000 40280000 . . . . 0,255,255 32.000 11.711 10.845 10.723 10.950 0.000 0.000 0.000 0.000 3 40239166 40275833 3728
1 34735000 34740000 1 34790000 34795000 . . . . 0,255,255 27.000 10.066 9.134 12.336 4.290 0.014 0.001 0.019 0.000 3 34744166 34789166 7453
1 12655000 12660000 1 12695000 12700000 . . . . 0,255,255 31.000 9.803 12.350 9.013 14.520 0.000 0.001 0.000 0.018 1 12657500 12697500 0
1 28605000 28610000 1 28650000 28655000 . . . . 0,255,255 17.000 3.091 2.932 3.173 2.260 0.000 0.000 0.001 0.000 2 28610000 28650000 3536
1 37780000 37790000 1 37840000 37850000 . . . . 0,255,255 56.000 26.229 24.561 24.212 27.668 0.003 0.000 0.000 0.003 1 37785000 37845000 0
1 4150000 4160000 1 4240000 4250000 . . . . 0,255,255 25.000 7.609 7.084 9.385 6.683 0.000 0.001 0.009 0.000 1 4155000 4245000 0
1 29310000 29320000 1 29380000 29390000 . . . . 0,255,255 61.000 25.259 24.982 27.623 17.450 0.000 0.000 0.000 0.000 2 29315000 29375000 10000
1 18050000 18055000 1 18090000 18095000 . . . . 0,255,255 33.000 13.117 11.261 8.168 13.665 0.003 0.000 0.000 0.005 1 18052500 18092500 0
1 35000000 35010000 1 35060000 35070000 . . . . 0,255,255 75.000 12.520 17.646 22.538 29.446 0.000 0.000 0.000 0.000 2 35005000 35070000 5000
1 35170000 35180000 1 35220000 35230000 . . . . 0,255,255 64.000 32.402 30.127 34.548 29.568 0.007 0.000 0.007 0.000 1 35175000 35225000 0
1 38330000 38340000 1 38390000 38400000 . . . . 0,255,255 60.000 23.310 24.090 36.633 24.729 0.000 0.000 0.033 0.000 2 38335000 38390000 5000
1 36950000 36955000 1 37005000 37010000 . . . . 0,255,255 30.000 8.145 7.581 9.206 10.076 0.000 0.000 0.000 0.002 4 36958750 37007500 8750
1 39100000 39105000 1 39145000 39150000 . . . . 0,255,255 20.000 7.405 6.949 5.023 7.440 0.028 0.022 0.003 0.031 2 39100000 39140000 7906
1 37310000 37315000 1 37350000 37355000 . . . . 0,255,255 24.000 5.235 6.511 8.456 4.089 0.000 0.001 0.012 0.000 1 37312500 37352500 0
1 37585000 37590000 1 37620000 37625000 . . . . 0,255,255 36.000 9.824 7.642 11.754 5.613 0.000 0.000 0.000 0.000 5 37582500 37621500 6403
1 5590000 5600000 1 5640000 5650000 . . . . 0,255,255 40.000 13.198 16.162 18.067 14.638 0.000 0.004 0.005 0.000 1 5595000 5645000 0
1 30305000 30310000 1 30360000 30365000 . . . . 0,255,255 24.000 9.836 9.632 8.678 7.774 0.012 0.009 0.012 0.001 4 30311250 30357500 8004
1 24480000 24490000 1 24530000 24540000 . . . . 0,255,255 64.000 20.391 21.234 20.119 23.385 0.000 0.000 0.000 0.000 1 24485000 24535000 0
1 26650000 26660000 1 26700000 26710000 . . . . 0,255,255 88.000 24.073 32.333 38.721 46.217 0.000 0.000 0.000 0.000 1 26655000 26705000 0
1 31430000 31440000 1 31520000 31530000 . . . . 0,255,255 25.000 6.141 7.254 7.520 11.246 0.000 0.001 0.000 0.089 2 31435000 31520000 5000
1 8815000 8820000 1 8855000 8860000 . . . . 0,255,255 21.000 3.455 3.860 2.945 4.356 0.000 0.000 0.000 0.000 1 8817500 8857500 0

表7.1 各样本bedpe文件。各列代表信息: 1.chr:第一个锚点所在的染色体编号。
2.x1:第一个锚点的起始基因组坐标。
3.x2:第一个锚点的结束基因组坐标。
4.chr2:第二个锚点所在的染色体编号(通常与chr相同)。
5.y1:第二个锚点的起始基因组坐标。
6.y2:第二个锚点的结束基因组坐标。
7.name:Loop的名称或标识符(缺失时用.表示)。
8.score:Loop的置信度评分(缺失时用.表示)。
9.strand1:第一个锚点所在DNA链的方向(缺失时用.表示)。
10.strand2:第二个锚点所在DNA链的方向(缺失时用.表示)。
11.color:可视化Loop时使用的RGB颜色代码。
12.observed:实际观测到的染色质相互作用次数。
13.expectedBL:基于基线模型(Baseline)计算的预期相互作用次数。
14.expectedDonut:基于环形模型(Donut)计算的预期相互作用次数。
15.expectedH:基于水平结构模型(Horizontal)计算的预期相互作用次数。
16.expectedV:基于垂直结构模型(Vertical)计算的预期相互作用次数。
17.fdrBL:基线模型下计算的错误发现率(FDR),评估Loop显著性。
18.fdrDonut:环形模型下计算的错误发现率(FDR)。
19.fdrH:水平结构模型下计算的错误发现率(FDR)。
20.fdrV:垂直结构模型下计算的错误发现率(FDR)。
21.numCollapsed:合并到当前Loop中的邻近区域数量。
22.centroid1:第一个锚点的质心坐标(中点位置)。
23.centroid2:第二个锚点的质心坐标(中点位置)。
24.radius:Loop覆盖的半径(以碱基对bp为单位)。



7.2 差异Loop分析

我们使用Juicer中的HiCCUPS功能对样本进行差异Loop分析。样本之间特异性loop鉴定结果请见report/result/06.loop/diffloop,A_B_A.bedpe代表样本AB相比较时,只属于A的loop信息文件,可在基因组浏览器IGV中可视化。

显示前100行 (共13行)
1 30305000 30310000 1.1 30360000 30365000 . ..1 ..2 ..3 0,255,255 24.0 9.835705 9.632142 8.678388 7.7737474 0.011801789 0.009228993 0.011838416 0.0011132784 4 30311250 30357500 8004
1 16320000 16330000 1 16380000 16390000 . . . . 0,255,255 41.000 10.909 13.431 10.892 16.833 0.000 0.000 0.000 0.003 1 16325000 16385000 0
2 33430000 33435000 2 33465000 33470000 . . . . 0,255,255 25.000 7.633 7.237 7.308 8.496 0.000 0.000 0.000 0.006 1 33432500 33467500 0
4 34150000 34155000 4 34215000 34220000 . . . . 0,255,255 25.000 6.499 6.030 4.809 7.570 0.000 0.000 0.000 0.000 1 34152500 34217500 0
4 28785000 28790000 4 28820000 28825000 . . . . 0,255,255 19.000 6.550 6.638 6.620 6.510 0.057 0.044 0.061 0.061 2 28790000 28825000 3536
4 30550000 30560000 4 30600000 30610000 . . . . 0,255,255 56.000 26.805 26.078 25.019 29.891 0.003 0.002 0.003 0.003 1 30555000 30605000 0
4 22810000 22815000 4 22845000 22850000 . . . . 0,255,255 29.000 11.375 11.629 11.540 11.865 0.003 0.003 0.005 0.005 1 22812500 22847500 0
4 17620000 17630000 4 19390000 19400000 . . . . 0,255,255 16.000 1.327 1.496 2.280 2.886 0.000 0.000 0.000 0.000 1 17625000 19395000 0
5 16180000 16185000 5 16265000 16270000 . . . . 0,255,255 14.000 3.129 2.363 1.244 2.569 0.003 0.000 0.000 0.003 1 16182500 16267500 0
5 20670000 20675000 5 20720000 20725000 . . . . 0,255,255 32.000 9.979 9.008 8.187 13.127 0.000 0.000 0.000 0.009 4 20677500 20722500 10000
6 30900000 30910000 6 30950000 30960000 . . . . 0,255,255 34.000 11.584 15.021 14.059 11.888 0.000 0.006 0.006 0.000 1 30905000 30955000 0
9 2210000 2220000 9 2550000 2560000 . . . . 0,255,255 13.000 1.380 1.730 2.040 1.825 0.000 0.000 0.002 0.000 1 2215000 2555000 0

表7.2 样本特异性Loop bedpe文件。

8. 差异区域基因注释

我们对差异的TAD边界区域以及差异的Loop锚点区域进行基因注释,并进行GO和KEGG富集分析。如果没有差异分析则本节内容为空。

8.1 差异区域基因注释

我们首先将差异区域划分为500bp 大小的bin,之后使用R包ChIPseeker(version 1.36)(Wang et al., 2022)对各个bin进行注释,我们统计bin在各基因功能元件分布情况,并将各个bin与基因关联。本节结果请详见位于report/result/07.anno文件夹。difftad代表差异的TAD边界区域;diffloop代表差异的Loop锚点区域。"A_B_A_PeakAnno.csv"的含义是A与B比较,A的特异性区域的基因注释文件。


显示前100行 (共240行)
chr start end peaknum annotation geneChr geneStart geneEnd geneLength geneStrand geneId transcriptId distanceToTSS
4 16535000 16535500 MNvsMD_MD_peak_1 Distal Intergenic 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 -3082
4 16535500 16536000 MNvsMD_MD_peak_2 Distal Intergenic 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 -2582
4 16536000 16536500 MNvsMD_MD_peak_3 Distal Intergenic 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 -2082
4 16536500 16537000 MNvsMD_MD_peak_4 Promoter (1-2kb) 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 -1582
4 16537000 16537500 MNvsMD_MD_peak_5 Promoter (1-2kb) 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 -1082
4 16537500 16538000 MNvsMD_MD_peak_6 Promoter (<=1kb) 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 -582
4 16538000 16538500 MNvsMD_MD_peak_7 Promoter (<=1kb) 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 -82
4 16538500 16539000 MNvsMD_MD_peak_8 Promoter (<=1kb) 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 0
4 16539000 16539500 MNvsMD_MD_peak_9 Promoter (<=1kb) 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 419
4 16539500 16540000 MNvsMD_MD_peak_10 Promoter (<=1kb) 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 919
4 16540000 16540500 MNvsMD_MD_peak_11 Promoter (1-2kb) 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 1419
4 16540500 16541000 MNvsMD_MD_peak_12 Promoter (1-2kb) 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 1919
4 16541000 16541500 MNvsMD_MD_peak_13 Exon (Os04t0347600-01/Os04g0347600, exon 5 of 7) 4 16538582 16542602 4021 1 Os04g0347600 Os04t0347600-01 2419
4 16541500 16542000 MNvsMD_MD_peak_14 Exon (Os04t0347600-01/Os04g0347600, exon 6 of 7) 4 16544685 16550808 6124 1 Os04g0347800 Os04t0347800-01 -2685
4 16542000 16542500 MNvsMD_MD_peak_15 3' UTR 4 16544685 16550808 6124 1 Os04g0347800 Os04t0347800-01 -2185
4 16542500 16543000 MNvsMD_MD_peak_16 Promoter (1-2kb) 4 16544685 16550808 6124 1 Os04g0347800 Os04t0347800-01 -1685
4 16543000 16543500 MNvsMD_MD_peak_17 Promoter (1-2kb) 4 16544685 16550808 6124 1 Os04g0347800 Os04t0347800-01 -1185
4 16543500 16544000 MNvsMD_MD_peak_18 Promoter (<=1kb) 4 16544685 16550808 6124 1 Os04g0347800 Os04t0347800-01 -685
4 16544000 16544500 MNvsMD_MD_peak_19 Promoter (<=1kb) 4 16544685 16550808 6124 1 Os04g0347800 Os04t0347800-01 -185
4 16544500 16545000 MNvsMD_MD_peak_20 Promoter (<=1kb) 4 16544685 16550808 6124 1 Os04g0347800 Os04t0347800-01 0
4 16815000 16815500 MNvsMD_MD_peak_21 Exon (Os04t0352400-01/Os04g0352400, exon 9 of 12) 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 2474
4 16815500 16816000 MNvsMD_MD_peak_22 Promoter (1-2kb) 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 1974
4 16816000 16816500 MNvsMD_MD_peak_23 Promoter (1-2kb) 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 1474
4 16816500 16817000 MNvsMD_MD_peak_24 Promoter (<=1kb) 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 974
4 16817000 16817500 MNvsMD_MD_peak_25 Promoter (<=1kb) 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 474
4 16817500 16818000 MNvsMD_MD_peak_26 Promoter (<=1kb) 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 0
4 16818000 16818500 MNvsMD_MD_peak_27 Promoter (<=1kb) 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 -27
4 16818500 16819000 MNvsMD_MD_peak_28 Promoter (<=1kb) 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 -527
4 16819000 16819500 MNvsMD_MD_peak_29 Promoter (1-2kb) 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 -1027
4 16819500 16820000 MNvsMD_MD_peak_30 Promoter (1-2kb) 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 -1527
4 16820000 16820500 MNvsMD_MD_peak_31 Distal Intergenic 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 -2027
4 16820500 16821000 MNvsMD_MD_peak_32 Distal Intergenic 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 -2527
4 16821000 16821500 MNvsMD_MD_peak_33 Distal Intergenic 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 -3027
4 16821500 16822000 MNvsMD_MD_peak_34 Distal Intergenic 4 16813905 16817974 4070 2 Os04g0352400 Os04t0352400-01 -3527
4 16822000 16822500 MNvsMD_MD_peak_35 Distal Intergenic 4 16825210 16825905 696 2 Os04g0352700 Os04t0352700-00 3405
4 16822500 16823000 MNvsMD_MD_peak_36 Distal Intergenic 4 16825210 16825905 696 2 Os04g0352700 Os04t0352700-00 2905
4 16823000 16823500 MNvsMD_MD_peak_37 Distal Intergenic 4 16825210 16825905 696 2 Os04g0352700 Os04t0352700-00 2405
4 16823500 16824000 MNvsMD_MD_peak_38 Promoter (1-2kb) 4 16825210 16825905 696 2 Os04g0352700 Os04t0352700-00 1905
4 16824000 16824500 MNvsMD_MD_peak_39 Promoter (1-2kb) 4 16825210 16825905 696 2 Os04g0352700 Os04t0352700-00 1405
4 16824500 16825000 MNvsMD_MD_peak_40 Promoter (<=1kb) 4 16825210 16825905 696 2 Os04g0352700 Os04t0352700-00 905
5 2555000 2555500 MNvsMD_MD_peak_41 Exon (Os05t0144300-01/Os05g0144300, exon 4 of 12) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 3671
5 2555500 2556000 MNvsMD_MD_peak_42 Intron (Os05t0144300-01/Os05g0144300, intron 3 of 11) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 3171
5 2556000 2556500 MNvsMD_MD_peak_43 Intron (Os05t0144300-01/Os05g0144300, intron 3 of 11) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 2671
5 2556500 2557000 MNvsMD_MD_peak_44 Intron (Os05t0144300-01/Os05g0144300, intron 3 of 11) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 2171
5 2557000 2557500 MNvsMD_MD_peak_45 Promoter (1-2kb) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 1671
5 2557500 2558000 MNvsMD_MD_peak_46 Promoter (1-2kb) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 1171
5 2558000 2558500 MNvsMD_MD_peak_47 Promoter (<=1kb) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 671
5 2558500 2559000 MNvsMD_MD_peak_48 Promoter (<=1kb) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 171
5 2559000 2559500 MNvsMD_MD_peak_49 Promoter (<=1kb) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 0
5 2559500 2560000 MNvsMD_MD_peak_50 Promoter (<=1kb) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 -330
5 2560000 2560500 MNvsMD_MD_peak_51 Promoter (<=1kb) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 -830
5 2560500 2561000 MNvsMD_MD_peak_52 Promoter (1-2kb) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 -1330
5 2561000 2561500 MNvsMD_MD_peak_53 Promoter (1-2kb) 5 2548660 2559171 10512 2 Os05g0144300 Os05t0144300-01 -1830
5 2561500 2562000 MNvsMD_MD_peak_54 Distal Intergenic 5 2564221 2573089 8869 1 Os05g0144400 Os05t0144400-01 -2221
5 2562000 2562500 MNvsMD_MD_peak_55 Promoter (1-2kb) 5 2564221 2573089 8869 1 Os05g0144400 Os05t0144400-01 -1721
5 2562500 2563000 MNvsMD_MD_peak_56 Promoter (1-2kb) 5 2564221 2573089 8869 1 Os05g0144400 Os05t0144400-01 -1221
5 2563000 2563500 MNvsMD_MD_peak_57 Promoter (<=1kb) 5 2564221 2573089 8869 1 Os05g0144400 Os05t0144400-01 -721
5 2563500 2564000 MNvsMD_MD_peak_58 Promoter (<=1kb) 5 2564221 2573089 8869 1 Os05g0144400 Os05t0144400-01 -221
5 2564000 2564500 MNvsMD_MD_peak_59 Promoter (<=1kb) 5 2564221 2573089 8869 1 Os05g0144400 Os05t0144400-01 0
5 2564500 2565000 MNvsMD_MD_peak_60 Promoter (<=1kb) 5 2564221 2573089 8869 1 Os05g0144400 Os05t0144400-01 280
5 2715000 2715500 MNvsMD_MD_peak_61 Promoter (<=1kb) 5 2714257 2716793 2537 1 Os05g0147200 Os05t0147200-01 744
5 2715500 2716000 MNvsMD_MD_peak_62 Promoter (1-2kb) 5 2714257 2716793 2537 1 Os05g0147200 Os05t0147200-01 1244
5 2716000 2716500 MNvsMD_MD_peak_63 Promoter (1-2kb) 5 2714257 2716793 2537 1 Os05g0147200 Os05t0147200-01 1744
5 2716500 2717000 MNvsMD_MD_peak_64 Promoter (1-2kb) 5 2716976 2718263 1288 2 Os05g0147300 Os05t0147300-00 1263
5 2717000 2717500 MNvsMD_MD_peak_65 Promoter (<=1kb) 5 2716976 2718263 1288 2 Os05g0147300 Os05t0147300-00 763
5 2717500 2718000 MNvsMD_MD_peak_66 Promoter (<=1kb) 5 2716976 2718263 1288 2 Os05g0147300 Os05t0147300-00 263
5 2718000 2718500 MNvsMD_MD_peak_67 Promoter (<=1kb) 5 2716976 2718263 1288 2 Os05g0147300 Os05t0147300-00 0
5 2718500 2719000 MNvsMD_MD_peak_68 Promoter (<=1kb) 5 2716976 2718263 1288 2 Os05g0147300 Os05t0147300-00 -238
5 2719000 2719500 MNvsMD_MD_peak_69 Promoter (<=1kb) 5 2716976 2718263 1288 2 Os05g0147300 Os05t0147300-00 -738
5 2719500 2720000 MNvsMD_MD_peak_70 Promoter (<=1kb) 5 2718807 2720596 1790 2 Os05g0147400 Os05t0147400-02 596
5 2720000 2720500 MNvsMD_MD_peak_71 Promoter (<=1kb) 5 2718807 2720596 1790 2 Os05g0147400 Os05t0147400-02 96
5 2720500 2721000 MNvsMD_MD_peak_72 Promoter (<=1kb) 5 2718807 2720596 1790 2 Os05g0147400 Os05t0147400-02 0
5 2721000 2721500 MNvsMD_MD_peak_73 Promoter (<=1kb) 5 2718807 2720596 1790 2 Os05g0147400 Os05t0147400-02 -405
5 2721500 2722000 MNvsMD_MD_peak_74 Promoter (<=1kb) 5 2718807 2720596 1790 2 Os05g0147400 Os05t0147400-02 -905
5 2722000 2722500 MNvsMD_MD_peak_75 Promoter (<=1kb) 5 2718835 2723389 4555 2 Os05g0147400 Os05t0147400-01 889
5 2722500 2723000 MNvsMD_MD_peak_76 Promoter (<=1kb) 5 2718835 2723389 4555 2 Os05g0147400 Os05t0147400-01 389
5 2723000 2723500 MNvsMD_MD_peak_77 Promoter (<=1kb) 5 2718835 2723389 4555 2 Os05g0147400 Os05t0147400-01 0
5 2723500 2724000 MNvsMD_MD_peak_78 Promoter (<=1kb) 5 2718835 2723389 4555 2 Os05g0147400 Os05t0147400-01 -112
5 2724000 2724500 MNvsMD_MD_peak_79 Promoter (<=1kb) 5 2718835 2723389 4555 2 Os05g0147400 Os05t0147400-01 -612
5 2724500 2725000 MNvsMD_MD_peak_80 Promoter (<=1kb) 5 2725695 2733658 7964 1 Os05g0147500 Os05t0147500-01 -695
9 6435000 6435500 MNvsMD_MD_peak_81 Intron (Os09t0287300-01/Os09g0287300, intron 4 of 4) 9 6434671 6438886 4216 2 Os09g0287300 Os09t0287300-01 3386
9 6435500 6436000 MNvsMD_MD_peak_82 Intron (Os09t0287300-01/Os09g0287300, intron 4 of 4) 9 6434671 6438886 4216 2 Os09g0287300 Os09t0287300-01 2886
9 6436000 6436500 MNvsMD_MD_peak_83 Intron (Os09t0287300-01/Os09g0287300, intron 4 of 4) 9 6434671 6438886 4216 2 Os09g0287300 Os09t0287300-01 2386
9 6436500 6437000 MNvsMD_MD_peak_84 Promoter (1-2kb) 9 6434671 6438886 4216 2 Os09g0287300 Os09t0287300-01 1886
9 6437000 6437500 MNvsMD_MD_peak_85 Promoter (1-2kb) 9 6434671 6438886 4216 2 Os09g0287300 Os09t0287300-01 1386
9 6437500 6438000 MNvsMD_MD_peak_86 Promoter (<=1kb) 9 6434671 6438886 4216 2 Os09g0287300 Os09t0287300-01 886
9 6438000 6438500 MNvsMD_MD_peak_87 Promoter (<=1kb) 9 6434671 6438886 4216 2 Os09g0287300 Os09t0287300-01 386
9 6438500 6439000 MNvsMD_MD_peak_88 Promoter (<=1kb) 9 6434671 6438886 4216 2 Os09g0287300 Os09t0287300-01 0
9 6439000 6439500 MNvsMD_MD_peak_89 Promoter (<=1kb) 9 6434671 6438886 4216 2 Os09g0287300 Os09t0287300-01 -115
9 6439500 6440000 MNvsMD_MD_peak_90 Promoter (<=1kb) 9 6434671 6438886 4216 2 Os09g0287300 Os09t0287300-01 -615
9 6440000 6440500 MNvsMD_MD_peak_91 Promoter (1-2kb) 9 6434671 6438886 4216 2 Os09g0287300 Os09t0287300-01 -1115
9 6440500 6441000 MNvsMD_MD_peak_92 Promoter (<=1kb) 9 6439640 6441905 2266 2 Os09g0287500 Os09t0287500-01 905
9 6441000 6441500 MNvsMD_MD_peak_93 Promoter (<=1kb) 9 6439640 6441905 2266 2 Os09g0287500 Os09t0287500-01 405
9 6441500 6442000 MNvsMD_MD_peak_94 Promoter (<=1kb) 9 6439640 6441905 2266 2 Os09g0287500 Os09t0287500-01 0
9 6442000 6442500 MNvsMD_MD_peak_95 Promoter (<=1kb) 9 6439640 6441905 2266 2 Os09g0287500 Os09t0287500-01 -96
9 6442500 6443000 MNvsMD_MD_peak_96 Promoter (<=1kb) 9 6439640 6441905 2266 2 Os09g0287500 Os09t0287500-01 -596
9 6443000 6443500 MNvsMD_MD_peak_97 Promoter (1-2kb) 9 6439640 6441905 2266 2 Os09g0287500 Os09t0287500-01 -1096
9 6443500 6444000 MNvsMD_MD_peak_98 Promoter (1-2kb) 9 6439640 6441905 2266 2 Os09g0287500 Os09t0287500-01 -1596
9 6444000 6444500 MNvsMD_MD_peak_99 Distal Intergenic 9 6439640 6441905 2266 2 Os09g0287500 Os09t0287500-01 -2096
9 6444500 6445000 MNvsMD_MD_peak_100 Distal Intergenic 9 6439640 6441905 2266 2 Os09g0287500 Os09t0287500-01 -2596

表8.1 样本特异性TAD边界基因注释。第一列到第三列为bin在基因组位置;第五列annotation为bin的基因组功能元件身份;第六列到第十列为关联基因的位置信息; 第十一列geneId为基因ID;第十二列transcriptId为转录本ID;第十三列distanceToTSS为peak到TSS距离。


显示前100行 (共192行)
chr start end peaknum annotation geneChr geneStart geneEnd geneLength geneStrand geneId transcriptId distanceToTSS
1 30304000 30304500 MN_MD_MD_peak_1 Distal Intergenic 1 30298621 30299053 433 1 Os01g0726801 Os01t0726801-01 5380
1 30304500 30305000 MN_MD_MD_peak_2 Distal Intergenic 1 30298621 30299053 433 1 Os01g0726801 Os01t0726801-01 5880
1 30305000 30305500 MN_MD_MD_peak_3 Distal Intergenic 1 30311446 30315773 4328 1 Os01g0727100 Os01t0727100-01 -5946
1 30305500 30306000 MN_MD_MD_peak_4 Distal Intergenic 1 30311446 30315773 4328 1 Os01g0727100 Os01t0727100-01 -5446
1 30309000 30309500 MN_MD_MD_peak_5 Promoter (1-2kb) 1 30311446 30315773 4328 1 Os01g0727100 Os01t0727100-01 -1946
1 30309500 30310000 MN_MD_MD_peak_6 Promoter (1-2kb) 1 30311446 30315773 4328 1 Os01g0727100 Os01t0727100-01 -1446
1 30310000 30310500 MN_MD_MD_peak_7 Promoter (<=1kb) 1 30311446 30315773 4328 1 Os01g0727100 Os01t0727100-01 -946
1 30310500 30311000 MN_MD_MD_peak_8 Promoter (<=1kb) 1 30311446 30315773 4328 1 Os01g0727100 Os01t0727100-01 -446
1 30359000 30359500 MN_MD_MD_peak_9 3' UTR 1 30361864 30364101 2238 1 Os01g0728100 Os01t0728100-01 -2364
1 30359500 30360000 MN_MD_MD_peak_10 Promoter (1-2kb) 1 30361864 30364101 2238 1 Os01g0728100 Os01t0728100-01 -1864
1 30360000 30360500 MN_MD_MD_peak_11 Promoter (1-2kb) 1 30361864 30364101 2238 1 Os01g0728100 Os01t0728100-01 -1364
1 30360500 30361000 MN_MD_MD_peak_12 Promoter (<=1kb) 1 30361864 30364101 2238 1 Os01g0728100 Os01t0728100-01 -864
1 30364000 30364500 MN_MD_MD_peak_13 Promoter (<=1kb) 1 30363380 30364093 714 1 Os01g0728100 Os01t0728100-02 621
1 30364500 30365000 MN_MD_MD_peak_14 Promoter (<=1kb) 1 30364320 30365422 1103 2 Os01g0728150 Os01t0728150-00 422
1 30365000 30365500 MN_MD_MD_peak_15 Promoter (<=1kb) 1 30364320 30365422 1103 2 Os01g0728150 Os01t0728150-00 0
1 30365500 30366000 MN_MD_MD_peak_16 Promoter (<=1kb) 1 30364320 30365422 1103 2 Os01g0728150 Os01t0728150-00 -79
1 16319000 16319500 MN_MD_MD_peak_17 Downstream (<=300bp) 1 16315793 16318736 2944 1 Os01g0387566 Os01t0387566-00 3208
1 16319500 16320000 MN_MD_MD_peak_18 Distal Intergenic 1 16322731 16325678 2948 1 Os01g0387865 Os01t0387865-01 -2731
1 16320000 16320500 MN_MD_MD_peak_19 Distal Intergenic 1 16322731 16325678 2948 1 Os01g0387865 Os01t0387865-01 -2231
1 16320500 16321000 MN_MD_MD_peak_20 Promoter (1-2kb) 1 16322731 16325678 2948 1 Os01g0387865 Os01t0387865-01 -1731
1 16329000 16329500 MN_MD_MD_peak_21 Promoter (<=1kb) 1 16327940 16328374 435 2 Os01g0388101 Os01t0388101-00 -627
1 16329500 16330000 MN_MD_MD_peak_22 Promoter (1-2kb) 1 16327940 16328374 435 2 Os01g0388101 Os01t0388101-00 -1127
1 16330000 16330500 MN_MD_MD_peak_23 Promoter (1-2kb) 1 16327940 16328374 435 2 Os01g0388101 Os01t0388101-00 -1627
1 16330500 16331000 MN_MD_MD_peak_24 Distal Intergenic 1 16327940 16328374 435 2 Os01g0388101 Os01t0388101-00 -2127
1 16379000 16379500 MN_MD_MD_peak_25 Distal Intergenic 1 16385640 16389527 3888 1 Os01g0388500 Os01t0388500-00 -6140
1 16379500 16380000 MN_MD_MD_peak_26 Distal Intergenic 1 16385640 16389527 3888 1 Os01g0388500 Os01t0388500-00 -5640
1 16380000 16380500 MN_MD_MD_peak_27 Distal Intergenic 1 16385640 16389527 3888 1 Os01g0388500 Os01t0388500-00 -5140
1 16380500 16381000 MN_MD_MD_peak_28 Distal Intergenic 1 16385640 16389527 3888 1 Os01g0388500 Os01t0388500-00 -4640
1 16389000 16389500 MN_MD_MD_peak_29 Exon (Os01t0388500-00/Os01g0388500, exon 4 of 4) 1 16385640 16389527 3888 1 Os01g0388500 Os01t0388500-00 3361
1 16389500 16390000 MN_MD_MD_peak_30 3' UTR 1 16392304 16393382 1079 2 Os01g0388700 Os01t0388700-01 3382
1 16390000 16390500 MN_MD_MD_peak_31 Distal Intergenic 1 16392304 16393382 1079 2 Os01g0388700 Os01t0388700-01 2882
1 16390500 16391000 MN_MD_MD_peak_32 Distal Intergenic 1 16392304 16393382 1079 2 Os01g0388700 Os01t0388700-01 2382
2 33429000 33429500 MN_MD_MD_peak_33 Promoter (<=1kb) 2 33429949 33433751 3803 1 Os02g0787100 Os02t0787100-01 -449
2 33429500 33430000 MN_MD_MD_peak_34 Promoter (<=1kb) 2 33429949 33433751 3803 1 Os02g0787100 Os02t0787100-01 0
2 33430000 33430500 MN_MD_MD_peak_35 Promoter (<=1kb) 2 33429949 33433751 3803 1 Os02g0787100 Os02t0787100-01 52
2 33430500 33431000 MN_MD_MD_peak_36 Promoter (<=1kb) 2 33429949 33433751 3803 1 Os02g0787100 Os02t0787100-01 552
2 33434000 33434500 MN_MD_MD_peak_37 Promoter (<=1kb) 2 33434089 33439102 5014 1 Os02g0787200 Os02t0787200-01 0
2 33434500 33435000 MN_MD_MD_peak_38 Promoter (<=1kb) 2 33434089 33439102 5014 1 Os02g0787200 Os02t0787200-01 412
2 33435000 33435500 MN_MD_MD_peak_39 Promoter (<=1kb) 2 33434089 33439102 5014 1 Os02g0787200 Os02t0787200-01 912
2 33435500 33436000 MN_MD_MD_peak_40 Promoter (1-2kb) 2 33434089 33439102 5014 1 Os02g0787200 Os02t0787200-01 1412
2 33464000 33464500 MN_MD_MD_peak_41 Distal Intergenic 2 33459490 33460942 1453 2 Os02g0787533 Os02t0787533-00 -3059
2 33464500 33465000 MN_MD_MD_peak_42 Distal Intergenic 2 33459490 33460942 1453 2 Os02g0787533 Os02t0787533-00 -3559
2 33465000 33465500 MN_MD_MD_peak_43 Distal Intergenic 2 33469138 33475992 6855 1 Os02g0787600 Os02t0787600-01 -3638
2 33465500 33466000 MN_MD_MD_peak_44 Distal Intergenic 2 33469138 33475992 6855 1 Os02g0787600 Os02t0787600-01 -3138
2 33469000 33469500 MN_MD_MD_peak_45 Promoter (<=1kb) 2 33469138 33475992 6855 1 Os02g0787600 Os02t0787600-01 0
2 33469500 33470000 MN_MD_MD_peak_46 Promoter (<=1kb) 2 33469138 33475992 6855 1 Os02g0787600 Os02t0787600-01 363
2 33470000 33470500 MN_MD_MD_peak_47 Promoter (<=1kb) 2 33469138 33475992 6855 1 Os02g0787600 Os02t0787600-01 863
2 33470500 33471000 MN_MD_MD_peak_48 Promoter (1-2kb) 2 33472257 33475994 3738 1 Os02g0787600 Os02t0787600-02 -1257
4 34149000 34149500 MN_MD_MD_peak_49 Promoter (1-2kb) 4 34148182 34150717 2536 2 Os04g0669500 Os04t0669500-01 1217
4 34149500 34150000 MN_MD_MD_peak_50 Promoter (<=1kb) 4 34148182 34150717 2536 2 Os04g0669500 Os04t0669500-01 717
4 34150000 34150500 MN_MD_MD_peak_51 Promoter (<=1kb) 4 34148182 34150717 2536 2 Os04g0669500 Os04t0669500-01 217
4 34150500 34151000 MN_MD_MD_peak_52 Promoter (<=1kb) 4 34148182 34150717 2536 2 Os04g0669500 Os04t0669500-01 0
4 34154000 34154500 MN_MD_MD_peak_53 Promoter (<=1kb) 4 34153140 34154923 1784 2 Os04g0669700 Os04t0669700-00 423
4 34154500 34155000 MN_MD_MD_peak_54 Promoter (<=1kb) 4 34153140 34154923 1784 2 Os04g0669700 Os04t0669700-00 0
4 34155000 34155500 MN_MD_MD_peak_55 Promoter (<=1kb) 4 34153140 34154923 1784 2 Os04g0669700 Os04t0669700-00 -78
4 34155500 34156000 MN_MD_MD_peak_56 Promoter (<=1kb) 4 34153140 34154923 1784 2 Os04g0669700 Os04t0669700-00 -578
4 34214000 34214500 MN_MD_MD_peak_57 Promoter (<=1kb) 4 34209652 34214792 5141 2 Os04g0670600 Os04t0670600-02 292
4 34214500 34215000 MN_MD_MD_peak_58 Promoter (<=1kb) 4 34209652 34214792 5141 2 Os04g0670600 Os04t0670600-02 0
4 34215000 34215500 MN_MD_MD_peak_59 Promoter (<=1kb) 4 34211238 34214800 3563 2 Os04g0670600 Os04t0670600-01 -201
4 34215500 34216000 MN_MD_MD_peak_60 Promoter (<=1kb) 4 34215822 34222368 6547 1 Os04g0670800 Os04t0670800-01 0
4 34219000 34219500 MN_MD_MD_peak_61 Promoter (<=1kb) 4 34218060 34222338 4279 1 Os04g0670800 Os04t0670800-02 941
4 34219500 34220000 MN_MD_MD_peak_62 Promoter (1-2kb) 4 34218060 34222338 4279 1 Os04g0670800 Os04t0670800-02 1441
4 34220000 34220500 MN_MD_MD_peak_63 Promoter (1-2kb) 4 34218060 34222338 4279 1 Os04g0670800 Os04t0670800-02 1941
4 34220500 34221000 MN_MD_MD_peak_64 Intron (Os04t0670800-01/Os04g0670800, intron 8 of 9) 4 34218060 34222338 4279 1 Os04g0670800 Os04t0670800-02 2441
4 28784000 28784500 MN_MD_MD_peak_65 Distal Intergenic 4 28788533 28791208 2676 1 Os04g0571800 Os04t0571800-01 -4033
4 28784500 28785000 MN_MD_MD_peak_66 Distal Intergenic 4 28788533 28791208 2676 1 Os04g0571800 Os04t0571800-01 -3533
4 28785000 28785500 MN_MD_MD_peak_67 Distal Intergenic 4 28788533 28791208 2676 1 Os04g0571800 Os04t0571800-01 -3033
4 28785500 28786000 MN_MD_MD_peak_68 Distal Intergenic 4 28788533 28791208 2676 1 Os04g0571800 Os04t0571800-01 -2533
4 28789000 28789500 MN_MD_MD_peak_69 Promoter (<=1kb) 4 28788578 28791105 2528 1 Os04g0571800 Os04t0571800-02 423
4 28789500 28790000 MN_MD_MD_peak_70 Promoter (<=1kb) 4 28788578 28791105 2528 1 Os04g0571800 Os04t0571800-02 923
4 28790000 28790500 MN_MD_MD_peak_71 Promoter (1-2kb) 4 28788578 28791105 2528 1 Os04g0571800 Os04t0571800-02 1423
4 28790500 28791000 MN_MD_MD_peak_72 Promoter (1-2kb) 4 28788578 28791105 2528 1 Os04g0571800 Os04t0571800-02 1923
4 28819000 28819500 MN_MD_MD_peak_73 Promoter (<=1kb) 4 28820116 28821919 1804 1 Os04g0572400 Os04t0572400-01 -616
4 28819500 28820000 MN_MD_MD_peak_74 Promoter (<=1kb) 4 28820116 28821919 1804 1 Os04g0572400 Os04t0572400-01 -116
4 28820000 28820500 MN_MD_MD_peak_75 Promoter (<=1kb) 4 28820116 28821919 1804 1 Os04g0572400 Os04t0572400-01 0
4 28820500 28821000 MN_MD_MD_peak_76 Promoter (<=1kb) 4 28820116 28821919 1804 1 Os04g0572400 Os04t0572400-01 385
4 28824000 28824500 MN_MD_MD_peak_77 Distal Intergenic 4 28827172 28829781 2610 1 Os04g0572500 Os04t0572500-00 -2672
4 28824500 28825000 MN_MD_MD_peak_78 Distal Intergenic 4 28827172 28829781 2610 1 Os04g0572500 Os04t0572500-00 -2172
4 28825000 28825500 MN_MD_MD_peak_79 Promoter (1-2kb) 4 28827172 28829781 2610 1 Os04g0572500 Os04t0572500-00 -1672
4 28825500 28826000 MN_MD_MD_peak_80 Promoter (1-2kb) 4 28827172 28829781 2610 1 Os04g0572500 Os04t0572500-00 -1172
4 30549000 30549500 MN_MD_MD_peak_81 Promoter (1-2kb) 4 30550966 30552133 1168 1 Os04g0605200 Os04t0605200-01 -1466
4 30549500 30550000 MN_MD_MD_peak_82 Promoter (<=1kb) 4 30550966 30552133 1168 1 Os04g0605200 Os04t0605200-01 -966
4 30550000 30550500 MN_MD_MD_peak_83 Promoter (<=1kb) 4 30550966 30552133 1168 1 Os04g0605200 Os04t0605200-01 -466
4 30550500 30551000 MN_MD_MD_peak_84 Promoter (<=1kb) 4 30550966 30552133 1168 1 Os04g0605200 Os04t0605200-01 0
4 30559000 30559500 MN_MD_MD_peak_85 Promoter (<=1kb) 4 30553037 30558393 5357 2 Os04g0605300 Os04t0605300-01 -608
4 30559500 30560000 MN_MD_MD_peak_86 Promoter (1-2kb) 4 30553037 30558393 5357 2 Os04g0605300 Os04t0605300-01 -1108
4 30560000 30560500 MN_MD_MD_peak_87 Promoter (1-2kb) 4 30553037 30558393 5357 2 Os04g0605300 Os04t0605300-01 -1608
4 30560500 30561000 MN_MD_MD_peak_88 Distal Intergenic 4 30553037 30558393 5357 2 Os04g0605300 Os04t0605300-01 -2108
4 30599000 30599500 MN_MD_MD_peak_89 Promoter (<=1kb) 4 30599917 30602262 2346 1 Os04g0605900 Os04t0605900-01 -417
4 30599500 30600000 MN_MD_MD_peak_90 Promoter (<=1kb) 4 30599917 30602262 2346 1 Os04g0605900 Os04t0605900-01 0
4 30600000 30600500 MN_MD_MD_peak_91 Promoter (<=1kb) 4 30599917 30602262 2346 1 Os04g0605900 Os04t0605900-01 84
4 30600500 30601000 MN_MD_MD_peak_92 Promoter (<=1kb) 4 30599917 30602262 2346 1 Os04g0605900 Os04t0605900-01 584
4 30609000 30609500 MN_MD_MD_peak_93 Promoter (<=1kb) 4 30608872 30610396 1525 2 Os04g0606000 Os04t0606000-01 896
4 30609500 30610000 MN_MD_MD_peak_94 Promoter (<=1kb) 4 30608872 30610396 1525 2 Os04g0606000 Os04t0606000-01 396
4 30610000 30610500 MN_MD_MD_peak_95 Promoter (<=1kb) 4 30608872 30610396 1525 2 Os04g0606000 Os04t0606000-01 0
4 30610500 30611000 MN_MD_MD_peak_96 Promoter (<=1kb) 4 30608872 30610396 1525 2 Os04g0606000 Os04t0606000-01 -105
4 22809000 22809500 MN_MD_MD_peak_97 Promoter (1-2kb) 4 22806717 22810593 3877 2 Os04g0455900 Os04t0455900-02 1093
4 22809500 22810000 MN_MD_MD_peak_98 Promoter (<=1kb) 4 22806717 22810593 3877 2 Os04g0455900 Os04t0455900-02 593
4 22810000 22810500 MN_MD_MD_peak_99 Promoter (<=1kb) 4 22806717 22810593 3877 2 Os04g0455900 Os04t0455900-02 93
4 22810500 22811000 MN_MD_MD_peak_100 Promoter (<=1kb) 4 22806717 22810593 3877 2 Os04g0455900 Os04t0455900-02 0

表8.2 样本特异性Loop锚点基因注释。




8.2 基因富集分析

我们使用clusterprofiler(version 4.14.6)(Wu T. et al., 2021)对上一节得到的差异区域基因进行GO和KEGG通路富集分析。富集分析结果表格未使用阈值过滤,您可以在表格中查看所有可能富集的通路。

8.2.1 GO富集分析

GO (Gene Ontology, http://www.geneontology.org) 是基因本体论联合会建立的将全世界所有与基因有关的研究结果进行分类汇总的综合数据库。该数据库标准化了不同数据库中关于基因和基因产物的生物学术语,适用于各物种,对基因和蛋白功能进行限定和描述。利用GO 数据库,可以对相关基因进行富集分析,可以找到不同条件下的相关基因按照其参与的BP(Biological Process, 生物过程)、MF(Molecular Function, 分子功能) 及CC(Cellular Component, 细胞组分) 三个方面进行分类注释。GO 注释有助于理解基因背后所代表的生物学意义。GO功能显著性富集分析给出与基因组背景相比,在相关基因中显著富集的GO功能条目,从而给出相关基因与哪些生物学功能显著相关。该分析首先把所有相关向Gene Ontology数据库的各个term映射,计算每个term的基因数目,然后应用超几何检验,找出与整个基因组背景相比,在与相关基因中显著富集的GO条目。

GO富集分析完整结果请详见位于report/result/08.gokegg文件夹的*_GO_res.csv表格文件。

显示前100行 (共44行)
ONTOLOGY ID Description GeneRatio BgRatio pvalue p.adjust qvalue geneID Count
BP GO:0000070 mitotic sister chromatid segregation 1/5 15/8503 0.009 0.052 0.020 Os04g0352700 1
BP GO:0140014 mitotic nuclear division 1/5 15/8503 0.009 0.052 0.020 Os04g0352700 1
BP GO:0000819 sister chromatid segregation 1/5 16/8503 0.009 0.052 0.020 Os04g0352700 1
BP GO:0000413 protein peptidyl-prolyl isomerization 1/5 17/8503 0.010 0.052 0.020 Os05g0147500 1
BP GO:0018208 peptidyl-proline modification 1/5 17/8503 0.010 0.052 0.020 Os05g0147500 1
BP GO:0098813 nuclear chromosome segregation 1/5 18/8503 0.011 0.052 0.020 Os04g0352700 1
BP GO:0007059 chromosome segregation 1/5 25/8503 0.015 0.052 0.020 Os04g0352700 1
BP GO:0009620 response to fungus 1/5 27/8503 0.016 0.052 0.020 Os09g0287300 1
BP GO:0050832 defense response to fungus 1/5 27/8503 0.016 0.052 0.020 Os09g0287300 1
BP GO:0000280 nuclear division 1/5 29/8503 0.017 0.052 0.020 Os04g0352700 1
BP GO:1903047 mitotic cell cycle process 1/5 34/8503 0.020 0.052 0.020 Os04g0352700 1
BP GO:0051276 chromosome organization 1/5 36/8503 0.021 0.052 0.020 Os04g0352700 1
BP GO:0000278 mitotic cell cycle 1/5 38/8503 0.022 0.052 0.020 Os04g0352700 1
BP GO:0018193 peptidyl-amino acid modification 1/5 38/8503 0.022 0.052 0.020 Os05g0147500 1
BP GO:0048285 organelle fission 1/5 38/8503 0.022 0.052 0.020 Os04g0352700 1
BP GO:0006486 protein glycosylation 1/5 48/8503 0.028 0.053 0.021 Os12g0280050 1
BP GO:0009101 glycoprotein biosynthetic process 1/5 48/8503 0.028 0.053 0.021 Os12g0280050 1
BP GO:0043413 macromolecule glycosylation 1/5 48/8503 0.028 0.053 0.021 Os12g0280050 1
BP GO:0070085 glycosylation 1/5 51/8503 0.030 0.053 0.021 Os12g0280050 1
BP GO:0009100 glycoprotein metabolic process 1/5 52/8503 0.030 0.053 0.021 Os12g0280050 1
BP GO:0022402 cell cycle process 1/5 71/8503 0.041 0.068 0.027 Os04g0352700 1
BP GO:0006457 protein folding 1/5 78/8503 0.045 0.072 0.028 Os05g0147400 1
BP GO:0098542 defense response to other organism 1/5 92/8503 0.053 0.074 0.029 Os09g0287300 1
BP GO:0007049 cell cycle 1/5 101/8503 0.058 0.074 0.029 Os04g0352700 1
BP GO:0009607 response to biotic stimulus 1/5 102/8503 0.059 0.074 0.029 Os09g0287300 1
BP GO:0043207 response to external biotic stimulus 1/5 102/8503 0.059 0.074 0.029 Os09g0287300 1
BP GO:0051707 response to other organism 1/5 102/8503 0.059 0.074 0.029 Os09g0287300 1
BP GO:0044419 biological process involved in interspecies interaction between organisms 1/5 103/8503 0.059 0.074 0.029 Os09g0287300 1
BP GO:1901137 carbohydrate derivative biosynthetic process 1/5 121/8503 0.069 0.083 0.033 Os12g0280050 1
BP GO:0009605 response to external stimulus 1/5 140/8503 0.080 0.093 0.036 Os09g0287300 1
BP GO:1901135 carbohydrate derivative metabolic process 1/5 218/8503 0.122 0.138 0.054 Os12g0280050 1
BP GO:0006996 organelle organization 1/5 226/8503 0.126 0.138 0.054 Os04g0352700 1
BP GO:0006952 defense response 1/5 291/8503 0.160 0.170 0.066 Os09g0287300 1
BP GO:0016043 cellular component organization 1/5 423/8503 0.225 0.232 0.091 Os04g0352700 1
BP GO:0034645 cellular macromolecule biosynthetic process 1/5 445/8503 0.236 0.236 0.092 Os12g0280050 1
CC GO:0048046 apoplast 1/2 32/2670 0.024 0.119 0.100 Os12g0271700 1
CC GO:0005576 extracellular region 1/2 140/2670 0.102 0.253 0.213 Os12g0271700 1
CC GO:0005840 ribosome 1/2 211/2670 0.152 0.253 0.213 Os05g0144300 1
CC GO:0043228 non-membrane-bounded organelle 1/2 500/2670 0.340 0.340 0.286 Os05g0144300 1
CC GO:0043232 intracellular non-membrane-bounded organelle 1/2 500/2670 0.340 0.340 0.286 Os05g0144300 1
MF GO:0005507 copper ion binding 1/7 53/17670 0.021 0.083 0.066 Os12g0271751 1
MF GO:0003735 structural constituent of ribosome 1/7 198/17670 0.076 0.101 0.080 Os05g0144400 1
MF GO:0005198 structural molecule activity 1/7 266/17670 0.101 0.101 0.080 Os05g0144400 1
MF GO:0046983 protein dimerization activity 1/7 267/17670 0.101 0.101 0.080 Os05g0147200 1

表8.3 特异性TAD边界基因GO富集分析部分结果:
ONTOLOGY:GO方面,细胞成分,生物过程或分子功能之一;
ID:GO标识符,GO ID;
Description:GO术语的文字描述;
GeneRatio:该条目基因比例,分子是富集到这个GO条目上的基因的数目,分母是所有peak关联基因的数目;
BgRatio:背景比例,分母是物种全部有GO注释的基因的数目,分子是这些基因中注释到这个GO条目上面的基因的数目;
RichFactor​​:富集因子(Enrichment Factor)= GeneRatio / BgRatio;
​​FoldEnrichment​:富集倍数(Fold Enrichment)= (富集通路基因数 / 输入基因数) / (背景通路基因数 / 背景总基因数);
​​zScore​:标准化富集得分(基于超几何分布的 Z 值);
pvalue:富集的p值;
p.adjust:使用BH校正之后的p值;
qvalue:q值,使用FDR校正之后的p值,q-value相比于p-value更加严格,表示p-value产生假阳性的概率;
geneID:富集到这个GO条目上面的具体的基因ID;
Count:富集到这个GO条目上面的基因的数目。



图8.1 特异性TAD边界基因GO气泡图。纵坐标是GO Term 名称,横坐标是对应GO Term 中检出的基因占背景基因的个数,颜色代表显著性,气泡大小代表该条目基因比例。



图8.2 特异性TAD边界基因GO条状图。按照BP、MF、CC三个方面分别展示GO富集结果。纵坐标是GO Term 名称,横坐标值越大显著性越高,如果为0代表qvalue等于1。



显示前100行 (共54行)
ONTOLOGY ID Description GeneRatio BgRatio pvalue p.adjust qvalue geneID Count
BP GO:0007186 G protein-coupled receptor signaling pathway 2/10 15/8503 0.000 0.005 0.005 Os05g0345400/Os05g0345500 2
BP GO:0070972 protein localization to endoplasmic reticulum 1/10 11/8503 0.013 0.198 0.193 Os09g0133650 1
BP GO:0001522 pseudouridine synthesis 1/10 16/8503 0.019 0.198 0.193 Os04g0605300 1
BP GO:0006486 protein glycosylation 1/10 48/8503 0.055 0.198 0.193 Os04g0572400 1
BP GO:0009101 glycoprotein biosynthetic process 1/10 48/8503 0.055 0.198 0.193 Os04g0572400 1
BP GO:0043413 macromolecule glycosylation 1/10 48/8503 0.055 0.198 0.193 Os04g0572400 1
BP GO:0007165 signal transduction 2/10 334/8503 0.056 0.198 0.193 Os05g0345400/Os05g0345500 2
BP GO:0023052 signaling 2/10 334/8503 0.056 0.198 0.193 Os05g0345400/Os05g0345500 2
BP GO:0033365 protein localization to organelle 1/10 50/8503 0.057 0.198 0.193 Os09g0133650 1
BP GO:0070085 glycosylation 1/10 51/8503 0.058 0.198 0.193 Os04g0572400 1
BP GO:0007154 cell communication 2/10 344/8503 0.059 0.198 0.193 Os05g0345400/Os05g0345500 2
BP GO:0009100 glycoprotein metabolic process 1/10 52/8503 0.060 0.198 0.193 Os04g0572400 1
BP GO:0006418 tRNA aminoacylation for protein translation 1/10 72/8503 0.082 0.207 0.201 Os02g0787533 1
BP GO:0008299 isoprenoid biosynthetic process 1/10 76/8503 0.086 0.207 0.201 Os04g0670800 1
BP GO:0006720 isoprenoid metabolic process 1/10 78/8503 0.088 0.207 0.201 Os04g0670800 1
BP GO:0043038 amino acid activation 1/10 80/8503 0.090 0.207 0.201 Os02g0787533 1
BP GO:0043039 tRNA aminoacylation 1/10 80/8503 0.090 0.207 0.201 Os02g0787533 1
BP GO:0034645 cellular macromolecule biosynthetic process 2/10 445/8503 0.093 0.207 0.201 Os02g0787533/Os04g0572400 2
BP GO:1901137 carbohydrate derivative biosynthetic process 1/10 121/8503 0.134 0.281 0.274 Os04g0572400 1
BP GO:0006399 tRNA metabolic process 1/10 129/8503 0.142 0.284 0.276 Os02g0787533 1
BP GO:0008104 protein localization 1/10 156/8503 0.169 0.307 0.299 Os09g0133650 1
BP GO:0070727 cellular macromolecule localization 1/10 156/8503 0.169 0.307 0.299 Os09g0133650 1
BP GO:0008610 lipid biosynthetic process 1/10 183/8503 0.196 0.326 0.317 Os04g0670800 1
BP GO:0034660 ncRNA metabolic process 1/10 183/8503 0.196 0.326 0.317 Os02g0787533 1
BP GO:0033036 macromolecule localization 1/10 215/8503 0.226 0.335 0.326 Os09g0133650 1
BP GO:1901135 carbohydrate derivative metabolic process 1/10 218/8503 0.229 0.335 0.326 Os04g0572400 1
BP GO:0051641 cellular localization 1/10 224/8503 0.234 0.335 0.326 Os09g0133650 1
BP GO:0009451 RNA modification 1/10 228/8503 0.238 0.335 0.326 Os04g0605300 1
BP GO:0006520 amino acid metabolic process 1/10 233/8503 0.243 0.335 0.326 Os02g0787533 1
BP GO:0044255 cellular lipid metabolic process 1/10 250/8503 0.258 0.344 0.335 Os04g0670800 1
BP GO:0006412 translation 1/10 335/8503 0.331 0.387 0.377 Os02g0787533 1
BP GO:0043043 peptide biosynthetic process 1/10 342/8503 0.337 0.387 0.377 Os02g0787533 1
BP GO:0006518 peptide metabolic process 1/10 353/8503 0.346 0.387 0.377 Os02g0787533 1
BP GO:0043604 amide biosynthetic process 1/10 360/8503 0.351 0.387 0.377 Os02g0787533 1
BP GO:0006629 lipid metabolic process 1/10 381/8503 0.368 0.387 0.377 Os04g0670800 1
BP GO:0043603 amide metabolic process 1/10 384/8503 0.370 0.387 0.377 Os02g0787533 1
BP GO:0019752 carboxylic acid metabolic process 1/10 391/8503 0.376 0.387 0.377 Os02g0787533 1
BP GO:0043436 oxoacid metabolic process 1/10 392/8503 0.376 0.387 0.377 Os02g0787533 1
BP GO:0006082 organic acid metabolic process 1/10 393/8503 0.377 0.387 0.377 Os02g0787533 1
BP GO:0006508 proteolysis 1/10 430/8503 0.405 0.405 0.394 Os04g0606000 1
MF GO:0009982 pseudouridine synthase activity 1/17 12/17670 0.011 0.161 0.133 Os04g0605900 1
MF GO:0030599 pectinesterase activity 1/17 31/17670 0.029 0.163 0.135 Os04g0571800 1
MF GO:0016866 intramolecular transferase activity 1/17 37/17670 0.035 0.163 0.135 Os04g0605900 1
MF GO:0052689 carboxylic ester hydrolase activity 1/17 65/17670 0.061 0.213 0.176 Os04g0571800 1
MF GO:0004601 peroxidase activity 1/17 126/17670 0.115 0.218 0.181 Os04g0670600 1
MF GO:0016684 oxidoreductase activity, acting on peroxide as acceptor 1/17 126/17670 0.115 0.218 0.181 Os04g0670600 1
MF GO:0016853 isomerase activity 1/17 129/17670 0.117 0.218 0.181 Os04g0605900 1
MF GO:0016209 antioxidant activity 1/17 138/17670 0.125 0.218 0.181 Os04g0670600 1
MF GO:0003735 structural constituent of ribosome 1/17 198/17670 0.174 0.238 0.196 Os02g0787100 1
MF GO:0030246 carbohydrate binding 1/17 213/17670 0.186 0.238 0.196 Os04g0365550 1
MF GO:0008168 methyltransferase activity 1/17 225/17670 0.196 0.238 0.196 Os06g0727600 1
MF GO:0016741 transferase activity, transferring one-carbon groups 1/17 235/17670 0.204 0.238 0.196 Os06g0727600 1
MF GO:0005198 structural molecule activity 1/17 266/17670 0.227 0.245 0.203 Os02g0787100 1
MF GO:0016757 glycosyltransferase activity 1/17 444/17670 0.351 0.351 0.291 Os04g0572500 1

表8.4 特异性Loop锚点基因GO富集分析部分结果



图8.3 特异性Loop锚点基因GO气泡图。纵坐标是GO Term 名称,横坐标是对应GO Term 中检出的基因占背景基因的个数,颜色代表显著性,气泡大小代表该条目基因比例。



图8.4 特异性Loop锚点基因GO条状图。按照BP、MF、CC三个方面分别展示GO富集结果。纵坐标是GO Term 名称,横坐标值越大显著性越高,如果为0代表qvalue等于1。



8.2.2 KEGG富集分析

KEGG (Kyoto Encyclopedia of Genes and Genomes, http://www.genome.jp/kegg/) 是日本京都大学构建的基因组信息数据库,它将基因组序列信息与功能信息相结合,提供了一个全面的基因组功能信息资源。在PATHWAY数据库里,包括图解的细胞生化过程如代谢、膜转运、信号传递、细胞周期,还包括同系保守的子通路等信息。KEGG富集分析可以对关联基因进行KEGG通路富集分析。

下面展示关联的基因富集KEGG富集分析部分结果,KEGG富集分析完整结果请详见位于report/result/08.gokegg文件夹的*_KEGG_res.csv表格文件。

显示前100行 (共17行)
ID Description GeneRatio BgRatio pvalue p.adjust qvalue geneID Count
00401 Novobiocin biosynthesis 2/8 10/7938 0.000 0.001 0.000 Os04g0347600/Os04g0347800 2
00340 Histidine metabolism 2/8 29/7938 0.000 0.003 0.001 Os04g0347600/Os04g0347800 2
00960 Tropane, piperidine and pyridine alkaloid biosynthesis 2/8 35/7938 0.001 0.003 0.001 Os04g0347600/Os04g0347800 2
00350 Tyrosine metabolism 2/8 59/7938 0.001 0.005 0.002 Os04g0347600/Os04g0347800 2
00400 Phenylalanine, tyrosine and tryptophan biosynthesis 2/8 59/7938 0.001 0.005 0.002 Os04g0347600/Os04g0347800 2
00360 Phenylalanine metabolism 2/8 82/7938 0.003 0.008 0.004 Os04g0347600/Os04g0347800 2
04138 Autophagy - yeast 2/8 135/7938 0.008 0.018 0.009 Os04g0347600/Os04g0347800 2
01230 Biosynthesis of amino acids 2/8 286/7938 0.031 0.066 0.033 Os04g0347600/Os04g0347800 2
04626 Plant-pathogen interaction 2/8 303/7938 0.035 0.066 0.033 Os05g0147300/Os11g0514400 2
00900 Terpenoid backbone biosynthesis 1/8 64/7938 0.063 0.107 0.053 Os12g0271700 1
04915 Estrogen signaling pathway 1/8 81/7938 0.079 0.122 0.060 Os04g0352400 1
05225 Hepatocellular carcinoma 1/8 110/7938 0.106 0.150 0.074 Os05g0144300 1
04714 Thermogenesis 1/8 217/7938 0.199 0.256 0.127 Os05g0144300 1
05418 Fluid shear stress and atherosclerosis 1/8 231/7938 0.211 0.256 0.127 Os12g0280050 1
04016 MAPK signaling pathway - plant 1/8 255/7938 0.230 0.258 0.128 Os11g0514400 1
04621 NOD-like receptor signaling pathway 1/8 271/7938 0.243 0.258 0.128 Os12g0280050 1
04075 Plant hormone signal transduction 1/8 325/7938 0.284 0.284 0.141 Os11g0514400 1

表8.5 特异性TAD边界基因KEGG富集分析部分结果:
ID:KEGG通路标识符,前面省略"map",比如“04120”代表“map04120”;
Description:KEGG通路的文字描述;
GeneRatio:该条目基因比例,分子是富集到这个KEGG通路上的基因的数目,分母是所有peak关联基因的数目;
BgRatio:背景比例,分母是物种全部有KEGG注释的基因的数目,分子是这些基因中注释到这个KEGG通路上面的基因的数目;
RichFactor​​:富集因子(Enrichment Factor)= GeneRatio / BgRatio;
​​FoldEnrichment​:富集倍数(Fold Enrichment)= (富集通路基因数 / 输入基因数) / (背景通路基因数 / 背景总基因数);
​​zScore​:标准化富集得分(基于超几何分布的 Z 值);
pvalue:富集的p值;
p.adjust:使用BH校正之后的p值;
qvalue:q值,使用FDR校正之后的p值,q-value相比于p-value更加严格,表示p-value产生假阳性的概率;
geneID:富集到这个KEGG通路上面的具体的基因ID;
Count:富集到这个KEGG通路上面的基因的数目。



图8.1 特异性TAD边界基因KEGG气泡图。纵坐标是KEGG通路名称,横坐标是对应KEGG通路中检出的基因占背景基因的个数,颜色代表显著性,气泡大小代表该通路基因比例。



图8.2 特异性TAD边界基因KEGG条状图。纵坐标是KEGG通路名称,横坐标是出现在该通路的基因数,颜色代表显著性。



显示前100行 (共12行)
ID Description GeneRatio BgRatio pvalue p.adjust qvalue geneID Count
00564 Glycerophospholipid metabolism 2/7 148/7938 0.007 0.082 0.057 Os04g0669500/Os04g0669700 2
03070 Bacterial secretion system 1/7 22/7938 0.019 0.091 0.064 Os05g0422300 1
04623 Cytosolic DNA-sensing pathway 1/7 33/7938 0.029 0.091 0.064 Os04g0394500 1
00905 Brassinosteroid biosynthesis 1/7 35/7938 0.030 0.091 0.064 Os01g0388101 1
02024 Quorum sensing 1/7 63/7938 0.054 0.103 0.072 Os05g0422300 1
03020 RNA polymerase 1/7 64/7938 0.055 0.103 0.072 Os04g0394500 1
03060 Protein export 1/7 70/7938 0.060 0.103 0.072 Os05g0422300 1
00240 Pyrimidine metabolism 1/7 165/7938 0.137 0.205 0.144 Os04g0394500 1
00500 Starch and sucrose metabolism 1/7 212/7938 0.173 0.213 0.149 Os06g0726400 1
00230 Purine metabolism 1/7 218/7938 0.177 0.213 0.149 Os04g0394500 1
05169 Epstein-Barr virus infection 1/7 269/7938 0.214 0.234 0.164 Os04g0394500 1
03010 Ribosome 1/7 389/7938 0.297 0.297 0.208 Os04g0605900 1

表8.4 特异性Loop锚点基因KEGG富集分析部分结果



图8.3 特异性Loop锚点基因KEGG气泡图。纵坐标是KEGG通路名称,横坐标是对应KEGG通路中检出的基因占背景基因的个数,颜色代表显著性,气泡大小代表该通路基因比例。



图8.4 特异性Loop锚点基因KEGG条状图。纵坐标是KEGG通路名称,横坐标是出现在该通路的基因数,颜色代表显著性。



参考文献


Andrews S. FastQC: a quality control tool for high throughput sequence data.https://www.bioinformatics.babraham.ac.uk/projects/fastqc/, 2010.
BELTON J M, DEKKER J, KAPLAN N. Hi-C: a comprehensive technique to capture the conformation of genomes[J]. Methods, 2012, 58(3): 268-276.
Chen S, Zhou Y, Chen Y, Gu J. fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 2018 Sep 1;34(17):i884-i890.
Durand NC, Shamim MS, Machol I, Rao SS, Huntley MH, Lander ES, Aiden EL. Juicer Provides a One-Click System for Analyzing Loop-Resolution Hi-C Experiments. Cell Syst. 2016 Jul;3(1):95-8.
FORTIN J P, HANSEN K D. Reconstructing A/B compartments as revealed by Hi-C using long-range correlations in epigenetic data[J]. Genome Biology, 2015, 16(1): 180.
LANCTOT C, CHEUTIN T, CREMER M, et al. Dynamic genome architecture in the nuclear space: regulation of gene expression in three dimensions[J]. Nature Reviews Genetics, 2007, 8(2): 104-115.
Langmead, B., Salzberg, S. Fast gapped-read alignment with Bowtie 2. Nat Methods 9, 357–359 (2012).
LIEBERMAN-AIDEN E, VAN BERKUM N L, DEKKER J, et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome[J]. Science, 2009, 326(5950): 289-293.
RAMIREZ F, BHARDWAJ V, VILLAVECES J, et al. High-resolution TADs reveal DNA sequences underlying genome organization in flies[J]. Nature Communications, 2018, 9: 189.
SELVARAJ S, DIXON J R, BANSAL V, et al. Whole-genome haplotype reconstruction using proximity-ligation and shotgun sequencing[J]. Nature Biotechnology, 2013, 31(12): 1111-1118.
Servant N., Varoquaux N., Lajoie BR., Viara E., Chen CJ., Vert JP., Dekker J., Heard E., Barillot E. HiC-Pro: An optimized and flexible pipeline for Hi-C processing. Genome Biology 2015, 16:259
SEXTON T, SCHOBER H, FRASER P, et al. Gene regulation through nuclear organization[J]. Nature Structural & Molecular Biology, 2007, 14(11): 1049-1055.
Tarasov A, Vilella AJ, Cuppen E, Nijman IJ, Prins P. Sambamba: fast processing of NGS alignment formats. Bioinformatics. 2015 Jun 15;31(12):2032-4.
VAN BERKUM N L, DEKKER J. Hi-C: a method to study the three-dimensional architecture of genomes[J]. Journal of Visualized Experiments, 2010, (39): e1869.
Wang, Q., Li, M., Wu, T., Zhan, L., Li, L., Chen, M., Xie, W., Xie, Z., Hu, E., Xu, S., & Yu, G. (2022). Exploring epigenomic datasets by ChIPseeker. Current Protocols, 2, e585.
Wu T, Hu E, Xu S, Chen M, Guo P, Dai Z, Feng T, Zhou L, Tang W, Zhan L, Fu X, Liu S, Bo X, Yu G. clusterProfiler 4.0: A universal enrichment tool for interpreting omics data. Innovation (Camb). 2021 Jul 1;2(3):100141.

联系我们

官网:武汉鸿源韬生物科技有限公司 咨询热线:18086690478

邮箱:sales@hyt-bio.com 地址:湖北省武汉市江夏区郑店街光谷南(郑店)大健康产业园东湖高新国际健康城B地块1号楼7层02号房

报告文件结构

报告文件结构