转录因子“足迹”编码一部庞大的人类调控“辞典”
调控因子与基因组DNA的结合能够保护相关的基因序列不被胰脱氧核糖核酸酶(DNase I)剪切,并留下具有核苷酸解析度的“足迹(footprint)”。
Neph等用基因组DNase I足迹法处理41种不同的细胞和组织,检测了4 500万个位于调控区的转录因子占位事件(代表840万个不同短序列元件的差异结合)。他们发现这些小的基因组序列区间(粗略估计两倍于外显子的长度)编码了一系列DNA结合蛋白识别的保守序列,使人类顺式调控“辞典(lexicon)”的容量几乎增加一倍。他们还发现影响等位染色质状态的遗传性变异体集中在这些“足迹”中,并优先被遮蔽而免于DNA甲基化。高分辨率的DNase I剪切模式反映了进化在核苷酸水平上的保守,并烙下了DNA和蛋白质界面的结晶拓扑学印记,提示在进化过程中转录因子结构已经在基因组DNA序列中留下了印记。他们据此发现了一个50 bp的“足迹”序列,该序列能在数以千计的人类启动子中精确地定位转录起始点。最后,他们还揭示了一个宏大的调节因子识别基序的集合,这些识别基序无论是在序列上还是在功能上都高度保守,并且表现出细胞选择性的占位模式,类似于大部分与发育、分化和多能性相关的调控因子。
Nature, 2012, 489(7414):83-90(张婵娟)