唐赛赛(通讯作者) 李宝燕 周玉明 程 林 王海凤 许梦婷 胡江波
(1.山东中医药高等专科学校,山东 烟台 264100;2.滨州医学院附属医院,山东 烟台 264100)
随着生活方式的改变,我国心肌梗死(myocardialinfarction,MI)发病率呈逐年升高,且有年轻化趋势。目前已证实MI主要危险因素包括:高血压、血脂异常、糖尿病、吸烟、超重和肥胖、年龄、性别等[1]。近年来研究发现[2],在一些个体中,常表现出明显家族史,提示遗传因素在诱发MI发挥重要作用,而基因多态性是决定这种遗传性重要因素。因此,对某一疾病人群和正常对照人群进行单核苷酸多态性(singlenucleotidepolymorphism,SNP)对比研究,可确定SNP位点与该疾病发病风险的关系[3],因而广泛应用于疾病遗传易感性研究。长链非编码RNA(longnon-codingRNA,lncRNA)是一类转录本长度超过200nt,位于细胞质内或胞核内功能性非编码RNA分子。但近年来研究发现真核细胞lncRNA表现出复杂调控机制,主要从表观遗传、转录及转录后调控等多方面实现调控,参与调节细胞增殖、分化等进程[4],并在心血管疾病发生发展过程起重要作用。lncRNA可从炎症、凋亡、增殖、自噬等多方面影响动脉粥样硬化病理进程。研究表明,lncRNAs基因多态性可影响自身空间结构,改变lncRNAs表达及其调控的信号通路,而影响个体对疾病易感性。这都提示lncRNAs基因多态性可能与MI遗传易感密切相关。研究也发现,lncRNAMIAT的SNPs与日本人群MI发病风险密切相关。有关MIAT影响MI遗传易感的潜在分子机制有待深入挖掘。
位于染色体22q12.1的lncRNAMIAT(myocardialinfarctionassocia tedtranscript,MIAT)研究发现上调MIAT可促进内皮细胞迁移和增殖,进而导致病理性血管生成[5]。研究发现ST段抬高性MI病人外周血MIAT表达水平与非ST段抬高性MI病人相比明显降低,并且MIAT与CPK和TnT水平呈负相关,这提示MIAT可作为心脏早期损伤辅助诊断依据。研究表明MIAT多态位点rs230152A等位基因能显著增加日本个体罹患MI风险。我们推测MIAT基因多态性在MI发生发展过程发挥重要作用,而本项目通过对MIAT基因中国汉族人群最小等位基因频率大于20%的SNPs位点进行分型,筛选出影响MI发病风险SNPs位点,并探讨这些多态位点影响MI遗传易感的潜在分子机制。
SNP经典思路步骤是先找目的基因标签SNPs,然后挑选功能位点,但HapMap网站关闭,很多选择标签SNPs的方法不能使用,但还有千人基因组网站数据能用,本文将详细叙述如何从千人基因组网站下载某个区段位点信息导入Haploview选择标签SNPs。
1.获取基因在染色体上的位置信息,以MIAT为例,打开http://grch37.ensembl.org/Homo_sapiens/Info/Index,输入基因MIAT,点击Go后进入MIAT基因信息界面,会出现MIAT在染色体上的位置。
2.将信息复制到VCFtoPEDConverter界面里,VCFtoPEDConverter是千人基因组网站自带的将vcf转换为HapMap格式在线工具,直接输入基因位置信息可转换。打开网站找到VCFtoPEDConverter把页面包括基因位置、中国汉族北京人群(CHB)等信息填写完整。点击run后等待刷新完毕,显示done,点击查看结果。下载ped和info文件,解压两个文件放入同一文件夹。
3.在Haploview里,打开ped文件,info文件也可以自动识别填入。如果提示morethantwoallelesatmarker86,去文件里找到错误的位点,将其修改过来便可。结果177个位点可100%覆盖这个基因,不需要这么多位点,Minimumminorallelefreq可设置0.05、0.1、0.2,本实验选0.20。点击RescoreMarkers。一般r2>0.8说明两个位点是高度连锁,一个位点可以代表另外一个,点击runtagger,得到13组(其中4个没有和其他SNP高度连锁)。最后根据位点在基因上的位置一般和最小等位基因频率(MAF)大于20%选出合适的位点进行分析。结合NCBI上SNP位点在染色体的位置,挑选出位于外显子并且有转录本的SNP,结果如表2所示。
1.染色体的位置,在千人基因组中查找到MIAT在染色体的位置是22:27042392-27072438,用于VCFtoPEDConverter。
2.MIAT的SNP,在Haploview里通过筛选获得SNP,rs763271、rs35778551、rs1981493、rs36053931这四个没有和其他SNP高度连锁。MIAT中其他高度连锁的SNP编号如表1所示。
表1 MIAT中其他高度连锁的SNP编号(MAF>20%)
3.进一步筛选SNP,结合NCBI上SNP位点在染色体位置,挑选出位于外显子并且有转录本的MAF大于20%SNP,最终确定MIAT5个SNP位点,结果如表2所示。
表2 筛选出MIAT的基因多态性(MAF>20%)
遗传变异中最常见SNP,当排除其他混杂因素后,一个遗传标记在病例组中的频率高于对照组,即表明该遗传标记与疾病相关联,根据MI危险因素、病理机制和代谢通路等,从已知基因内部和其5’和3’端选择多个遗传标记作为研究对象,为进一步研究SNP位点与MI发病风险奠定基础。本研究从MIAT基因177个SNP位点筛选出5个检测位点分别为rs5761670、rs4280、rs9625066、rs4274、rs5997112,通过此种方法大大节省人力物力,但筛选方法不仅拘泥于此,也可使用其他方法,并且更多功能有待发掘。