, ,
自1990年人类基因组计划启动以来,基因测序技术发展更加迅速,已经在基础研究、技术研发和临床实践中也得到了广泛的应用。20世纪70年代至今,基因测序技术经历了4代的发展:第一代是英国生物化学家Sanger的脱氧链终止法(1975年,首次完整的基因组测序,人类基因组计划得以开展的关键),第二代基于焦磷酸的高通量测序法(1996年,目前普遍应用的测序技术),第三代为单分子DNA测序法(已较为成熟),第四代纳米孔测序法(崭露头角)[1]。基因测序技术作为人类探索生命奥秘的重要手段之一,对生命科学和生物医学等领域的发展起到了巨大的推动作用。2015年美国启动的“精准医疗计划”引来了世界范围内的精准医疗热潮,而作为精准医疗的关键,基因测序技术成为了美国、英国、法国等发达国家的精准医疗部署的入口。
2014年美国国立卫生研究院(National Institutes of Health,NIH)向开发新型测序技术的8支研究团队资助1 450万美元(资助时间为2-4年),2016年美国政府向NIH提供1.3亿美元资助用于“百万人基因组计划”,2012年英国启动“10万人基因组计划”,2015年年底英国政府宣布将在未来再追加经费用于该计划,2016年6月英国政府宣布已经完成了9 892个基因组测序工作,法国于2016年宣布启动投资6.7亿欧元的基因组和个体化医疗项目即“法国基因组医疗2025”[2]。
因此,准确把握基因测序技术的国际研究发展态势,了解我国在该领域中的竞争格局,能够为技术领域科研人员和政策制定者的有关决策提供参考。
科学论文是科学研究成果的重要载体和科研产出的主要形式。专利是技术创新的产物,作为一种制度,它保护并鼓励技术的创新与发展。本文以科学论文和专利文献为基本数据,构建创新态势研究分析框架,利用Web of ScienceTM、ESI、Thomoson Innovation、Innography等数据库从科学研究态势和技术研发态势两方面对基因测序技术的国际研发创新态势进行综合定量分析。以Web of ScienceTM数据库为数据来源,构建基因测序技术的检索式,检索并获取相关论文748 381篇,文献类型为Article、Review、Letter,检索日期为2016年12月31日;构建单细胞测序技术检索式,检索并获取相关论文3 719篇,文献类型为Article、Review、Letter,检索时间为2016年11月21日。
2.1.1 SCI发文量年度变化趋势
1970年开始陆续出现基因测序技术的相关论文,发文量增长缓慢,直至1990年国际人类基因组计划启动,论文数量才呈明显直线上升趋势。我国的基因测序技术发展起步较晚,在人类基因组计划启动后并没有快速发展,直至1999年我国参与“国家人类基因组计划”后,从2002年开始,基因测序技术相关论文数量才开始出现明显增长,如图1所示。
2.1.2 主要国家
世界各国基因测序技术发文量及所占比例较高的前10个国家依次为美国、中国、日本、德国、英国、法国、加拿大、意大利、澳大利亚、西班牙,其中美国基因测序技术SCI发文量排名世界第一,共发表论文282 071篇,占38%,以绝对优势领先其他国家;我国发表论文74 913篇,占10%,排名第二。
图1 基因测序技术SCI国际发文量及中美发文量年度变化趋势
2.1.3 ESI高被引论文
以汤森路透ESI数据库为数据来源,经检索获得全球基因测序技术研究领域高被引论文5 916篇。以第一通讯作者所属国家为标准,统计各国高被引论文贡献情况(表1)。结果显示,美国排名第一,高被引论文贡献率为47.46%;我国共发表高被引论文425篇,占7.18%,排名第三。
2.1.4 科学研究热点主题
将全球基因测序技术研究领域5 916篇ESI高被引论文的PMID导入PubMed数据库重新检索,并抽取最能表征这些论文研究主题的主要主题词(MeSH Major Topic),利用Gephi软件对主题词进行频次与共现关系统计、聚类、分析,得到近5年基因测序技术领域主要的研究热点(图2)。
表1 各国发表的基因测序研究高被引论文
图2 基因测序技术的研究热点主题
2.1.4.1 基因测序技术在识别和鉴定HIV病毒和胃肠道菌群中的应用
1号论文簇主要出现了病毒、细菌、古生菌、HIV、胃肠道、宏基因组、16S核糖体RNA、大肠杆菌等高频主题词。肠道中与人体共生或寄生的微生物如细菌、原生动物、病毒等可被称为人类的“第二基因组”,但人类其的认识还远远不够。现代医学表明,肠道微生物尤其是细菌分布的平衡对人体的健康非常重要,糖尿病、哮喘、慢性腹泻、肥胖症、免疫力低下等常见疾病均与细菌分布平衡的失调有密切关联。比利时鲁汶大学和荷兰格林宁根大学两个团队利用基因测序分别分析人类粪便中所含的肠道菌群、样本人群宏基因组数据,找出了肠道核心微生物群,有助于判断多种疾病。
2.1.4.2 基因编辑技术与基因测序技术的有效结合
2号论文簇主要出现了CRISPR/CAS、基因工程、基因打靶、向导RNA等高频主题词。基因测序是基础,细胞测序是中层,基因编辑是最高层次。韩国首尔大学的研究人员发明了一种新型的Digenome-seq方法,通过基因组测序检测CRISPR-Cas9在基因组中的打靶和脱靶情况[3]。2014年采用一种有效的方法构建出了一种新型的CRISPR/Cas9 sgRNA文库。北大魏文胜团队利用文库功能筛查结合高通量测序分析,成功地鉴别出了对于炭疽和白喉毒素毒性至关重要的宿主基因[4]。
2.1.4.3 基因测序技术在植物全基因组中的应用
植物全基因组测序是一项非常强大而艰难的工程,它利用基因组学的方法揭示许多重要植物物种的遗传蓝图。从基因组水平上对物种的生长、发育、进化、起源等重大问题进行研究。利用全基因组重测序有助于快速发现与植物重要性状相关的遗传变异,缩短分子育种的实验周期等。近年来,植物基因组测序技术的相关研究取得了显著成效,但只有拟南芥与水稻的基因组序列的质量水平是最高的[5]。
2.1.4.4 基因测序技术在肿瘤诊疗中的应用
肿瘤是当今世界死亡率最高的疾病之一,而基因测序技术的快速发展对肿瘤的早期筛查、诊断、个体化治疗起着至关重要的作用。有研究表明,基因测序技术能够更快速、高效、敏感地检测循环游离肿瘤DNA[6],如今的高通量测序技术可以精确检测出BRCA2、TP53、KRAS等基因的突变,从而为患者制订个体化的治疗措施[7];也可以通过对肿瘤高发家族的人群进行全基因组检测,确定异常基因,从而进行早期干预治疗。
2.1.4.5 基因测序技术涉及到的基础研究、核心技术以及技术发展
单细胞测序技术是基因测序技术史上甚至是科技发展史上的一大创举,2012年北京大学谢晓亮、白凡课题组与北大肿瘤医院王洁团队合作通过单细胞基因测序手段首次报道了对于癌症病人单个外周血循环肿瘤细胞的全基因组、外显子组测序结果,该研究对揭示癌症转移的分子机制具有重要意义[8]。
2.1.5 单细胞测序技术
1991年开始陆续出现单细胞测序技术的相关研究论文,之后论文数量呈缓慢增长趋势,直至2012年,单细胞测序技术研究论文数量在全球、美国以及中国几乎同一时间开始增长,全球和美国均呈直线增长趋势,我国则呈现平稳增长趋势(图3)。
图3 单细胞测序技术SCI国际发文量及中美发文量年度变化趋势
2.2.1 全球专利授权数量年度变化
从Thomoson Innovation数据库中检索并获得基因测序技术相关授权发明专利58 634件。1978年陆续开始有基因测序专利技术获得授权,之后呈稳定增长趋势,其中,2010-2013年专利授权数量增长较快,2014年达到峰值(共4 066件),如图4所示。
2.2.2 专利受理的国家/地区分布
专利受理的国家/地区反映了技术接受地信息、专利权人的知识产权与产品市场布局。基因测序技术领域主要有美国(30%)、中国(20%)、欧洲(10%)、澳大利亚(8%)、韩国(5%)、加拿大(5%)、日本(4%)、德国(3%)等,其中,中美已成为基因测序技术领域专利权人最重视的专利保护区及产品市场。
图4 国家知识产权局基因测序技术的专利授权数量年度变化
2.2.3 高价值专利分布
参考Innography的专利强度指标,分析基因测序技术已授权专利的专利质量(图5)。专利强度越高,专利的质量也越高。专利强度在0%-10%之间的专利有10 172件,占17.35%;专利强度在90%-100%的专利有1 611件,被认为是该技术领域的核心专利。
图5 基因测序技术授权专利的专利强度分布
结果显示,专利价值在80-100分之间的授权专利共有3 277件。其中由我国发明人发明的专利共有48件:14件来自深圳华大基因、4件来自中科院、2件来自博奥生物公司、2件来自复旦大学。深圳华大基因的高价值专利所占比例为30%。
2.2.4 技术研发热点主题
利用Thomson Innovation专利数据库的Themescape Mapping对近5年授权的基因测序专利文献进行可视化聚类分析,制成专利地图(图6),呈现出5个基因测序技术领域的技术研发热点主题:引物扩增、分子标记等基因测序技术的关键核心技术,氨基酸测序,植物转基因、基因组测序,免疫库组测序,肿瘤诊疗。
2.2.5 我国授权的基因测序技术相关专利
2.2.5.1 专利授权数量呈爆发式增长
在中国国家知识产权局的专利检索平台通过检索、人工判读的方式获得我国已授权的基因测序技术相关专利1 325件。2002年国家知识产权局开始有基因测序技术专利授权,之后专利授权数量缓慢增长,直至2012年专利授权数量呈爆发增长趋势(2012年、2013年、2015年、2016年分别为136件、196件、218件、259件),2014年达到峰值(267件)。
图6近5年基因测序技术授权专利的技术研发热点主题
2.2.5.2 我国本土专利授权量最高
2002年以来,全球共有15个国家向我国国家知识产权局提交基因测序技术相关专利申请,并获得授权(共1 325件)。统计分析各个国家专利授权数量及其所占比例(表2),我国授权的专利主要来自于中国、美国、荷兰的发明。中国本土的专利授权量为1 240件,占授权总量的93.66%。
表2 基因测序专利技术主要研发国家
2.2.5.3 生物科技公司领军研发主体
统计2002年以来国家知识产权局授权的我国基因测序技术领域相关专利技术的主要研发机构,专利授权数量在10件及以上的研发机构有18个(表3)。
表3 基因测序专利技术国内主要研发机构
其中有3家生物科技公司,包括广州益善生物技术有限公司(第一)、深圳华大基因科技有限公司(第三)、北京中科紫鑫科技有限责任公司(第五),均位于授权数量排名前5位。这3家公司的专利授权数量占18个研发机构授权总量的39%。其次是科研院所和高校,如中科院、农科院、华中农业大学、上海交通大学、东南大学等。
1990年国际人类基因组计划启动以来,全球、美国的基因测序技术相关研究论文数量呈明显直线上升趋势。1999年我国参与“国家人类基因组计划”,从2002年开始,我国基因测序技术相关科学论文数量开始出现明显增长趋势。
1978年陆续开始有基因测序专利技术获得授权,之后呈稳定增长趋势,2010-2013年专利授权数量增长较快。我国国家知识产权局2002年开始有基因测序技术专利授权,之后专利授权数量缓慢增长,直至2012年专利授权数量开始呈爆发增长趋势。
从世界范围内看,我国基因测序技术的科学研究和技术研发已处于较为领先的水平,仅次于美国。基因测序技术领域SCI论文数量全球排名第二、高被引论文贡献率世界排名第三;专利申请受理国排名第二,成为继美国之后,专利权人最重视的专利保护区及产品市场。
基因测序技术的科学研究和技术研发主题主要集中在肿瘤诊疗、植物基因组测序、HIV病毒和胃肠道菌群的鉴别、免疫库组测序等方面。
2012年北大谢晓亮团队发明的单细胞基因组扩增新技术(MALBAC)使单细胞精准测序变得可能,从而极大推动了单细胞测序,甚至是基因测序领域的科学研究和技术研发进展。2012年以来,单细胞测序技术的SCI论文数量在全球、美国以及中国几乎同时开始增长。同样,2012年以来,基因测序专利技术的国际授权量和国内授权量也几乎在同一时间呈现爆发增长趋势。
生物科技公司是我国基因测序技术的领军研发主体。从SCI论文发表数量和专利授权数量来看,深圳华大基因是我国SCI论文发表数量排名前10的研究机构中唯一的一家企业,也是基因测序技术领域国内唯一的一家入围ESI高被引论文的企业,在单细胞测序领域也贡献了2篇论文。同样,深圳华大基因的基因测序相关授权专利的专利质量也较高,在美国专利局获得5件授权专利,在我国国家知识产权局获得101件授权专利(其中含盛司潼的22件授权专利)。深圳华大基因自成立以来所获得的成果,奠定了我国在基因组学研究领域中的国际领先地位。另外,广州益善生物技术有限公司和北京中科紫鑫科技有限责任公司也是国内基因测序技术的主要研发企业。
基因测序技术的发展以及最终目的在于临床应用,高校和科研机构的技术研发要与临床医院的临床实验紧密合作,推动转化医学的快速发展。北大的生物动态光学成像中心与其附属第三医院、肿瘤医院的合作,获得了显著的研究成果。中国医学科学院有自身独特的优势,协和医院、阜外医院、肿瘤医院拥有国内一流的临床医疗水平,应该充分发挥优势,建立机制,鼓励研究所与临床医院进行充分合作。