历代方剂成方年代考

2017-03-21 06:06
中华医学图书情报杂志 2017年12期
关键词:总目方剂书籍

, ,

探讨方剂源流关系是类方研究的内容之一[1]。“祖方”作为一组类方中的源头的“基本方”,除了“基本”的含义外,还应包含制方时间最早这一必要条件[2]。方剂中药物的剂量及配伍比例与临床疗效有着直接关系,而古方剂量受成方年代影响很大,李时珍就曾有“古之一两,约今之一钱”的说法。基于以上两点,本研究需要考量方剂的制方时间。为简化考虑,以方剂首次记载的文献产生时间(即方源信息)作为制方时间。

本研究在整合前人研究成果的基础上,对不同历史年代的、海量的半结构化的方剂数据进行信息抽取,以人机结合的方式完成方源、药物的标准化及剂量的规范化,建立结构化的方剂数据库。以此进行分析挖掘,不但可以探讨类方衍化发展规律,较为准确地估算古方中药物剂量及配伍比例,还可以实现历代方剂药物知识发现,如历代方剂用药规律的变化分析(包括药物种类、剂量及其与气候变迁、疾病流行的关系等)、中医流派发展历史等。

1 数据来源

方剂数据主要来自中国中医科学院中医药信息研究所的方剂数据库[3]。该数据库收录了710余种古籍及现代文献中的古今中药方剂85 989首,为半结构化数据库,主要包含方剂的名称、药物组成、来源出处(方源)、用法、主治等信息。采用文献[4]的方法对方剂数据库中的方源信息进行标准化,建立“方剂来源出处标准表”,用于确定方剂的产生年代,包括方剂来源出处的名称、作者、年代等信息。表中录入的数据包括《中国中医古籍总目》[5](下称《总目》)收录的1949年以前出版的13 455种中医图书和1949年以后的200余种图书、期刊及相关标准等文献信息。在录入方剂信息的时候,根据其记载的方源信息,对文献来源出处进行标准化处理。

2 匹配过程

在待处理的方剂数据中,因相当一部分来源出处信息并不标准(少部分是因为录入错误造成的)而不能直接使用“方剂来源出处标准表”进行精确匹配。因此课题组开发了专门的程序,以人机结合的方式完成方源信息的标准化。

2.1 完全匹配情况

通过程序查找,如果能找到唯一的来源出处信息,则直接自动完成匹配;如果发现对应多个版本的,则优先匹配年代最早的,并由领域专家审核确认。如《伤寒论》历经汉唐宋明多部著作转载校注,其中的方剂也在各朝代广被引用,但都以东汉为其成方年代;再如补气名方“四君子汤”,在不同方书中以不同名称出现,但首见于《圣济总录》卷八十中,名“白术汤”[6],因此以《圣济总录》成书年代作为“四君子汤”成方年代。

2.2 模糊匹配情况

对于精确匹配到的,则采用基于字符串的相似度算法,即通过计算编辑距离(Levenshtein Distance)[7]进行相似度排序,找出若干最相似的候选记录,再由领域专家完成选择和审核。确属没有的记载,在系统中记录,由下一步人工处理进行完善。

2.3 人工完善

经过前期计算机自动筛选后,尚余2 697条方剂数据的方源信息未能匹配,共涉及方源信息676条。对这些数据进行人工处理,从方剂信息、综合对比书籍正异名、成书时间等,发现机器未能识别的方源信息多属于出自现代书籍、书名简写或衍文、书名中含有错别字/繁体字或符号、书籍已佚等问题。

一是出自现代文献。部分方源信息出自《总目》中没有收录的现代书籍,导致机器未能识别。以1949年为限,核有151条方源信息来自现代期刊、讲义讲稿、教材、手册、规范、标准等。

二是书名简写。129条方源信息采用了简写、缩写形式,导致机器无法识别。如《痘疹活幼至宝》简写为《活幼至宝》,《重楼玉钥续编》简写为《玉钥续编》,《医宗己任编》简写为《己任编》等。

三是衍文。部分方源信息中添加了作者信息、出版信息、内容信息等,导致机器未能识别。如《格物堂经验良方》实为《经验良方》格物堂刻本,《重庆堂医学随笔》正式书名为《重庆堂随笔》,《顾松园医镜》原名《顾氏医镜》,作者顾靖远,字松园,故名。

四是子目及章节。有些方源信息是某古籍的一节或部分内容,可以在《总目》中某本古籍下对应的子目中找到,属于此类情况的书籍共72册。如《许氏幼科七种·治验》,《总目》中收录有《橡村治验》一书,版本项中备注“见《许氏幼科七种》”,可见《许氏幼科七种·治验》即为《橡村治验》;《寿世青编·病后调理服食法》,实际为《总目》中的《病后调理服食法》,其版本项记载“见《寿世青篇(版本附录)》”;《徐评外科正宗·附录》,收录于总目《中国医学大成》中,其子目第八集外科丛刊类记载有“《徐评外科正宗十二卷》/(明)陈实功撰,(清)徐大椿评”。

五是书籍已佚。经查找,共有13本书籍有文献显示为已佚,它们是《深师方》《张文仲方》《近效方》《隐居效方》《胎产救急方》《刘氏家传》《续传信方》《隐居效验方》《医林方》《王氏手集》《大清经》《伤寒类要》《烟霞圣效方》。部分书籍虽然佚失,但可以确定书写朝代,进而确定成方时间。

六是信息错误。因错字漏字导致的机器无法识别的数据约73条,如“疡”误为“病”、“入”误为“人”、“纲”误为“钢”等,属于半结构化数据库中原有错误未能及时发现、纠正,导致机器识别障碍。此外,还有28条方源信息中因携带符号、繁体字等问题导致机器未能识别。

经统计,676条未能匹配的方源信息经人工处理修正后,大部分可在《中国中医古籍总目》中检索到。虽有151种属于1949年之后的现代文献,13种书籍显示为已佚,但其中大部分可以确定年代,仅有6条方源信息(含8首方剂)无法确定成书年代。

本文根据上述问题对“方剂来源出处标准表”进行了修订,如增添了现代文献,增加了佚失文献的成书时代和方书异名、子目,加强了对繁简字和符号的识别、校正等,最终得到如下结果。

3 结果及讨论

对人工校正后的数据进行统计分析发现,方剂数量最多的10本方书,从多到少依次为《圣济总录》10 949首、《太平圣惠方》9 907首、《普济方》5 229首、《千金翼方》1 880首、《外台秘要》1 612首、《医方类聚》1 502首、《幼幼新书》1 212首、《辨证录》1 211首、《鸡峰普济方》1 206首、《杨氏家藏方》974首。而成方年代(图1)和方书著作年代(图2)也发现了一定的规律性。

由图1可见,第一次方剂发展出现于公元200-400年;从公元600年开始,方剂数目明显增长;600-1200年期间,方剂数量虽然有时会减少,但其整体趋势是在增加,1100-1200年时方剂数量最多,超过15 000首方剂;1200年之后,方剂数量整体有所下降,但基本起伏不大,数量相对稳定。

图1成方年代分布

图2 方书年代分布

由图2则发现,公元200-400年方书出现了小幅度增长,此后一直无较大发展;1000-1200年,方书成书逐渐增加,1200年出现一个小高潮,此后方书数量稍有回落;1400年后进入了稳定高速增长阶段。无论是方剂还是方书,其增长跌落的情况基本符合中国平稳和战乱的政治经济态势。

如公元600年之前,成方和方书都较少,仅在200-400年间出现了小幅度增长。这段时间恰逢三国两晋南北朝,两汉时代的文化沉淀和南北混战、文化碰撞一定程度上促进了医学发展,尤其是被誉为中医学辨证论治奠基之作的《伤寒论》和《金匮要略》的成书。书中记载了将近300首方剂,大多沿用至今。但综合数据分析可发现,这段时间的方书很多散佚,仅在后人记载中出现书名,如《深师方》《张文仲方》等,而成方多为后人转载记录而保存。

公元600年后,方书虽然没有大幅度增长,但方剂数量有了一个小幅度上扬。这段时间处于隋唐时代,政治经济比较稳定,出现了几本收录了大量方剂的书籍,如《千金翼方》《外台秘要》等。

公元600-1200年,方剂数量虽然有时会减少,但其整体趋势是在增加。公元900-1200年,方书数量开始缓缓增加,方剂数量两次达到高峰,这很有可能与宋代两次官修方书有关。淳化三年(992年)第一本官修方书《太平圣惠方》刻印出版,该书收录了近1万首方剂;政和年间(1111-1118年),北宋官府又主持医家编纂《圣济总录》(又名《政和圣济总录》),收录方剂1万余首,所录方剂中,丸、散、膏、丹、酒剂等明显增加。因此公元1100-1200年,方剂数量达到最多,超过15 000首方剂。这充分反映了宋代官府支持与重视成药的特点。

公元1200-1500年,方剂数量明显减少,此时的方书数量也有下降趋势,这种现象很有可能与战乱有关。因为在这短短300年,经历了南宋、西夏、金、元、明五朝的朝代更迭,导致了方书及方剂的散佚。

公元1500年之后,方书数量逐渐增多,但是方剂数量却变化不大,可见此时方剂的重复率较高,大部分方书是对前人编撰的方书进行汇编、摘抄而成书,且以小型方书为多。方书数量增多还有两个重要原因,一是由于经济发展、印刷术的进步,书籍刊刻成本下降;二是由于明、清两个朝代相对平稳,很多书籍得以保存。

由上面分析可知,方剂及方书的产生与发展与社会稳定、战乱等规律基本相符,成方年代统计结果较为可靠。

4 结语

本文根据记载方剂的方源信息,建立了“方剂来源出处标准表”,采用字符串相似度算法、计算编辑距离进行相似度排序,再加以人工干预,根据首次记载该方剂的书籍成书年代推算出了方剂的成方年代。成方年代的确定是类方衍化研究中的一个关键环节,对确立衍化关系,研究方剂衍化规律,尤其对于方剂中药物剂量的推算,有着积极意义。根据方源信息可以相对准确地判断方剂的成方时间,结合“计量单位转换标准表”,能够快速准确地将古方中的药物剂量统一换算为现代的“克”数,完成古今剂量及单位的自动转换。这样处理后的数据,更能准确反映方剂中的药物剂量,进而推算方剂的量效关系、配伍比例、衍变规律等。

方剂成方年代的确立,对抽取不同历史年代的方剂信息也是一种补充和帮助。如可以尝试根据成方年代的语言特点分别建立语料库,针对文本化古籍数据进行分词和信息抽取。

此外,我们将人工校正后的方源信息补充进“方剂来源出处标准表”,进一步加强了方源信息自动抽取的准确性。而信息抽取是文本挖掘的初始阶段,也是当前文本挖掘预处理操作中最关键的技术。

猜你喜欢
总目方剂书籍
鲁迅与“书籍代购”
中国书籍享誉海外
Chinese books find an audience overseas中国书籍享誉海外
中医医案方剂多维相似度算法设计与探索
《金匮要略》黄芪类方剂探析
总目次
第36 卷总目次
曹文轩主编的书籍
柴胡汤类方剂用于肝恶性肿瘤治疗进展
论方剂的配伍环境