邓敏莉
厦门市妇幼保健院,福建厦门 361003
Excel软件在出院疾病诊断统计中的应用
邓敏莉
厦门市妇幼保健院,福建厦门 361003
目的运用Excel软件统计出院诊断。方法在电子病案管理系统中检索出需要统计出院疾病诊断的病案记录,并导出住院号、姓名、性别、诊断名称和诊断编码等字段,建立Excel数据库;以ICD-10编码为疾病诊断的特征识别,运用Excel软件中数据透视表的多重合并计算数据区域功能、以及vlookup函数,统计出院疾病构成。结果医疗机构统计人员应掌握Excel的数据透视表、函数等功能的使用,从而更好地提高ICD-10编码的利用效率,为医院管理决策提供参考。结论医疗机构统计人员应掌握Excel的数据透视表、函数等功能的使用,从而更好的提高ICD-10编码的利用效率,为医院管理决策提供参考。
出院疾病诊断;ICD-10编码;Excel软件;数据透视表;VLOOKUP函数
在病案统计工作中,出院疾病诊断统计越来越多为临床业务科室所重视,统计所在科室收治的住院患者所有疾病诊断,有助于为科室进行工作总结、制定规划发展时提供客观参考。由于全国各医疗机构使用的管理统计软件水平参差不齐,在实际工作中,并非所有的管理系统都集成有该指标的自动统计模块,往往需要另行购买,或需人工进行数据处理,此时就需充分利用Excel这类功能强大的办公软件,摸索出统计出院疾病诊断的方法。
1.1 资料来源
电子病案管理系统中,需统计出院疾病诊断的病案首页信息记录。
1.2 方法
1.2.1 建立Excel数据库 在电子病案管理系统检索查询页面设定出院时间段、出院科别选择,导出住院号、姓名、性别、诊断名称 1、2、3……18和诊断编码 1、2、3……18等字段,保存为Excel,自此数据库建成。
1.2.2 以ICD-10编码识别疾病诊断 仔细观察导出字段中“诊断名称”列的不同取值,不同医生在同一疾病的诊断上,名称往往并不统一或规范。所以,经过疾病编码人员把关审核过的的ICD-10编码显然更为准确、简洁、规范。由此不难决定选取ICD-10编码作为疾病诊断的识别特征。
1.2.3 运用Excel软件汇总ICD-10编码 出院患者的出院诊断少则一个,多则十几个,该例中的病案管理系统检索模块可分别导出诊断名称、诊断编码多达十八个,同时,临床医生在书写出院诊断时往往并未严格排序诊断的主次,所以需要统计所有患者的所有ICD-10诊断编码。观察数据库中诊断编码1、2、3……18等变量及其取值后,思考如下:①数据量庞大,数据库结构仅诊断编码这一变量已使列数达到18列之多;②ICD-10编码在所有诊断编码中呈无规律分散状分布,如诊断编码1中出现过的所有ICD-10编码并不一定全部出现在诊断编码2中,反之亦然,以此类推。③统计字段诊断编码1、2、3……18出现过的ICD-10编码及次数需使用 Excel软件数据透视功能的多重合并计算数据区域功能,在多行多列中提取不重复值,再进行计数汇总[2]。具体操作方法如下。
①调用“数据透视表和数据透视图向导”。菜单在Excel 2003版中,单击“数据”菜单,选择“数据透视表和数据透视图”命令,或者使用键盘快捷键ALT+D+P调出该命令。在Excel 2007、2010、2013版中,需先行手动添加该命令:首先,在功能区上鼠标右键,选择【自定义快速访问工具栏】。选择【不在功能区中的命令】,在左侧列表中找到【数据透视表和数据透视图向导】。选中该功能,点击右侧的【添加】按钮添加到快速访问工具栏。该功能出现在右侧列表后,点击【确定】按钮。这样操作完毕就能在快速访问工具栏看到该功能按钮了。如图1所示。
图1 添加“数据透视表和数据透视图向导”菜单
②生成合并计算数据区域的数据透视表。在快速访问工具栏点击上一步刚添加的按钮,“数据透视表和数据透视图向导”—3步骤之“1”对话框显示出来后,点选“多重合并计算区域”选项,,接着单击“下一步”按钮。“数据透视表和数据透视图向导—3步骤之2a”对话框显示出来后,接受“创建单页字段”选项(此项为默认选项)。单击“下一步”按钮,激活“数据透视表和数据透视图向导—3步骤之2b”对话框,如图2所示。
图2 “数据透视表和数据透视图向导—3步骤之2b”
选择参加数据透视表合并计算的数据区域,接着单击“添加”按钮。该例中,需合并计算的数据区域为诊断编码1到诊断编码18,但在选定区域时需要注意,将“诊断编码1”之前的列或直接在“诊断编码1“列前插入一空白列一并选上,作为数据区域的起始列。单击“下一步”按钮后,提示是否新建工作表,点选“是”后,即可点击“完成”按钮。
③设置生成的多重合并计算数据透视表。在数据透视表页面右侧的字段设置中,行区域默认显示“行”字段,但本例为了从诊断编码1、2、3……18变量列中提取不重复的ICD-10编码,故应选择“值”字段。在值区域选择“计数项:值”,即可实现从多列自动汇总统计ICD-10编码的功能。如图3。
④人工排查错误编码。如上图3中A5单元格出现“/”值的ICD-10编码常常为合并编码所致,另外,如出现空白值则往往提示系统导出的记录有缺失值,应定位该记录,并输入住院号查找核对补充完善。排查完毕后,取消勾选数据透视表字段选择区域中的“列”,即可直接展示各编码的汇总数,如图4所示。
1.2.4 自动匹配ICD-10编码与疾病名称 在国际疾病分类中,ICD-10编码对应有统一、规范的疾病名称,卫生部也于2012年发布全国版ICD-10的6位代码扩展表Excel文件[2]。由于该例ICD-10编码数量较为繁多,故运用用Excel的vlookup函数实现编码与名称的自动匹配。
①VLOOKUP函数实现自动匹配下载并打开。“6位扩展代码表.xls”后,返回此前的数据透视表,在其第一列前插入新建列,点击A5单元格并输入【=VLOOKUP (B5,[6位扩展代码表.xls]编码名称匹配!$A:$B,2, FALSE)】[3],下拉并复制该公式,即可实现如下图4的自动匹配结果。VLOOKUP函数的语法为 (需查找的单元格,对应查找的数据区域,若在对应的数据区域匹配到需查找的单元格则返回该数据区域的第几列数据,近似匹配/精确匹配),综上,该例要求若在“6位代码扩展表”中精确匹配到数据透视表中的ICD-10编码,则返回疾病名称,若未能精确匹配,则返回“N#A”。详见图4。
图3 多重合并计算数据透视表及其字段选择案例截图
图4 VLOOKUP函数自动匹配ICD-10编码与名称
图5 XX科近两年出院疾病诊断统计表
③核查所有返回值为”N#A”的单元格。筛选所有返回值为”N#A”的单元格发现,均为医疗机构自行增加的8位扩展码,故根据院内新增记录,手动输入对应的疾病名称。
1.2.5 整理、排序统计出院疾病构成 经过计数排序、字体设置、行列宽调整后,则得出该例的出院疾病诊断表,如图5。
①即使医疗机构的管理统计软件集成有出院疾病诊断的统计功能,但如果病案统计人员发现病案首页的诊断名称往往较为混乱、甚至不规范,则建议选用ICD-10编码做为疾病诊断的识别标识。
②医疗机构如在全国版ICD-10 6位代码字典库基础上有自行扩展ICD-10 8位码,则应即时备注,建立自己的院内ICD-10代码数据库。
③使用Excel软件应注意:①保存源数据,在另存复制的副本上进行数据加工、处理。以免出现操作错误时无法恢复而需要重新获取源数据,费时费力。②运用Excel数据透视表的多重合并计算数据区域功能、以及vlookup函数时,容易在数据区域选择、固定单元格引用、标点符号等方面犯错误,可自行搜索软件帮助文件或百度搜索。
综上所述,该研究不难发现该方法不仅可用于统计出院疾病诊断,还可以举一反三到日常的数据整理分析工作中。所以病案统计人员应当注意充分挖掘ICD-10编码的数据利用价值,同时提高自己的Excel使用水平,①ICD-10编码根据类目、亚目、细目本身是为疾病分类统计而考虑设置的,②目前的医院管理统计软件功能常常参差不齐,未必能灵活实现所有的实际工作需要,③Excel软件随处可有,随处可用,并有充分的网络资源以及学习渠道,随时随地自我学习和提升的同时进一步挖掘病案资料的信息价值,更好地为医院管理决策提供客观翔实的数据。
[1]Excel123.从多行多列区域中提取不重复值到一列[EB/OL]. http://www.excel123.cn/Article/excelhanshu/201210/956.html, 2012-10-23.
[2]卫生部.卫生部办公厅关于印发《疾病分类与代码(修订版)》的通知[EB/OL].http://www.moh.gov.cn/mohbgt/s6694/ 201202/54033.shtml,2012-02-02.
[3]百度经验.vlookup函数的使用方法[EB/OL].http://jingyan. baidu.com/article/73c3ce28db4da4e50243d95c.html,2013-07-28.
Application of Excel Software in the Diagnosis and Statistics of Discharge Diseases
DENG Min-li
Xiamen Maternity and Child Health Care Hospital,Xiamen,Fujian Province,361003 China
ObjectiveTo apply the Excel software to count the discharge diagnosis.MethodsThe discharge disease diagnosis medical records were retrieved in the electronic record management system,and the discharge number,name,gender, diagnosis name and diagnosis code were exported,and the Excel database was established,the ICD-10 code was used to identify the disease diagnosis features,and the composition of discharge disease was counted by the multiway merge calculating data region function and vlookup function.ResultsThe medical institution statistical staff should master the use of pivot tables and function in Excel thus better improving the use efficacy of ICD-10 code and providing reference for the hospital management and decision.ConclusionStatisticians of medical institutions should master the use of Excel especially the features of pivot tables and functions,so as to better improve the data mining for ICD-10 coding,provide a reference for hospital management when make decisions.
Discharge disease diagnosis;ICD-10 code;Excel software;Pivot tables;VLOOKUP function
R197.3
A
1672-5654(2017)04(c)-0061-04
10.16659/j.cnki.1672-5654.2017.12.061
2017-01-22)
邓敏莉(1987-),女,福建福州人,硕士,统计师,研究方向:卫生统计。