一、信息标准化的定义
狭义:指信息表达上的标准化,在一定范围内人们能共同使用的对某类、某些、某个客体抽象的描述与表达。
医学信息的标准化:指信息标准化在医学领域的具体应用。
广义:指对整个信息的处理:信息传递与通讯、数据流程、信息处理技术与方法、信息处理设备等。
国际标准化组织(ISO)和IEC
IEC:InternationalElectrotechnicalCommission.国际电子技术委员会
标准:是指获得一致同意的,并由公认权威机构认可的文件,这个权威机构负责为公共和常用事物的活动及结果制定和提供规则、指导原则,其宗旨是使该环境达到最佳有序度。
标准化:是指针对现存或潜在的问题,为公共的和常用的事物做出某些规定的活动,旨在使该环境达到最佳有序度。
因此标准化是为了所有有关方面的利益,特别是为了最佳经济效果,在所有有关方面的协助下进行有序活动,制定实施各项规则的过程。
信息的表达:信息标准化的基础。例如分类编码,名称和内涵的标准化、代码化。
信息的交换:解决不同的系统之间或不同的部门、企业之间对信息共享的问题。
信息交换标准:HL7:指定数据交换的格式。XML:互联网上数据交换的标准语言。DICOM:医学影象存储和信息交换的标准。
二、标准化的发展趋势
国际标准化:
标准化权威不断提高,ISO标准被多国家采纳。国际标准化日趋全面、完善。ICD-10
我国的标准化工作:计算机与信息处理标准体系表;软件标准:软件测试文件说明、软件开发流程规范、软件产品文件编制说明、软件工程名词术语等。
三、医学信息的标准化
医学信息的特点:种类繁多;面广量大、更新快;量化困难;自然语言标准化的困难
医学信息标准化的基础:信息的分类和编码;医学术语和医学专业词汇汇编;医学信息硬件和软件的标准化
软件产品的标准化:生产和管理软件工程的标准化;软件开发环境的标准化
分类
标准的分类
命名法:每一个事物给予一个唯一的确切代码与名称
分类法:具体对象分类,然后给每一类事物以确切的代码与名称。
用途分类:机内代码;辅助录入用代码;信息交换代码
一、分类的概念
分类:有两层意思:
设计一种分类方法的过程;
通过分类法将术语中的概念标记为代码或将术语中对象进行编码。分类与编码紧密相连。
分类法:某一领域内概念的序化和原理的序化。
按序化原理如何分类称为分类法。
分类法依赖原有知识,又将原有知识进一步扩展。
分类的准则取决与应用目的。例如:为了医学统计或医学研究,对心电异常分类或各种疾病进行分类。
例如:医院统计各年龄段的床位。可采用下列年龄分组:
0-3岁-婴儿、4-12岁-儿童、13-18岁-青年、19-64岁-成年、65岁以上-老人。这一简单例子中,分类标准就是年龄(唯一)。
分类条件
分类所需条件:领域完整性、类间非重叠性、满足既定目标有序化标准的同一性(同一级别只有一个标准)、类别标准明显、应用要求明确而完整、详细程度恰当。
计算机辅助编码系统所需额外条件:允许使用同义词、允许使用不同的词汇库对拼写错误不敏感、可靠性、操作的统一性(对术语排序不敏感)、准确性
二、分类的序化原理
分类就是领域内概念的有序化,概念根据属性关系来有序化。如按并行关系分成同一类,按包含关系进一步分成子类。如“肺炎为一种肺病”,肺炎是肺病类的子类。
在分类过程中贯穿始终的序化标准称为轴。如在ICD疾病分类中有序化标准要考虑:解剖位置、病因学、形态学、功能障碍等这每一项都是轴。
分类系统中,一般使用多种有序化标准(轴),情况比较复杂。又如国际社区医疗分类(ICPC)按二轴进行分类。一轴是器官系统,以字母表示,另一轴是医学组分,以二位数字表示。
围绕轴心分类可根据特性中所包含的属性关系再分为“类目”、“亚目”、“细目”等。
三、分类方法
确立目的,找出本质的特性,即确定轴心。
围绕轴心进行具体分类:按特性的属性关系,再分为亚目、细目等。
具体应用时灵活应用:举例
A06阿米巴感染
依据疾病情况(急性、慢性)和病理改变两个轴心进行分类。
A06.0急性阿米巴痢疾
A06.1慢性肠道阿米巴病
编码
一、编码的概念
编码是确定一个对象类别或类别集合(多轴系统)的过程。
类别是用代码表示的。将一种符号体系转换成人或计算机识别和处理的另一种符号体系。
编码是对对象的各方面性质(属性)的解释和归判。
二、代码
代码是编码的基本构件,代码可以是数字、字母或两者组合.
编码类型:
(1)数字代码。
可用顺序形式表示。优点:可方便地扩充代码。
随机形式分配。
系列数字。可保留给一类的集合。可用于数目固定的(不希望扩大的)类别集合。
(2)记忆(助忆)代码:由相关类的类目名称的一个或多个字母组成。有助于记住代码。例如:医院各部门表示:心脏科用CAR。
(3)并列代码是分段组合代码。每段提供相关类的特征。如ICPC中由一个字母(诊断记忆码)后加两位数字码(医学组分)。如D-消化、N——神经等。
(4)分级代码。增加类的分级细节。它含有相关类的分级细节信息及与父类的分级关系信息。如ICD-9就是分级代码。
这种编码方式与分级数据库的结构相似,父类在上层,子类在下层。
病人数据可以用某一特定级别的分级代码检索。
低层代码的扩展与修改不影响上层。
(5)复合代码。如下图包括行为、设备、目标、解剖位置。若20种行为、10种设备、5类目标、个解剖位置,可产生10万种复合代码的庞大系统。
(6)数值相加代码。只用2的乘方表示数据项和类。与复合代码类似几个特征能复合成一个代码。与复合代码不同,每个特征只用一个数值(而不是一个段)来编码。如,危险因素的存在与缺失容易用这类编码表示.举例:
20=1为吸烟者/0为不吸烟者
21=2为肥胖者/0为不肥胖者
22=4为胆固醇增高者/0为胆固醇不增高者
三、信息标准化编码应具有的特点
明确的域:
能判断是否属于该域
由于用途和目的不同,同一对象可有不同的信息学属性。
完整性与一致性
完整性:信息编码系统能完整的处理相关的信息。用设置“收容组”来保证。
严格做到一码一义,避免一码多义或一义重码
科学性
对客体分类编码的完成是对其本质的认识。
权威性
应该由政府机构制定和颁布
实用性
分类和代码都要有实用价值,医院实际需要
扩展性与可维护性
要留有扩展的余地
要安排财力人力跟踪维护
预留的空项又必须依据分类编码原理和内在属性关系而定,新的信息将参照其属性及与原有信息的属性关系填充到相应的预留空项中,而不是简单堆放原系统之后。
医学信息的分类、编码
一、医学信息的分类、编码的方法
分类方法,以西药分类为例:
类:抗生素类、心血管类
亚目:心血管类:抗高血压类、抗心律失常类
细目:抗高血压类:利尿剂、血管扩张剂
项目(药品):血管扩张剂:肼苯哒嗪、米诺地尔
编码方法
代码的位数:要根据扩展的最多位数进行制定
代码的符号:力求简洁、易于理解记忆
二、医学信息学分类编码应遵循的原则
科学性:分类有科学依据,轴心体现对象的本质特性,编码有科学意义。
标准化:有国际标准、国内标准、部颁标准、行业标准的要用这些标准,不要轻易制定自己的标准。
准确化:分类的类目应独立明确、互不包括。亚目从属关系明确。
唯一性
实用性
实用性:分类和代码都要有实用价值,医院实际需要。它不能过于简单而失去准确性,又不能过于繁琐而应用困难。
结构化:代码与对象的特性以及信息的内涵应有结构化的对应关系,代码的不同位置标识了对象的特性以及它与周围的层次关系。
可操作性:分类编码应力求简单明了,易于学习掌握,同时要便于计算机输入。
冗余性:除了应包括现有的所有对象及信息外,还应预留一定的空项,以适应随着医学发展不断涌现出来的新信息。这些预留的空项又必须依据分类编码原理和内在属性关系而定,新的信息将参照其属性及与原有信息的属性关系填充到相应的预留空项中,而不是简单堆放原系统之后。
主要分类系统介绍
一、国际疾病分类代码(简称ICD)
ICD(InternationalClassificationofDisease)是根据疾病的某些特性,按照规则将疾病分门别类并用编码的方法来表示的系统。
ICD年出版第一版,年出版ICD-9及其后的修订版ICD-9-CM,年出版ICD-10。
ICD分类依据疾病的四个主要特征:病因、部位、病理、临床表现。
ICD包含3位核心代码,这3位是向WHO报告死亡率统计的最低代码要求,可选第4位提供更详细附加代码。
ICD除基本诊断术语外,还包含其他医学类医学术语。例如以”V”开头表就诊原因和其他影响健康的因素。
我国卫生部年1月1日起要求全国统一使用ICD-10。
最新的国际疾病分类数据库ICD-10,包括疾病名称记录近一万条。主要包括ICD-10代码、附加码、疾病名称、疾病统计编码及拼音码。以MicrosoftExcel格式编缉,可挂接或转换成其他形式数据库。例如:
A39.脑膜炎球菌性败血症NMYQJXBXZ
A40.肺炎球菌性败血症FYQJXBXZ
二、国际社区医疗分类
世界全科医生、家庭医生学会(WONCA)不接受ICD分类,而采用自己的ICPC。
ICPC是两轴系统。
第一轴是以字母编码的机体各系统(器官和系统)解剖部位。
另一个轴是二位数字的医学组分编码。
组分编码含7个编码集。如“肺炎”编码为R81。(R表呼吸道,81表诊断组分)。
除三位码外,可扩充第四位码更细分或区分同义词。ICPC早期来源于WONCA的ICHPPC-2-Defind,并根据ICD-9和ICD-10作过修改。
ICPC可用于根据SOAP(Subjective-Objective-Assessment-Plan)准则(S表主观信息,如主诉;O表客观信息,如化验、实验结果;A表评价,如诊断;P表计划,如治疗、药物等。)的结构化病人就诊编码。
ICPC也可用于病情的进程编码。
三、人类与兽类医学系统术语
SNOMED(SystematizedNomenclatureofHumanandVeterinaryMedicine—人类与兽类医学系统术语)是美国病理学会(CAP)发展的,描述病理检验结果的医学系统化术语。
SOMED已在40多个国家得到应用。
SNOMED对电子病历系统的术语的标准化起着极为重要的意义。
美国病理学会开始与信息标准组织HL7和放射学学会—国家电子制造商协会合作共同发展SNOMED。
SNOMED支持疾病的多方面编码,是一个术语系统。国际版(SNOMED3.0以上)有11轴(模块),每一模块为一个完整的等级分类系统。
每一种疾病诊断包含局部解剖学代码、形态学代码、微生物学代码和功能代码,确切定义一种诊断需要4种代码复合。如诊断代码D-(链球性肺炎)等价于T-(解剖代码、肺部),M-(形态学代码、炎症),L-(微生物学代码、链球菌)。
通过使用复合和并列代码以及连接词如:“与”、“或”、“由.....引起”等代码,SNOMED可组合医学概念形成更复杂的概念。几乎所有ICD中的所有术语都可由疾病和诊断(D—代码)模块合并而成。
用SNOMED术语系统书写诊断报告很有前途,但用它形成复杂概念和复杂实体的规则尚待开发。因为各种代码的自由组合,会出现无意义的代码,而要让计算机检测代码是否有意义,几乎是不可能的。
在SNOMED中的诊断可能包含X射线物相照片的编码、形态特征代码、活的生物体代码和一些功能代码。当明确的定义了这四种代码以后,就相当于定义了一个标准的诊断代码。例如:疾病代码是:DE-
肺结核(D-),例如:可以按照肺(T-0)+肉芽瘤(M-4)+分支杆菌肺结核(L-)+发烧(F-)。
SNOMEDRT(SystematizedNomenclatureofHumanandVeterinaryMedicinereferenceTerminology)是为了满足医学信息处理的广泛要求,在原SNOMED3.5版的基础上加入新的设计理念,于年面世的新产品。
四、国际肿瘤疾病分类
WHO在ICD-9的基础上发表了ICD-10。
五、国际医疗过程分类(ICPM)
ICPM年由WHO出版试行版,包括诊断、检验、预防、外科手术、其他治疗和辅助过程等章节,本想再增加放射学和药物方面的章节,但未按计划实行。但ICD-CM的过程部分以ICPM为基础。德国、医院的保险与管理系统中。
六、临床分类(RCC)
由英国全科医生JamsRead开发。
为电子病历系统特别开发。使用5位字母数字代码,每一代码代表一个临床概念和相关术语。
七、MeSH——医学主题词表
它由美国国立医学图书馆(NLM)开发和维护,用于世界医学文献的索引。它也是统一医学语言系统(UMLS)的基础。
八、中国疾病分类
中国疾病分类(CCD)根据解剖、病因两个轴分类。
DICOM数字化影像和通信标准
此标准由美国放射学学会—国家电子制造商协会(ACR-NEMA)发展而成。它为诊断和治疗图像定义了信息格式和通信标准。数字医学影象传送、显示与存储的标准。
DICOM被大多数放射图片的存储和通信系统开发商支持。它同时又被整合到欧洲EDICOM(医学图像通信)标准和日本网络医学通信标准中。日本图像贮存和运载光盘系统支持DICOM医学内容。
DICOM产生于年,当前已修订为第三版并正式命名为DICOM3。DICOM3已被全世界的医学影像设备制造商和医学信息开发商的广泛接收。
HL7医院电子信息交换标准
HL7产生于年,是一个专门规范医疗机构用于临床信息,财务信息和管理信息电子信息交换的标准。
HL7定义了有关病人登记、入院、出院和转院、保险、付费和付款人、医嘱和实验室检验结果、图像研究、护理和医师观察资料、食嘱、药房医嘱、补充医嘱和主文件的数据传送的标准化处理。
HL7同时正在发展对预约安排,问题列表,临床试验注册,病人入院,声音口述,高级命令和生理信号的处理。
HL7正在用新的面向对象技术发展原始类型处理。目前版本是3.0版。
我国在医学信息标准化上的进展
《医院信息系统标准代码》
国家标准、部颁标准55个。
全国卫生系统医疗器械仪器设备分类与代码
是国家标准商品物资分类与代码68类的延拓
化学药品分类与代码
全国医疗服务价格项目规范
SNOMED中文版
医院信息系统软件基本规范