郑民+卢良进
摘要:在供应链的交易过程中,产品的概念定义是关键任务之一,B2B间的产品数据交换以及到ERP、电子目录等信息系统的集成,其内容庞杂易变。通过采用标准化的产品分类系统,将极大提高数据管理效率和企业的信息化进度。当前,UNSPSC、eCl@ss、GPC、RNTD等国际分类系统广泛应用于企业间的产品数据交换。随着电子商务的普及,各行各业的分类系统也层出不穷,选择哪个系统是中小企业在信息化进程中面临的一个难题。通过对主流分类系统现状的研究,首先归纳出分类标准的体系结构,给出分类系统的一般模型及其评价指标,并将评价指标应用于主流分类系统,指出其优势和不足,为中小企业在標准的选择过程中提供决策依据。
关键词:供应链;产品分类系统;UNSPSC;eCl@ss
1介绍
企业海量的产品数据往往以非结构化的形态如文档、图片形式储存,将其映射到标准的分类系统耗时费力,不同标准如UNSPSC和eCl@ss,其对分类和属性字典的定义也往往存在巨大差别,它们之间的关联映射也非常困难。
分类体系、属性字典以及相关的产品目录用例,并不足以成为应用某个特定系统的充分依据,如属性字典的概念重复、属性值非国际通用标准、分类目录属性概念不均衡等缺陷往往无法从前述依据中直观得到。同时,频繁的产品更新要求对标准进行及时动态的维护,表面上庞大的分类目录和属性字典往往来自从其他系统中一次性的数据同步,因此,其知识概念特性要求特定产品领域的用户进行深入的考察才能做出抉择。从事电子商务的中小企业对如何评价现有分类系统的内容质量有强烈的需求,被选中的分类标准应能满足其中长期的使用,这一点对中小企业而言尤为重要。
近十年来,针对产品分类标准出现了各领域的研究热点,如基于ontology的知识管理角度进行产品信息的分类组织,应用RDF-S和OWL等semantic web领域的描述语言实现产品信息的智能表达和检索,电子商务领域(EDI)的目录数据交换,以及通过词法分析在多个分类标准之间建立自动映射等。
本文提出了一组量化的指标用以评价分类系统在专业度、成熟度以及行业覆盖度等方面的表现,并以eCl@ss等主流分类系统为例,用这组指标对其进行评价,最后结合当前国内主流电子市场如淘宝、京东、义乌购等,提出融合国际标准和电商市场分类标准之间的方法。
2分类系统的一般模型
分类系统一般由分类体系、属性字典构成(图1),分类体系如UNSPSC、eCl@ss等一般划分为四个层次(如UNSPSC的区分(segment),系别(Family),门类(Class),及商品(Commodity))。
属性字典如IEC Common Data Dictionary(IEC CDD),RosettaNet业务和技术字典(RosettaNet Business andTechnical Dictionaries)等,一般以属性、类型、值组成,在eCl@ss分类系统中,引入了属性集(aspect)的概念,以对产品信息(知识)进行更加符合客观世界的抽象。标准的分类系统对系统中的各要素均以规范形式进行编码,如ETIM,它以实体类型EV+6位数对字典中的选项值编码。
3分类系统的评价
分类系统的容量(类目和属性的数量、新版本是否定期发布等)、分类目录树的层次和均衡度、属性字典的专业度以及产品类和属性关联的概念精确程度是标准使用者的主要关注点,本文中的评价指标即针对以上四点提出。
3.1分类的静态容量及动态更新
随着专业领域产品的不断演化更新,分类系统各个阶段版本中其类目、属性字典也必然随之增长,我们以类目数量(size of classes)、增长率(新增和更新的类目数占比)这两个参数作为分类系统的容量评价指标。
3.2分类系统均衡程度
将分类系统视为一棵集成各专业领域产品的目录树,树的一级节点(segment)下各分支类目的分布均衡指标(考察分类系统在各领域中的平衡度,最大节点类目数除以各节点平均类目数)。
3.3属性字典
属性字典是分类系统主要组成,它体现了分类系统对各领域产品知识的专业程度,本文从三个方面归纳出属性字典的评价指标:
(1)属性数量:属性字典中属性的总数;
(2)选项值类型属性占比
以选项定义属性取值,减少了属性概念的歧义,选项类型属性数量越高,越体现属性字典的专业程度。
(3)属性一类关联水平
a)特有属性占比
产品名称、产品EAN编码等属性属于通用属性,适用于所有产品类目的属性描述,如果一个类目绝大多数都使用通用属性进行关联,一方面表明该类目可能划分不当,另一方面表明该类目需要更多的特有属性(相比通用属性,特有属性出现在属性一类关联中的占比应小于某个比例,如25%)关联,从而和其他类目区分出来。属性一类关联本质即为类的属性集合,当一个类的属性集合包含一定占比的特有属性时,我们认为它是概念有效的。然而,当一个属性字典包含了大量冗余属性时,特有属性占比指标将失去评价意义。因此下面我们提出了属性概念指标;
b)属性的概念权重和类的概念值
我们定义E i=1,…n,为某个属性,那么该属性在分类系统中的概念权重CWi(Concep Weight)为:SWi=;
那么类Ci i=1,…m的概念值CVci(Concept Value)为其属性集合中每一个属性概念权重之和CVci=i;
显然,一个类的特有属性越多,其概念值越高,统计某个分类系统所有叶子节点类目的概念值,能够为我们指出该分类系统在特定产品领域中的专业程度。
4对流行标准分类系统的评价
Unspsc是联合国标准产品与服务分类系统,广泛应用于国际间的电子商务,当前最新的版本是V19_0501;eCl@ss建立在ISO 13584及IEC61360基础之上,它是来自欧洲的跨行业产品分类系统标准,当前版本是10.0。
4.1容量和维护更新
每月新增种类以版本发布间隔和新增总数求得。可以看出两个分类系统一直在追踪产品的更新,并在一定程度上及时更新标准的内容。
4.2分类均衡程度
以unspsc V19_0501为例,下图给出了unspsc所有SEGMENT下商品种类的分布:
可以看出SEGMENT编码为50的食品饮料及烟草制品占了整个分类系统商品种类的44%,1000种以上商品种类的SEGMENT仅有9个。
4.3属性字典专业度
IEC 61360,ETIM、RNTD及eCl@ss等分类系统均维护有属性字典,如IEC 61360 CCD(公共数据字典)以3字母3数字对类目、属性及选项值编码。下表是eCl@ss的属性及选项值统计:
我们发现在8.0发布的时候,选项值减少了近6000個,印证了属性字典往往存在巨大冗余的事实,冗余影响了属性字典的概念精确度。进一步通过对属性的概念权重和产品类的概念值统计发现,RNTD和ETIM的标准差远低于eCl@ss和eOTD,这也表明垂直领域的分类系统专业程度要高于跨行业的水平分类系统,后者在不同的segment间也存在巨大差异。
5结论
通过前述的数据分析,我们发现跨行业的分类系统类目分支完善,商品种类繁多,但也存在分布不均衡的情况,而专业领域的分类系统如RNTD、Etim等其属性字典在概念精确度(专业程度)上要好于跨行业的分类系统。上述分类系统除eOTD更新缓慢外,其他均有定期更新版本发布,表明分类系统的管理机构一直致力于标准的更新和维护。
中小企业在电子商务普及的大环境下,通过本文中提出的分类系统评价指标,选择适用自身领域的国际通行分类系统进行产品数据管理,在此基础之上实施企业内部ERP,改造供应链管理过程。
在B2C的电子市场中,不同于供应链中相对稳定的分类系统,电子市场中的分类系统能够根据采购者对商品的需求视角灵活调整。因此,同时面向供应链和消费者市场的中小企业,一方面应在内部ERP信息系统中使用稳定的分类标准,一方面应建立面向电子市场的分类映射,并扩展完善企业自身ERP的产品数据标准。