汪严磊
(德勤中国 创新部门, 上海 200002)
在完成本主题研究和方法开发的半年前,德勤中国创新部门接到一家全球500强跨国企业在华创新和研发中心的课题委托,希望德勤针对某项全球热门的关键技术进行针对该企业现有各业务板块已有产能的技术适用性评价。在经过一系列具体需求和期望厘清之后,最终明确该课题具有技术的普适性以及评价的针对性双重需求。为此,德勤中国创新部门计划从创新链的视角进行全方面的企业技术适用性评价方法排摸,以期客观且中立地提出对诸多技术的适用性评价结论和应用建议。
技术适用性(technology usability)从字面上来看是指某种具体的技术或发明在某一特定资源环境下能够发挥多少特定作用的程度。这一概念存在的必备要素有3个:①具体的技术或发明;②特定的资源环境;③特定的作用。与此同时,在真正的企业经营实践当中这种字面解释背后还必须有另外一个必备要素的加权,即所谓的实用性。如果说一个具体的技术或发明在某家企业现有产能当中具有完全的技术适用水平,但是对整个企业生产过程或者价值塑造并不实用,那么这种技术在实战当中也是不具备适用性的。
因此,德勤认为如果把技术适用性评价描述成一个具备“神”和“形”的检验工具,那么此时,就需要一个能够对所有技术都有检验效用的“神”(即评价逻辑)和一套能够为不同企业个性化特征进行定制的“形”(即评价方法)。评价逻辑指的是对哪些方面进行全面评价才能代表技术地区可适用?评价方法指的是用什么样的衡量体系和计量方法最终表示技术适用与否的各个等级?基于这个思路,德勤认为首先要明确评价逻辑,而后根据评价逻辑的具体内容制订评价方法,从而形成“神”“形”合一。
在通过对科学网核心学术文献集(Web of Science Core Collections)以及中国知网(CNKI)近10年的文献搜索之后发现,在国际标准组织(International Organization of Standard, ISO)的标准体系当中有一部与适用性(usability)有关的标准文件,即ISO9241-11号标准文件[1]。然而,经过对其深入阅读和分析后发现,该文件主要用于人机交互系统的适用性主观评价,其视角是从人类在与某款信息系统进行交互过程中的体验、效率和满意度3方面进行主观评价的。这显然与目前所面临的对技术在特定企业中的适用性客观评价大相径庭。德勤认为企业对技术的适用性评价应当围绕技术在投入应用过程当中所需的各项客观资源在目标企业里是否已经拥有或能够快速配置到位来进行的,客观技术的适用性不应随着人群对技术的体验、效率和满意度产生变化而变化。
另外,在对WoSCC使用“technology usability”作为主题领域关键词进行文献搜索时,一共获得13 626篇相关文献,并获得其学科主题分布(图1)。在对CNKI使用“技术适用性”“技术可用性”或“技术可行性”分别作为主题领域关键词进行文献搜索时,一共获得6 004篇相关文献,并获得其学科主题分布(图2)。
图2 CNKI在“技术适用性”方面的历年文献学科主题分布数据来源: CNKI。
从上述两个分析中可以看到,在全球技术经济的角度绝大多数有关技术适用性的研究都与计算机科学、信息科学有关。对其中部分文献进行随机抽样,选择10篇文献进行阅读和分析,最终发现其内容始终是围绕前文所提到的国际标准组织ISO 9241-11号标准文件而展开的。可见技术的适用性在全球范围的科研领域在人机交互系统方面是相对标准化和固化的方法,但是在其他工业领域由于没有标准化以及固化的方法,且ISO 9241-11文件无法用于更广泛的客观技术适用性评估,因此在普适性的技术适用性评价方面历年文献主题并没有形成被引或共被引的关联性或集聚,也就是说在各个其他技术领域的适用性评估,不存在共性逻辑或者标准方法。与此相反,在对CNKI的相关文献主题进行统计后发现有大量与技术可行性研究或分析有关的文献成果。同样对这些文献进行随机抽样,选择其中10篇文章进行阅读和分析,但遗憾的是这些文献在论述技术适用性的标准时几乎一致地都仅仅从技术参数与功能需求耦合的单一角度进行的分析。而针对本次德勤中国创新部门所接到的评估需求来看,仅仅从技术参数满足性角度来作为技术的适用指标显然是不够的。
基于上述的业内经验回顾可以得出结论:学术科研和行业市场上目前已知的技术适用性评价方法不能直接沿用在本次课题研究当中。
由于在学术科研和行业市场两个领域都难以找到直接可用的方法或者工具,德勤中国创新部门决定从源头开始思考来构建一套能够在底层逻辑上和核心方法上对广泛技术普适,但同时又可以根据不同企业的情况进行定制评价的技术适用性评价方法。
如前所述,评价某项技术的适用性需要从技术的客观成熟度和企业在技术适用过程中对所需资源条件的齐备度两个大方向进行思考。其中对技术成熟度的评价方法有业内标准。但是对资源条件齐备度方面的评价则需要进行充分的研究来得以构建。
技术成熟度评价的概念最早起源于美国宇航局(National Aeronautics and Space Administration, NASA)在太空和航空技术研制任务中的应用[2]。20世纪80年代末,为了满足之后以及21世纪新型航空器及航天器的研制任务,美国宇航局总结了过往在技术应用评价方面的经验和洞察,最终形成了如今在技术管理领域所熟知的技术成熟度评价等级(technology readiness levels, TRL)(图3)。时至今日,美国宇航局已经将该评价体系作为技术创新管理和应用过程中的成熟工具广泛使用。与此同时,美国国防部(Department of Defence, DoD)在此基础上也于2005年发布了《技术成熟度等级手册》[3]以及于2009年沿用技术成熟度评价等级的开发思想设计并发布了《制造成熟度等级手册》[4]。如今,包括美国宇航局、美国国防部高级研究计划局(Defence Advanced Research Projects Agency, DARPA)、日本宇宙航空开发机构(Japan Aerospace Exploration Agency, JAXA)乃至中国工程院、中国航天系统[5-8]等在内的国际航空、航天、武器及工程领域顶尖机构都已经在研究并使用技术成熟度评价等级进行技术发展识别和评价。
图3 技术成熟度评级等级(TRL)资料来源:NASA。
由于当前标准的技术成熟度评价等级是基于其在航空航天领域的应用而存在的,因此有部分等级描述的措辞用语都使用了航空航天领域的词汇,比如TRL8当中的“flight qualified”和TRL9当中的“flight proven”。在对上述评价等级进行系统性分析之后,德勤中国创新部门对这些专用措辞进行了修正以使该等级标准能够更好地适用于对广泛技术的通用性描述。同时,对每一个成熟度等级的具体内涵做了通俗的诠释,如表1和图4所示。
表1 技术成熟度普适评价等级
图4 技术成熟度普适评价等级通俗解释
在技术适用性评价方法的开发中,最具挑战的当属对资源维度的识别。为此,德勤中国创新部门借鉴了国际欧亚科学院院士、中国技术经济学会神经经济管理专委会主任委员马庆国教授所开发的价值系统金字塔模型[9](图5)的启发。
图5 价值系统金字塔模型[9]
价值系统金字塔模型是由马庆国教授最先提出的。该模型的内涵是以价值为导向,综合分析组织/生态运作过程中相关业务或项目的资源情况和环境情况,从而判断其优势和差异竞争要素,明确一项技术性业务/项目是否具有价值的战略层思维/底层逻辑模型。该模型充分凝结了SWOT优劣势分析模型、PEST环境分析模型、波士顿矩阵以及战略地图等诸多管理科学与工程领域的成熟工具而形成的。同时,该模型肯定了技术应用的最终导向是关联项目/工程在经济和社会价值的上下耦合,这让使用者更好地理解了一个具体的技术在企业、组织和社会宏观价值战略中的层层递进关系。
技术适用性评估的资源齐备度识别是通过对价值系统金字塔模型的底层资源端点和环境平面之间的动态关系理解上得以确立的。其中,识别出在狭义资源领域下人才资源齐备度、设备资源齐备度、数字资源齐备度以及物资资源齐备度是技术适用的关键和核心。而在广义资源领域角度,对环境平面做了深度剖析,并最终识别出技术安全风险应对齐备度、环境污染风险应对齐备度和原料供应风险应对齐备度为技术适用的另外3大关键核心(表2)。
表2 技术适用性狭义及广义资源齐备性评估维度及解释
至此已经全面识别了一项技术在企业适用过程当中的3个评估维度,分别是技术成熟度(TRL)、资源配置齐备度(ZRL)、风险应对齐备度(FRL)。下一步工作是对后两者进行等级的划分和各级别通用评价标准的制订。这一步的构建作为技术适用性评价方法的重中之重,即要反映底层的普适性,又能满足表层的定制性。
为了实现上述目标,德勤首先从评价方法整体的适用便捷性和可操作性角度进行研究思考。美国国防部在借鉴美国宇航局技术成熟度评价等级TRL的开发思路后制订了制造成熟度评价等级MRL,然而前者将技术的成熟阶段划定为9级,而后者则定为了10级。导致这种差异原因是因为后来美国国防部对于各项制造技术的投入在产品生命周期中各阶段的案例分布做了统计学角度的梳理,结果发现在制造方面可以将阶段划定为10级。当然,这种方法十分科学严谨,并且也是出发于实际。在单项领域成熟度评价等级开发的时候,这种做法能够确保标准划分和界定的精确性。然而,在技术适用性评价方面,由于涉及的评价维度有多个,采用同样的方法会造成不同维度等级数量的参差不齐。这对于最后的各领域等级评价分值集成是不利的。因此,德勤采取强制分布和资源逻辑实战推演的方法,首先将所有领域的评价等级都设定为9级以确保和技术成熟度评价等级的齐性。同时,对各项资源领域在从0到完全成熟水平上的核心情景进行了识别。比如在人才方面,认为随着技术的成熟演进和适用的程度变强,所需的人才在能力及素质具备、人才经验和知识的固化、人才培养和自我供给这3个情景下呈现变化。由于每个情景在从无到有的过程中会存在各种程度变化,因此最终形成了9个不同的等级。值得注意的是,不同程度的3个情景对应这9个不同等级是不能简单地用排列组合的方式进行搭建的,原因在于:①各资源领域的情景数量不同,通过排列组合得到的结果未必是9个不同程度等级;②即便满足9个等级的数量要求,但是在企业经营实践情况下个别情景组合会存在矛盾和逻辑不一致性,比如通过排列组织,可能会得到人才领域的一个等级描述很难配置到具备相关能力及素质的人才,人才经验已经开始积累和固化,同时企业能够完全自主培养人才进行供给。从这一条等级描述来看,该企业已经完全可以进行人才培养和自我供给,但是在人才经验和知识固化方面却刚起步,这显然不符合企业经营过程中的真实逻辑。同时既然已经可以开始进行人才培养和自我供给,那也不存在很难配置到具备相关能力及素质的人才这种情况了。因此像这样的情景等级描述就不能被纳入人才资源齐备度评价等级当中。基于上述思想、原则和判断逻辑,完成了对所有领域各等级的具体描述设定,并且在设计和撰写这些描述时,尽可能地让每一个情景都一般性用词,从而实现这些标准的普适。
对于技术的适用性评价是通过对特定企业当前资源盘点的基础上进行的。比如对人才资源齐备度的评价,应该基于目标企业在人才储备方面的现状进行等级评定。如此才能将最终集成分值所映射的技术适用情况适配在特定企业上,否则就失去了为特定企业进行技术适用性评价的意义。
同时,按照上述等级评价规则,当在为某个地区多家企业联合体进行技术适用性评价时就应当对这些企业资源的最佳情景进行匹配评定,也就是说当涉及到多家企业进行技术联合应用的时候,应当对每个领域做得最好的那家企业的情况进行等级评定。
在完成了上述等级描述之后,根据目标企业对技术适用过程中的资源及风险最低容忍度进行可行和不可行的等级划定。同时也开始着手于对不同领域等级分值维度集成。最终再通过维度分值的二次集成形成技术适用性评价分值(图6)。
图6 技术适用性评价分值集成
从图6可以看到,界定技术齐备度(即技术成熟度评价等级)在5级及以上才能够被产业化,5级以下不建议企业产业化。这也是目前业内的普遍标准。对于另外两个维度下的各领域分值,设定4级及以上才有适用考量意义,低于4级均不予适用考虑。另外,在资源配置齐备度和风险应对齐备度上,为了能够实现不适用评定的一票否定,采用几何平均数的计算方法,即
(1)
(2)
用几何平均数的优点在于:①相比算术平均数,两大齐备度的总分值不会因为部分领域分值过高而稀释了某项领域一票否决的设计初衷。比如当人才资源齐备度等级为3级,根据图6应当赋值1分,而当其余3项领域(设施、数字和物资)的等级均为最高等级9(即赋值9分)时,用算数平均数得到的资源配置齐备度总分是7.5分,显然1分的分值并没有导致资源齐备度不足的分数结果,因为被其他的高分拉高了平均值。而通过几何平均数的计算,最终得到的分值是5.20分,其分值显著低于算术平均数并且更能代表资源配置齐备度的真实情况。
在最后进行针对技术适用性评价分合成的时候采用了算术平均数而不再使用几何平均数是因为我们认为此时从技术齐备度(即技术成熟度)、资源配置齐备度和风险应对齐备度3个视角彼此的优劣是可以取长补短的,即允许通过分值差异进行平均值的稀释,这一点显然用算数平均数会更加适合。
最终得到的合成分就是技术适用性评价分TUL。从图6可以看到,针对本次企业的技术,划定合成分TUL为0~4的技术被认为是不推荐该企业当前投入的,4~6的技术被认为是要谨慎考虑投入的,而6~9分是推荐考虑投入的。6~9的分值又可以划分为基本适用、较为适用和推荐适用3档。
至此,针对该企业的技术适用性评价模型的构建就完成了。该模型的核心在于方法框架、底层逻辑和集成思路,而具体的分值划定甚至等级描述都能根据不同企业的需求进行微调。这也就实现了开发技术适用性评价等级模型在底层逻辑和方法思路上是对所有技术和企业普适的,而在具体应用过程中通过最小方面内容的调整和适应就能用于差异化企业的各类技术适用评价当中。
技术适用性评价方法是一种工具和思维交叠的方法论。这种思维的产生离不开价值系统金字塔模型的引导和启示。同时,通过对整个金字塔模型中层和顶层内涵理解,也意识到本文所阐述的技术适用性评价思维可以进一步向金字塔模型上端拓展,在不同的维度实现以某项创新技术为出发点和核心的工程/项目的整体社会经济价值评价。这种评价也将为技术管理领域的专家提供技术在社会各领域交互过程中的适用性评价。