(河北工业大学经济管理学院,天津 300401)
钢铁材料,作为最重要的基础性结构材料,是不断发展的新材料,在可预见的未来还无法完全被其他材料替代。但伴随着新一轮科技革命的到来,材料主题引起各国关注,发达国家纷纷制定并发布了相应的研发计划,努力抢占材料技术发展的制高点,并明确将先进材料作为支撑战略的重要一环;同时,受下游行业发展高端化、用钢需求多元化以及多种新型材料替代的挑战,倒逼着钢铁材料在着力生产工艺技术进步、明确技术演化趋势、实现材料创新突破方面作出重要改变。我国也在不断审视与国际钢铁强国在材料研发方面的差距,提出以钢铁新材料为抓手,加快克服发展新材料的材料“卡脖子”难题。即便如此,无论从实践还是理论研究角度,当前对钢铁材料的探索,特别是技术预测研究仍没有满足新时期对钢铁材料及其技术发展趋势的研发需求。
从应用和研发部署的实践研究角度来看,已有研究较多集中在定性视角下钢铁材料性能及相关技术的应用上,多为宏观层面的研究述评,无法定量地衡量出钢铁材料技术的发展情况。如曹文全等[1]基于几种超塑性钢铁材料发展现状,提出了一种低成本、量大面广的优异超塑性低中碳合金钢;王舟等[2]总结第二相颗粒对新型钢铁材料抗辐射、蠕变等性能的影响,并结合第二相颗粒独特的微观组织、制备工艺等特点分析其强韧化机理。以上研究有助于我们把握钢铁材料的发展现状,但根据新时期实现材料创新突破的要求,在梳理钢铁材料系统化的技术体系、识别演化规律及预测未来发展方向等方面有所欠缺。
从发展模式和路径的理论研究角度来看,已有研究多以专利数量统计方法对钢铁材料发展的现状和态势进行简单统计,导致研究无法深入;虽有部分演化分析能展示出一定的发展脉络,但这类研究的重心是方法的改进和创新,钢铁材料仅仅充当着实证数据角色,分析成分较少,不足以充分而细致地展示出钢铁材料技术发展细节。如周谊军等[3]分析近20 年来世界锌铝镁镀层钢板领域重要国家及创新机构的主要专利和技术研发情况,了解其专利布局特点和技术发展趋势;靳军宝等[4]基于汽车用钢材专利,借助专利地图揭示汽车用钢领域的技术国际态势,力求把握汽车用钢国际发展变化趋势;冯梅等[5]选取我国钢铁企业技术创新绩效指标,运用因子分析方法与数据包络分析法,对技术创新绩效水平进行实证分析,并提出提高我国钢铁企业技术创新绩效的建议。
针对以上实践和理论研究的不足,以及新科技革命背景下对钢铁材料及其技术未来发展的预测需求,本研究尝试运用专利文本数据深入探析钢铁材料技术的演化脉络,从主题视角出发,引入LDA 模型识别大数据背后隐藏的主题信息,并借助划分时间片方法,在全面挖掘钢铁材料技术主题的同时深入剖析其在演化强度、内容中的变化;进一步提炼钢铁材料发展特征及未来发展方向,结合工业化发展阶段绘制相关路线图,以期精准地揭示其技术演化态势,为稳定钢铁材料成为新时代不可替代的基础原材料产业地位,推进钢铁产业实现高质量可持续发展提供启示与借鉴,同时为钢铁材料理论研究提供新视角,弥补以往技术演化研究中的不足。
LDA(Latent Dirichlet Allocation,LDA)模型是Blei 等[6]于2003 年提出的一种文档主题(topic)生成模型,是以文本-主题-词语的三层贝叶斯结构来实现文档中主题及词汇生成,也是一种非监督机器学习技术,可以识别大规模语料库中潜藏的主题信息[7]。本研究采用LDA 模型用于钢铁材料专利主题研究具有明显优势:LDA 模型方法的文本处理能力强,面对数据量庞大的钢铁材料专利,能够结合计算机语言实现对专利摘要的主题建模分析,细化研究颗粒度,提取变现力更强的特征词汇,挖掘更加精确的钢铁材料主题。更重要的是,LDA 模型能够将主题分析与主题演化分析相结合,既体现前沿钢铁技术主题,又可以深入进行主题演化趋势可视化,揭示钢铁材料主题所承载的技术演化方向。
LDA模型采用词袋方法将文档转化为词频向量,把文档表示由若干主题以不同概率组成,主题表示由若干词汇以不同概率组成,最终生成文档-主题矩阵和主题-词汇矩阵[8]。LDA 模型具体的数学化描述如下:
(3)针对文档d中的词汇wd,j,依据多项分布zd,j~ Mult(),获得主题zd,j;依据多项分布wd,j~Mult(),获得词汇wd,j。
其中,α和β为预先设置好的常数;w为观测参数;θ、φ、z为需要进行推断的3 个潜在参数。在训练过程中,鉴于两参数α和β的耦合性,本研究采用一种间接的推理算法——吉布斯采样(Gibbs)进行参数估算[9],根据经验设置α=50、K=0.01、β=0.01,迭代次数为1 000 次,以Java 语言进行编程实现基于LDA 的主题挖掘。
本研究目的是借助LDA 主题模型识别钢铁材料领域不同的技术主题并揭示其动态演化过程,进一步提炼钢铁材料发展特征及未来发展方向,主要包括前期钢铁材料专利数据收集与预处理、基于LDA模型的钢铁材料技术主题挖掘及演化结果呈现、我国钢铁材料演化趋势预测等环节。主题演化分析具体流程如图1 所示。
图1 钢铁材料领域技术主题演化分析流程
其中最重要的计算步骤如下:
(1)最优主题数目的确定。模型训练中,如何科学地确定主题参数K是研究的关键。本研究采用评价函数Perplexity(困惑度)来确定LDA 模型的最优主题数[10]。困惑度公式如式(1),其中Dtest为测试集;D为文本数量;Wd为文档d中的可观测单词序列;Nd为文档d的单词数目[11]。
困惑度能够衡量LDA 主题模型预测样本的精确程度,困惑度值越小,预测精准度越高。本研究依次计算主题区间为[20,50]、跨度为5 的Perplexity值,得到当K=35 时模型效果最优,因此,最终挖掘出35 个钢铁材料相关主题。
(2)主题强度度量。主题强度,作为主题本身的属性,从抽象的角度对主题进行综合评估和对比分析[12],能够表达钢铁材料相关专利研究的关注度。主题强度越大,则表明在对应时间窗口中这类钢铁技术的受关注度越高[13]。因此,通过观察钢铁材料领域相关主题强度在时间轴上的变化情况,来掌握热点技术主题的演化趋势。使用李湘东等[14]提出的主题强度计算方法,具体计算公式如下:
(3)主题相似度度量。主题内容演化反映了某主题在各个时间切片下的内容变迁,得到这样的结果需筛选时间片序列中相近的主题,进而分析文本主题内容的演变[15]。通常衡量主题相似度的方法有KL 散度和JS 距离两种,由于KL 散度表示两个概率的差异分布,是非对称的,因此本研究最终选用JS 距离来衡量主题间的相似度。计算公式为:
这里还需要定义一个阀值ε:当两主题在相邻时间窗口中的相似度大于ε时,表示主题间的内容发生显著变化;若相似值小于ε时,证明两主题内容是延续的。
本研究通过智慧芽全球专利信息数据库,以钢铁材料领域专利数据为研究对象,以“关键词=钢铁材料”为检索式进行检索,时间跨度为2010—2018 年,最终检索到我国关于钢铁材料的发明专利和实用新型专利共11 308 件。为获得科学而准确的数据源,将已检索到的全部数据进行规范,即逐一阅读每条数据,去掉重复出现的专利,如同族专利;此外,为保证数据的准确率,将检索结果利用IPC分类号进一步优化,排除与钢铁材料主题不相关和相关度较低的专利,如G01(测量、测试)、H01(基本电器元件)、B65(输送;包装;贮存;搬运薄的或细丝状材料)、H02(发电、变电或配电)等等,最终得到6 537 条有效数据。
数据预处理是主题演化分析的最重要环节之一,主题聚类结果的精度及效率都与该过程有着密切关联,因此专利语料库的选择、分词、去除停用词的每步操作都要保证结果最优[16],但由于专利词汇具有很强的专业性,涉及较多专有名词,若直接采用Java 软件自有词库进行分词效果不是很好,故以人工读取数据的方式构建自定义词汇和停用词词库,摘取“微合金化”“纳米贝氏体”等日常少见的专有名词,确保主题被正确划分,进一步对分词结果进行处理,为后续分析提供好的实验数据。
3.2.1 主题挖掘结果
经过数据预处理、特征选择模型构建、困惑度计算、Gibbs 抽样等计算,最终获得了6 537 篇专利文献的文档-主题分布和35 个主题-词汇分布,通过人工筛选剔除5 个无效主题,根据每一主题下的高概率特征词项,归纳出钢铁材料30 个主题的含义,但由于主题内容侧重不具有唯一性,进一步将所有主题分为重要技术、性能研究和材料类型3 个方向,如图2 所示,图中的连线表示不同主题间内容的关联性。结果显示,重要技术主题主要涉及钢铁材料制备流程中的相关技术,包括上游电解方法、溶液的资源化利用等主题,中游材料的精炼技术、加热冷却工艺开发、钢材结构设计等主题以及下游热处理工艺、焊接技术、检测技术等主题;性能研究主题侧重于强调钢铁材料的研究方向,包括微合金化、高性能、绿色可持续等主题;材料类型主题具体涉及碳素结构钢、不锈钢、模具钢和海洋工程用钢等钢材。在主题间关联性上,钢铁材料表面处理技术和精炼技术更注重改善材料的洁净度,海洋工程用钢致力于材料的高强性及耐腐蚀性开发,不锈钢的制备过程中更加关注裂纹的治理与控制等。
图2 2010—2018 年我国钢铁材料研究主题挖掘结果
3.2.2 主题强度演化结果
主题强度演化能够充分反映主题动态性和发展性。基于专利文本主题挖掘结果,计算各主题在每一个时间窗口的强度值,绘制出重要技术、性能研究和材料类型3 个方向的主题强度按时间变化的折线图,部分演化趋势如图3 所示。
图3 我国钢铁材料研究主题强度演化趋势
从各重要技术的主题强度演化来看,着重于钢铁材料的基础性研究,各阶段演变方向均呈现一种有序与无序交错变化的现象。结合主题发展态势,可以看到热处理技术(topic23)、钢铁材料强化(topic25)、超细晶粒(topic28)和钢铁基复合材料(topic18)研究4 个技术主题发展变化幅度较大,且处在不断成长的上升状态,这些主题的关注度和成熟度都较高,发展势头良好,也表明这些主题将会是钢铁材料领域持续关注的对象;而热浸镀锌技术(topic20)、电解制备方法(topic22)等相关主题发展态势一般,关注度普遍偏低,特别是热浸镀锌技术,目前正处于发展的冷却期,长期处于重经验轻理论、技术落后的困境,部分地区甚至将其归为落后淘汰产业,可见热浸镀锌工艺亟待发展的紧迫性。
从各性能研究的主题强度演化来看,研究重心呈现出由钢铁材料传统的性能研究转向以新科技革命及国家战略为导向的研究。其中,微合金化(topic21)主题作为传统研究方向正在逐渐远离人们的视野;钢铁材料均匀化(topic4)主题的演化强度始终较小且保持在相对平衡的状态,说明已经形成了较为稳定的内容;复合化(topic18)、洁净性(topic5)和绿色可持续(topic31)主题关注度在持续上升,特别是在2015 年后上升趋势明显加强,这与我国相关战略政策及技术水平提高有着密切关联,更与市场多元化的用钢需求息息相关。
从钢铁材料类型的主题强度演化来看,已由传统钢铁材料类型,如碳素结构钢(topic3)、低合金钢(topic28)、模具钢(topic30)转向发展重点工程建设的关键钢材,如高铁、能源和海洋工程用钢(topic1)等研究,更多关注钢铁材料本身并更加注重钢铁材料的功能性开发。这一重要转变也带来了相关应用领域的拓展,从基础设施建设、机械制造延伸至建筑、石油天然气开采、汽车等行业,进一步结合现有最新成果扩展至重大工程、现代交通、航空航天等领域。这样的转变也将大幅提升钢铁材料产业的技术水平,甚至带动整个领域的全面转型升级。
3.2.3 主题内容演化结果
为能够充分反映同一主题内容随时间变化的差异性,特将2010—2018 年数据划分为2010—2012年(第一时段)、2013—2015 年(第二时段)、2016—2018 年(第三时段) 3 个时间切片,分别对每一阶段数据进行LDA 模型训练,得到各阶段主题挖掘结果并确定技术主题内容,如表1 所示。
表1 不同时段的我国钢铁材料研究主题内容(部分)
按前文给出的方法计算各时间切片下每一主题的强度值,结合表1 绘制钢铁材料技术主题内容演化图,如图4 所示,图中圆圈大小表示主题的发展态势,圆圈越大,主题发展态势越好;箭头线段的粗细表示前后主题演变的强度大小,线段上的数值为演变强度值。
图4 我国钢铁材料技术主题内容演化态势
从主题内容演化来看,各研究方向趋向稳定,未来研究广度可变性不大,但研究深度会继续加深,如何制备复合化、智能化、高性能、轻量化和低维的钢铁材料已成为研究关键。其中,热处理技术的发展与应用主题正由传统的“加热—保温—降温”工艺向真空热处理、激光热处理、化学热处理薄层渗透等方向转变,更加注重改善材料的力学性能和绿色可持续发展,如较为突出的渗硼技术能够充分提升钢铁材料的抗高温氧化性、红硬性和耐磨耐蚀,应用广泛[17];此外,冷处理、深冷处理作为该主题的延伸,在提升材料力学性能方面起到良好效果。钢铁材料复合夹杂物的制备与控制检测主题呈现从传统的背散射电子衍射仪(EBSD)、透射电镜(TEM)分析技术转向微加工技术(FBI)和TEM 相结合的趋势。钢铁材料的高强、高韧性及超细晶始终是重点研发方向,目前正在由晶粒细化至微米、亚微米级向纳米结构钢铁产品开发、纳米级析出物强化和第二相颗粒强韧化研究转变,这三者突破了钢材高强和高韧难以兼容的困境,成为未来钢材强度进展的最有研究价值的领域之一。钢铁基复合材料的制备与应用主题中,复合材料由传统的WC、TiC、Al2O3 等陶瓷颗粒向碳纤维、陶瓷纤维、无机纳米粒子方面扩展,目前仍有充分深入研究空间,并且强调利用多孔泡沫、三维网络优化等方法实现钢铁基材料的循环再生利用,未来将出现以制备方法协同化、构型复杂化和材料增强体复合化为主的发展趋势[18]。钢铁材料表面处理研究主题较为稳定,主要集中在表面膜层的制备、表面腐蚀防护技术和表面镀层的复合化三方面,但随着近年来钢铁材料中各类高新技术的研发对表面处理的技术开发提出更为严格的要求,因此该领域的关注将会被受到重视。
基于以上LDA 主题模型的训练分别从主题强度和主题内容两方面分析了钢铁材料及其技术的演化情况,进一步通过文献梳理、专家咨询等手段更加全面地探求该领域技术发展态势,并结合工业化发展进程,全方位总结与提炼我国钢铁材料的发展特征、发展方向,呈现出我国钢铁材料未来的发展趋势。
结合我国工业化发展各个阶段,对钢铁材料的类型、研发方向、应用领域、重要技术进行研究(见图5),以识别和归纳钢铁材料及其相关技术的发展特征。
图5 结合工业化进程的钢铁材料产业发展路线
(1)从钢铁材料性能看,将以高性能、长寿命、复合化、低维化、智能化为发展方向。提高钢铁材料的性能使之满足用户需求逐渐提高的要求,终是材料发展的主流方向。其中,“高性能”“超细晶强化”是研发的永恒主题。采用新工艺、新技术,生产以高均匀度、高洁净度、高精度及超细晶粒组织为特点的长寿命、高强度、高韧性钢铁材料是未来主要研发方向。此外,考虑单一钢铁材料存在难以克服的缺陷(如弹性模量低、比强度不足等),将不同材料与钢铁基体复合得到优于原组分的新型钢铁材料成为重要发展趋势。目前,新型多相复合材料的开发热点有第二相颗粒弥散强化复合材料、无机和有机功能复合材料等,低维材料正在扩大应用,可同时用作结构材料和功能材料,纳米材料及纳米结构用于新型钢铁材料的开发被部署为材料科学研究战略的首位。
(2)从钢铁材料类型看,整体呈现出由结构性材料向功能性材料延伸的趋势。早期经历了由碳素结构钢、高强度低合金钢等基本钢材向各类新型工程结构用钢、不锈钢与耐热钢和高品质特殊钢的扩充,应用领域也从基础设施建设、机械制造延伸至建筑、石油天然气、汽车等行业,而目前最新成果致力于应用领域的进一步拓展,如研发耐海水侵蚀、极低温韧性、抗层状撕裂的海洋工程用钢,发展高端管线用钢、深海油气管道、酸性服役钢管用于石油开采与储运,开发高洁净度、强韧性、耐磨性的车轮钢以及突破夹杂物和偏析控制技术难点的车轴钢等现代交通用钢等。
(3)新一代钢铁材料更加注重可持续发展。从环境保护和可持续发展的角度出发,功能优良、节省资源和能源、长寿命、环境友好、易于循环的绿色化钢铁材料成为钢铁材料生产工艺技术研究开发的新热点。例如在汽车生产中,国外利用的各种钢板多数是涂镀层钢板,以此延长车辆的使用寿命。欧洲国家也在利用丰富的技术框架模拟钢铁材料的初级生产、二次生产和钢铁废料的回收[19],研究如何开发加倍可用的二次钢进而实现绿色可持续发展。
(4)从材料发展趋势看,钢铁材料将进入智慧设计、智慧生产与智慧服务的新时代。当前已是利用钢铁材料的基因去设计材料的时代,而未来发展的钢铁材料,必将进入智慧设计、智慧生产与智慧服务的新时代[20];同时,紧随新一轮科技革命发展热潮,钢铁材料将充分体现智能化特征[21],其中关键钢铁材料的研究与制造将与重大装备、重大工程、特殊环境、严酷竞争的客观条件密切结合,展开材料正向设计、逆向生产,建立材料全寿命周期的环境、资源、能源、经济、性能评价[22]。
目前,世界正处于新材料变革前夜,我国钢铁材料领域正迎来新的发展机遇,钢铁材料的需求、研发和应用为钢铁企也的转型升级提供了新的契机。借鉴世界先进钢铁企业发展新型钢铁材料的实践经验,分别从市场需求(客户)、技术、资源角度提出我国钢铁材料领域的发展方向:一是根据现有市场发展新材料,做到为客户提供材料需求解决方案。随着交通装备、电子信息、能源环保等领域材料需求的增加,钢铁企业应在现有市场基础上积极拓展材料供应范围、提升材料供应能力,成为综合材料供应商,努力满足客户的“一站式”需求。二是充分利用钢铁企业自主研发或技术引进,形成材料制造的关键核心技术,并加强技术的延伸,拓展技术应用范畴,如利用钢铁企业自身在金属冶炼和轧制上的技术积累开发有色金属、发展负极材料等等。三是秉承资源循环利用、可持续发展的理念,对钢材生产过程中产生的材料,如冶金渣、煤沥青等,进行二次利用开发新型钢铁材料,如发展新型建材、磁性材料等。
基于以上发展特点及发展方向分析,钢铁材料产业的创新发展需要先进的知识和技术作为支撑;同时,钢铁材料产业与下游产业联系紧密,产业链可延伸性较强。根据这些特征,未来一段时期,我国钢铁行业应充分发挥现有能力,以技术创新突破为核心,拓展新材料业务领域,培育我国钢铁材料新的竞争优势,特别要结合当前市场前景及国家战略对钢铁材料发展提出的要求,重点关注航天航空、轨道交通等产业领域,选择高性能金属材料、新型碳材料及纤维材料等作为未来重点发展的技术领域。
本研究基于LDA 主题概率模型,利用专利文本信息对钢铁材料研究领域进行技术主题演化分析,并在此基础上提炼我国钢铁材料及相关技术发展特征及发展方向,结合工业化发展阶段绘制钢铁材料发展路线图。研究发现:
(1)目前我国钢铁材料整体发展处于快速增长期,钢铁材料技术已有长足发展,这种增长态势的维持得益于钢铁产业实现转型升级的紧迫性不断增强,行业发展高端化、市场用钢需求多元化都在倒逼着钢铁行业在材料创新突破方面作出重要改变,但更与钢铁技术战略布局、国家政策总体规划部署和用钢市场多元化的技术需求息息相关。
(2)钢铁材料领域的研究重心多集中在钢铁材料上游——基础研究,而对下游——应用研究较为不足。事实上,应用研究领域具备很大的发展空间,相关技术正在展开深入研究,是今后需要关注的重点。从钢铁材料主题内容研究层面看,主要技术方向已趋向稳定,未来技术主题研究的广度可变性不大,但研究深度将会继续加深。
(3)钢铁材料研发中,高性能、超细晶强化依然是研究的主流方向,但同时长寿命、复合化、低维化成为领域内重要的研究热点,钢铁结构性材料逐步向功能性材料延伸,未来将实现由基于钢铁材料基因设计材料向材料智能设计、智能生产与智慧服务的转变。
综上,钢铁材料及相关技术正处于全面发展阶段,其迈向产业高端化进程正在加速。在此过程中,基础性研究是发展的根本,一方面应进一步加强钢铁材料的基础研究,并促进科技成果转移转化,另一方面要意识到对高性能、高质量及其原理机制的研究将成为日后钢铁材料领域实现技术突破的关键,要充分发挥钢铁材料的优异性能,创造更优质的钢铁材料产品,满足社会生产日益高端化的需求。同时,应用是实现钢铁材料价值的最终途径,只有加强相关应用研究才能形成可持续发展的良性产业链条。考虑到钢铁材料领域发展的不确定性以及国家在指导行业研究和发展中的关键地位,所以要认真落实国家及行业政策,密切关注技术的变化与发展,准确把握钢铁材料的技术方向,合理调整资源和战略规划,以利于稳定钢铁材料成为新时代不可替代的基础原材料,在新科技革命背景下推动钢铁行业迈向产业高端化,实现高质量的可持续发展。