故障的收集处理与系统应用

2011-06-03 10:33沈士英
电子产品可靠性与环境试验 2011年6期
关键词:元器件调试可靠性

沈士英

(华东电子工程研究所,安徽 合肥 230031)

1 引言

产品故障的收集与处理,其目的是能及时地反馈产品的故障信息,通过对故障原因的分析,确定失效模式和机理以及造成失效的原因,制定并实施有效的纠正措施,防止故障重复出现,改善其产品的可靠性与维修性,这也是评价产品可靠性设计的依据。在产品的研制、生产及使用阶段,收集出现的故障,进行分类管理与控制,对故障原因进行分析,并采取相应的纠正措施。因此,做好故障的收集,建立一个妥善保存、快速传递、有效利用的应用系统,是促进产品可靠性增长,提高产品质量有效运行的重要手段。应用系统不仅适用于产品的研制阶段,而且也在产品的生产阶段和使用阶段对提高产品质量有一定的作用。

2 故障的收集和处理

我所在相关的程序文件中明确有关人员的职责,明确在产品研制生产的不同阶段,一旦发生质量问题,出现故障的现场所在部门就要通过故障报告或质量信息反馈表将有关信息传递到质量管理部门。故障报告内容应包括:识别故障件的信息、故障现象、试验条件、机内检测(BIT)指示、发生故障的产品工作时间、故障观测者、故障发生时机,以及观测故障时的环境条件等。对报告的故障内容都应按发生故障时的实际情况进行核实。

质量部组织有关部门进行质量分析,制订纠正措施。故障核实可通过重现故障模式或依靠故障证据 (漏泄残余、损坏的硬件和机内检测指示等)来完成。对缺乏证据的情况应给予说明。故障分析通常可以采用以下分析方法:

1 )设计师与可靠性工程师及元器件质量师之间的技术讨论;

2 )故障环境的调查;

3 )进行分解、x射线和显微镜分析等;

4 )对某些特殊情况,送有资质的单位进行分析;

5 )与同类故障信息进行比较分析;

6 )其它。

对于关键元器件及重复出现故障的,质量部将失效信息及损坏元器件反馈给生产厂家,要求其进行原因分析,制订纠正措施并反馈结果,必要时进行一些试验来帮助分析(如DPA试验、生产厂家试验分析等)。

通过故障原因分析,查明失效的机理,明确其是固有的质量问题,还是设计问题或使用问题。若是外购、外协件固有的质量问题,则有针对性地向生产厂家提出质量改进要求,并在检验、试验过程中有针对性地加强监控,问题较严重时利用标准化公报及时换型。若是设计、使用问题,则在质量简报、所内局域网的质量论坛或质量信息反馈表中及时通知相关部门更改设计,并做到经验和教训共享,以避免在今后的设计和使用中再次发生类似事件,提高设计使用水平。对于共性的问题,编制质量案例,作为质量培训素材。

3 故障的分类管理

我所在收集故障后,按产品故障发生的不同阶段进行分类管理,例如:

1 )分系统、整机调试过程中发生的故障;

2 )环境应力筛选、验收、环境试验、检飞、可靠性试验以及部队试用等过程中发生的故障;

3 )分系统调试中外购件、外协件的重复故障;

4 )微波模块、组件及大型配套设备在联调、验收和试验等过程中发生的故障;

5 )产品售后服务发现的故障。

各个阶段的故障信息由所发生的部门进行收集,并按规定的流程进行传递。其故障控制流程见图1。

4 FRACAS系统运行

我所按型号产品的要求建立了故障报告、分析和纠正措施系统(FRACAS)和故障审查组织。产品故障归零的确认分为3阶段3级,即:生产和调试阶段、验收和试验阶段、产品出所阶段(质量评审、用户来所验收、所级评审);总设计师级、分技术委员会级和所科技委级。

对分系统调试、整机联调检飞过程中发生的故障由总设计师或批产负责人对 《质量问题(故障)归零汇总表》中所采取纠正措施的有效性进行确认并签字。对于调试过程中发生的问题需要设计部门处理的质量问题由调试部门填写 《故障报告、分析与纠正措施实施报告表》报告故障,由相应的设计部门负责闭环,过程负责人对改进效果进行验证。

对环境应力筛选、验收、环境试验和可靠性试验发生的故障由产品可靠性主管师、产品总体负责人或其它相关人员填写 《故障报告、分析与纠正措施实施报告表》报告故障,各故障责任单位分技术委员会负责组织对本部门的型号研制和批生产产品在验收、环境试验和可靠性试验发生的故障及纠正措施和有效性实施确认归零,报军代表认可。

在产品出所阶段、所级评审或合格证申请签署前,产品可靠性主管师(或产品质量师)组织对整机联调过程中发生的故障,产品在验收、环境试验和可靠性试验中发生的故障进行质量评审,科技委负责对技术质量问题的闭环情况及所采取措施的有效性进行评价和确认。

分系统在调试中外购元器件、外协件的重复故障由调试人员填写 《外购、外协产品质量信息表》,经质量部元器件质量师或相关负责人确认并给出处理意见,对于重复故障,元器件质量师填写 《外购、外协件故障及质量问题反馈单》反馈至供方,由供方实施纠正及故障闭环,并提供 《故障分析报告》。

微波模块、组件及大型配套设备在联调、验收、检飞、部队试用以及定型试验等过程中发生的故障:由故障发现部门填写 《外购、外协产品质量信息表》交质量部,

质量部通过采购部门反馈至供方,由供方单位实施纠正及故障归零,产品返修后回所时,应同时提供 《故障分析报告》,提交产品负责人确认。

已交付产品在售后服务中反映的故障信息或技术服务的共性问题:由售后服务中心将故障信息或技术服务的共性问题以文字形式在网上发布,各研究部门或装备发展部根据信息来确定质量改进情况。研制和批生产过程中发生的各类故障,必须按故障分类要求填写故障报告,并按FRACAS系统要求完成故障闭环工作。

5 故障信息应用实例

通过对产品在不同阶段同类故障因素的统计数据的纵向对比分析,可以对产品质量改进的效果进行验证和总结,是评价其产品可靠性与质量的重要依据,有助于组织相关部门和人员解决问题并提高有效性和效率,也有助于更好地利用可获得的数据进行科学决策,促进PDCA循环,不断提升产品可靠性。通过下面的实例,充分反映我所对故障信息的利用,是对提高产品的可靠性与质量的有效方法。

案例:对已交付使用的XX01雷达用T/R组件在调试过程中损坏的元器件进行收集统计,具体情况见表1。表1(共187件)对表中阴影部分故障比例较高的器件进行了分析,以下是具体的解决措施。

表1 01架调试过程中损坏元器件汇总

a)故障1:移相器

故障现象:

1 )电讯指标降低;

2 )引线焊接位置偏差;

3 )陶瓷开裂。

针对以上问题,我所将发生故障的移项器返回供方重新进行了测试和分析,经过和供方多次走访和交流,确定导致移项器失效的主要原因有:1)元器件本身的工艺问题;2)管壳加工工艺精度不够及过程控制不严,使部分器件引脚和微带线位置对不上而产生器件引脚脱落;3)过程中的防静电措施不够而导致器件因静电损伤失效(该分析结论是根据五所提供的分析报告而得出的)。根据以上失效原因的分析结果,要求供方要从设计上进行更改,如图2所示。改进后的移项器的管壳质量从原先的20%合格品提高到98%。并要求在元器件的采购、到货、检验、筛选、贮存、发料、装焊、调试及试验过程中高度树立相关人员的防静电意识。

b)故障2:功率模块

故障现象:组件经应力筛选后部分模块插损变大、功率变小。

将失效的器件送到电子五所、国内生产功率管的相关厂家进行了多次的失效分析,并邀请供应商、生产厂销售人员来所进行现场分析(约为2年的时间),最终发现:器件外壳底座与氧化铍的粘接空洞面积超差(见图3),入所检验的合格率只能达到70%左右。

对于功率管使用方面的问题,我们对功率管在不同的降额情况下的结温变化,开展了结温Tj(平均结温)与降额之间关系的研究,从下面的表2数据和图4可以看出,功率管Tj(平均结温)与降额之间有一定的联系,同时发现空洞面积大的,其结温随着功率的加大而增高。

表2 功率管降额与结温的变化关系

由此可以得出,由于器件外壳底座与氧化铍的粘接空洞面积超差,模块在使用过程中不能有效地散热,是导致器件性能指标降低的主要因素。因此,我们采取了对此类器件在入所时进行100%的超声C扫检测,并在设计中进行降额设计以保证产品的质量。

c)故障3:TNC连接器

故障现象:TR组件在温度循环后的测试中有45只组件噪声系数变大,电性能之驻波变差,发现TNC连接器接触不良,将TNC连接器重新焊接,故障排除。

通过5个阶段的试验后发现:产生TNC连接器的故障原因基本确定为:

1)TNC绝缘子的受温度循环的影响,结构上变化,造成微带线和连接器之间的间隙变化,重新装配后,温度循环造成的组件台阶和外导体之间的应力去除,重新构成微带线和连接器之间的间隙,故障消除;

2)连接器伸入隔墙部分(包括外导体和绝缘子)的尺寸变化较大,存在2次累积公差,造成和组件外壳的配合不当,存在法兰面接触不确定的情况,受温度循环的影响,长度超长的TNC出现同1)一样的问题;

3)TNC老练的温度不够,现有的TNC头老练温度只有50℃,相对于微带板150℃的焊接、微带和连接器300℃的焊接、组件的-55~70℃的温度循环环境应力筛选,50℃老练温度太低,在温度循环后可能造成绝缘子变形。

纠正措施如下:

1)公差问题处理,重新设计TNC和盒体的公差配合问题;

2)老练温度重新选择;

3)加强生产过程控制;

4)适当控制微带板和盒体内壁的间距。

验证结果表明:改进配合结构尺寸,故障消失,纠正措施有效。

d)故障4:低噪声放大器

故障现象:组件调试和试验后发现输入驻波比大,增益低。

通过开盖并测试发现开关采用了3个PIN限幅二极管,并联到地使用,原理见图5:放大器出现的故障主要位于开关限幅电路上的前端限幅二极管第二、三级二极管损坏。

造成限幅二极管损坏的原因有以下几种:

1 )人体带静电;

2 )仪表漏电击穿;

3 )热击穿;

4 )脉冲蜂值电压击穿。

纠正措施如下:

1 )工作之前,必须穿防静电服,带防静电护腕,杜绝人为损坏。

2 )为了防止仪表漏电击穿,测试之前,必须把所有的仪表外壳地接在一个公共地上,然后再测试。

3 )针对热击穿和脉冲蜂值电压击穿现象,针对功率损伤和功率烧毁,采用了以下改进措施:在原电路第一级二极管和第二级二极管之间增加了一级耐受功率更高二极管,并改进限幅二极管粘接工艺,见图6。

从以上的实例分析可以看出,建立产品系统至LRU级的、较为完备和有效的故障信息数据库,统计分析产品在研制、生产、检验、试验和使用中的故障信息,能为新产品设计提供对比分析参考信息,验证系统和产品是否满足可靠性要求,查明产品的缺陷,为制定纠正措施提供依据,发现产品的薄弱环节,为产品质量改进和可靠性增长提供信息的有效手段。此外还可利用信息来估计元器件与部件的性能降低和耗损特性以及为如何确定备件量提供依据,并依此制定有效的预防性维修工作,保持或恢复产品预期的可靠性水平。

6 结束语

当前,面对国际军事战略格局和未来高技术条件下的作战要求,军工市场竞争激烈,而市场竞争是实力和质量的竞争,更是企业管理水平和效率的竞争。重视和加强故障统计分析工作,能有效地掌握产品质量的现状和内在规律,为产品的质量改进提供可靠的依据,有利于有针对性地采取质量改进措施,进一步提高产品可靠性。实践证明,故障信息的有效利用对于一个企业的持续改进起到了不可估量的作用,把故障信息管理纳入质量体系有效运行的长效机制,是企业实现组织战略目标的必经之路。因此,一个成功的企业重视故障信息的有效利用,关注在运行中的重点、难点是企业保障质量体系有效运行、保障科研生产正常有效、产品质量稳步提升的重要基础。

[1]GJB 841-1990,故障报告、分析和纠正措施系统 [S].

[2]罗辑,赵义和.军用电子元器件质量管理和质量控制[M].北京:国防工业出版社,2004.

[3]孙青.电子元器件可靠性工程 [M].北京:电子工业出版社,2002.

猜你喜欢
元器件调试可靠性
元器件国产化推进工作实践探索
可靠性管理体系创建与实践
合理使用及正确测试以提升DC/DC变换器可靠性
基于航拍无人机的设计与调试
装备元器件采购质量管理与控制探讨
FOCAS功能在机床调试中的开发与应用
基于DSP+FPGA的元器件焊接垂直度识别方法
5G通信中数据传输的可靠性分析
无线通信中频线路窄带临界调试法及其应用
调压柜的调试与试运行探讨