今天开贴来学习IEC 61124-2012可靠性标准
本帖最后由iwanto于2013-12-1910:15编辑1、引子
目前我正在为一家欧洲公司的一台精密汽车仪器国产化进行为期一个月的可靠性试验,为此我首先从国标入手,仔细研究了GB5080.7、GB5080.1、GJB899A(太长了没看完)。出于保密协议,说到客户产品,我只点到皮毛,不过应该不多。这帖子的主要目的是学习最新的IEC61124-2012标准,说来惭愧,这份标准也是我昨天刚刚从可靠性论坛里下载到的,为了感谢论坛解决了我一直寻不到最新国际标准的困惑,我决定开贴来记录一下我对这份标准的学习和理解,同时对比并评论与GB5080的区别,并且记录一些专业的名词和术语用于以后的二次学习。
-------------------------------------------------------------------------------------------------------------------------------------------------
本帖46楼开始,我又转向IEC60300-3-5:2001,对应的是GB5080.1-2012。本来应该先温故一下刚刚看完的61124,但无意间的搜索发现5080.1已经有了新版,为了这家公司的英文报告,我想应该先把60300-3-5中新的表述、专业术语能学到手里。尤其是对于测定试验——通过数据分析来判断可靠性,应该给客户出具哪些明确的条款。 2、前沿
说起可靠性,我也是被迫走上了这条道路,本来想做的是半导体核心技术的研发,无奈硕博读完之后我才发现诸如Intel、Toshiba、IBM等国际大型的半导体公司出于技术封锁,在大陆并没有相应的研发机构,除了软件部门。甚至包括宝岛台湾的TSMC也只在上海开办了工厂,研发并不在其列。有几年和国内半导体工厂合作的经历,让我不敢贸然进入其中。加上硕博期间导师给我定位的可靠性研究,所以毕业后,我选择了第三方检测机构做可靠性。工作一段时间后,也接触了7-8家询问做可靠性试验的公司,通过交流我发现大部分公司对可靠性试验应该做什么很不清楚,他们只是关心试验的费用如何降低,试验的报告如何取得,试验中最好一个失效都不发生,以显示他们的产品很耐用。TNND,这叫可靠性试验吗? 3、试验前的小插曲
我在学校虽然名义上做可靠性课题,实际上接触的多是材料、电子、测试、工艺等综合的研究,因而对可靠性标准的理解也仅仅限于硕士期间查找的几份JEDEC有关封装可靠性的标准中有关焊点、结构的设计规则,其他诸如环境适应性深层次的问题也没有仔细去探究。说道这里,我提一下现在测试的这家公司的产品:试验在高温高湿环境下始终通电进行测试,外接计算机监控数据变化。一开始,我们将高温高湿全部施加于该设备,没想到不到30分钟,环境箱里全是水珠,设备上也全是水珠,监控的可靠性指标性能迅速下降,被迫降低高温高湿的应力条件,之后一直都很正常。昨天客户打来电话,说跟欧洲那边沟通了一下,并结合GB2423标准,认为高湿条件应该在高温条件先施加后1-2小时再次施加,果然我按照客户的要求先把温度调高到原本的水平,2小时候再把湿度调高到原本的水平,试验至今箱内没有明显的水珠,只是设备表面能看出来比较潮湿。⊙﹏⊙b汗一下,让客户指导我们试验机构,实是不该,不过俺一向是报以学习的态度,吃一堑长一智,留作自己宝贵的财富就行了。 本帖最后由iwanto于2013-12-413:42编辑
4、对GB5080的溯源
我觉得可靠性试验好的一面就是跟时间较劲,这也使得我在监控时间点之间抽空来学习标准。这IEC61124标准有252页,学习完后应该受益匪浅。说道GB5080系列,追溯到IEC605系列,为了搞懂GB中很多拗口的术语表达,我决定翻看引用而来的对应的国际标准,吃惊的是,我在IEC官网上http://www.iec.ch/发现IEC60605-1-1978Equipmentreliabilitytesting.Part1:Generalrequirements已经于2001年3月15日废止了,而我在看到这条消息前所有和客户讨论的方案,全部是按照5080.1来进行的,作为经历过博士段文献查新的人来讲,这是非常惭愧的一面,个人认为:即便现在的国家标准还在实行,但对国际标准的最前沿还是要做到心中有数才行。对于GB5080.2试验周期设计指导并没有引用IEC60605-2Equipmentreliabilitytesting-Part2:Designoftestcycles,而这份标准在经历1985年3月的初稿、1994年2月、10月的两次修订,至今还在沿用并稳定到2016年。而对于5080中提到的GB7288粗精模拟,对应的IEC60605-3系列也已经非删除就是withdraw了。GB5080.4指数分布点估计和区间估计部分,也没有对应标识IEC60605-4Equipmentreliabilitytesting-Part4:Statisticalproceduresforexponentialdistribution-Pointestimates,confidenceintervals,predictionintervalsandtoleranceintervals,IEC这份标准的2.0版本是沿用的。IEC60605-6Ed.3.0Equipmentreliabilitytesting-Part6:Testsforthevalidityandestimationoftheconstantfailurerateandconstantfailureintensity目前在应用,和GB5080.6恒定失效率假设的有效性检验似乎相当,我手头没有5080.6,所以没有对比。而对于GB5080.7对应的IEC60605.7确已废止,我目前学习的61124中说到的标准中的testplansA,B部分追溯与IEC60605-7部分,所以再看废止的IEC60605-7就可能有误导产生,更别说GB5080.7了。 本帖最后由iwanto于2013-12-609:27编辑
5、学习开始标准题目的含义
首先标准名称叫Reliabilitytesting-Compliancetestsforconstantfailurerateandconstantfailureintensity."Compliancetests"我用金山词霸翻译一下叫“验证试验”,OxfordDictionary里解释compliance为theactionoffactofcomplyingwithawishorcommand.故而验证这词用起来还算不错,不过我老是觉得中文有很多解释太简单了,简单也就容易有歧义产生。对于constantfailureintensity,中文怎么说,目前我还不甚了解,姑且认为是“恒定失效密度”。进而产生的疑问是failurerate和failureintensity的区别是什么。我记得在学校做课题时,对于失效率,我起初的表达方式是failureratio,而且很多一块工作的人员也这么说,但后来看了几篇论文后我也改为了failurerate。 6、纵览目录
整份标准按顺序分为了前沿、范围、参考标准、术语定义简写符号、通用要求和应用领域、通用的测试程序、序贯试验方案、定时定数截尾试验方案、alternativetime/failureterminatedtestplans设计(alternative目前我不知道该如何命名)、calendartime/failureterminatedtestplansfornon-replaceditems、组合试验方案、执行试验、报告结果。还有很多附录、图表,在此不详列。对于这几处英文表述,随着标准的深入解读,相信会逐渐明了。 7、标准Forward部分
2012版对比上一版2006版的主要变化:(1)加入的许多新的试验方案基于俄罗斯标准GOSTR27.402,同时2012版标准对准的是新版的美军MIL-HDBK-781。优化测试方案的算法使用了spreadsheet,重点强调了一个事实:设计发生变化,试验就应该重复进行。看来俄罗斯人在可靠性试验方面有独到的见解,我们中国做可靠性的工程师们在这领域内能否有所建树呢?我督促自己朝这方面努力。
(2)在这一版中更正了来自于IEC60605-7中的试验方案A和B以及附录A和B,这对于我们仍然按照GB5080.7做可靠性试验的是不好的一面。 8、标准的范围、参考标准、术语部分
四类试验方案:truncatedsequentialtests截止序贯试验、time/failureterminatedtests定时定数截尾试验方案、fixedcalendartimeterminatedtestswithoutreplacement、combinedtestplans组合试验方案。
有关试验方案、执行、分析和报告的指导请参见IEC60300-3-5,目前我手头还没有这份标准,我想这份总览的标准也非常重要。测试条件请参见IEC60605-2和IEC60300-3-5.
参考的标准包括:60050-191chapter191dependabilityandqualityofservice、60300-3-5:2001dependability管理应用导则可靠性试验条件和统计原理、60605-2设计试验循环、60605-4:2001点估计区间估计、60605-6恒定失效率和恒定失效intensity的有效性和评估试验、61123:1991成功率的验证试验方案。
到这里,似乎61123、61124系列的大标题为Reliabilitytesting,而60605系列为Equipmentreliabilitytesting。前者覆盖面更广?有待于进一步考证。
MTBF表述为meanoperatingtimebetweenfailures,加入operating更贴切,毕竟失效期间时间还在继续前进,而我们关心的时间已经停止。
OCoperatingcharacteristic具体何意?
SPRTsequentialprobabilityratiotest序贯概率试验
c代表acceptablenumberoffailuresduringthetest
k代表summationvariableforfailures
m代表trueMTBForMTTF
mo代表specifiedMTTForMTBF(designgoal)
m1代表lowerlimitforMTTForMTBF
还有很多术语就不详列,我打印出来,好对照标准看。 iwanto发表于2013-12-411:18static/image/common/back.gif
4、对GB5080的溯源
我觉得可靠性试验好的一面就是跟时间较劲,这也使得我在监控时间点之间抽空来学习...
标准看的很多啊向你学习! 9、有关指数分布
标准中假设MTTF或MTBF是独立的,且遵循指数分布。这种假设意味着失效率和failureintensity是恒定的,因此二者之间没什么区别。这点我目前还不算太理解。维基百科里这么解释指数分布:Inprobabilitytheoryandstatistics,theexponentialdistribution(a.k.a.radicalexponentialdistribution)istheprobabilitydistributionthatdescribesthetimebetweeneventsinaPoissonprocess,i.e.aprocessinwhicheventsoccurcontinuouslyandindependentlyataconstantaveragerate.指数分布的概率密度函数中的参数被称为rateparameter,如果服从指数分布,也就是这个参数为常数。
61124中建议:如果有必要测试恒定失效率的假设,可参见60605-6中的方法。