大家好,首期【赛思微讲坛】“FMEA”(故障模式与影响分析)圆满落下帷幕。经过课后,勤学好问的小伙伴们的积极提问,我们感受到【赛思微讲坛】实现了它的价值,帮助大家一起学习进步。感谢大家的积极参与同时也感谢赛思CSO康锐老师的耐心解答。
在此,我们把课后的提问环节整理如下:
Q1:康老师,您讲的XXX家庭变故中的例子,明显属于防差错措施没做好,那写进防差错的设计是不是更合适?
A:防差错设计已经有了,同时作为一个改进措施写进去的,主要强调的是把人的心理因素也作为一个改进措施了。这点值得肯定。
Q2:功能层次图对FMEA重要吗?
A:功能层次图对FMEA很重要,因为层次划分的多和少直接取决了FMEA分析的细致程度。一般像高可靠用户要求全都分析,这时候我们的工作量就会很大,我们就进行适当的简化。
Q3 : 适航中有FHA,其方法可否用于FMEA?
A:适航中的FHA是做完FMEA之后进行的,可以参照FMEA的结果来进行功能危险分析,这也是FMEA对安全性分析的一个贡献。
Q4 : 您刚提到的故障模式收集中可以通过试验进行,那这些试验项目有规定要求吗?
A:没有新增加试验,在已经开展的试验中,收集相关故障,作为故障模式的输入。
Q5:能否介绍下如何有效组织和开展FMEA会议?需要跨部门的联合分析会吗?
A:跨部门的FMEA会议是必须要召开的,我见到过把销售、售后人员甚至将上门服务的维修工召集起来,把发生的那些稀奇古怪的故障都收集起来,有维修工参加的FMEA会议。所以要做好FMEA一定是一个有组织的活动,不是设计员坐在屋里一个人的活动。
Q6:前面提到FMEA的故障模式的来源,但是如何确认这些故障模式的有效性,并且后期如何验证?
A:对FMEA最有效的验证当然是通过使用过程中数据的积累,FMEA的出发点是未雨绸缪,居安思危,所以我们是在里面找所有可能的疑点而不是在研制过程中就去验证这种故障模式。
Q7:对于故障分析,很多创新型的项目有些事项是反向推理估计,后续测试或试验无法验证充分,是否说明故障分析不到位或无效呢?
A:FMEA本质上是对故障发生规律的认识或是对故障的认知过程,所以越是创新型的产品越需要做这个过程。前面几个问题都涉及到了验证的问题,我们也说了FMEA是一个居安思危的方法,充分发现所有隐患的方法,所以要尽可能想到未来可能发生的事件,尽可能的采取措施加以预防。
Q8:您觉得作为一个可靠性工作人员在进行FMEA有关的工作时我们应该怎么给自己定位?
A:如果作为一个可靠性工作人员,我理解的是作为一个可靠性工程师,那就应该把我讲的这些FMEA方法都掌握了,然后去指导、带领大家怎样去做好,作为一个可靠性工程师是很难直接发现产品具体的故障模式的,除非你从事一个行业很长时间。
Q9:康老师,试验模型,怎么把握试验的度?不能因为过应力造成失效,又能起到加速目的?
A:我们在做过应力加速试验的时候,事先要做模型的理论分析,把各种不一致的条件导出来,之后再去设计试验方案,因为我们缺少对工程计算分析的认识与过程,所以我们在设计实验的时候往往有“盲人摸象”的感觉。
Q10:对于常用工艺方法,是否有什么单位或部门组织FMEA数据库搜集整理?
A:常用的工艺方法会发生什么故障模式或者是失误,有企业是在组织做这些数据的积累工作,但是这些都是企业核心的技术秘密,一般很难去共享,应该是我们自己的企业来对自己的产品或是生产线的故障模式进行收集和整理。
Q11:那您觉得可靠性工程师是专业技术人员中培训好呢?还是让可靠性专业员经过其他技术专业培训好呢?谢谢
A:这个问题非常好,两个方面都可以。可靠性作为一个技术方法本身具有方法论的属性,这些方法论需要可靠性专业人员去掌握,那么企业里面真正的可靠性工程师应该由两部分组成,一部分是由其他专业人员经过可靠性培训,一部分是由掌握可靠性技术方法论的人员共同组成,这也是比较好的企业比如华为的做法。
Q12:您刚才提到多余度的系统做FMEA时可以区分不同的故障影响,那假设有A,B两备份,两个同时失效的情况如何在FMEA表中体现?与上一级的FMEA如何衔接呢?另外,如果系统可重构,没有硬件冗余而有解析余度的话,FMEA能胜任吗?
A:在《FMECA技术及其应用》中有关于在FMEA中把功能余度考虑的具体的案例,实际上有余度的时候就是要大家建立一个可靠性模型,然后把模型里面算的余度逐渐递减的各种概率得到就是那个β。两个同时失效的情况还没有算过,但是应该是可以通过这个β来考虑的。
补充说一下,大家不要过于拘泥于这些具体的方法,这些方法都是可以改进创造的,FMEA本身就是各种分析、试验、计算、结果的汇总。所以我认为FMEA就是填表,而在填好这张表之前是有很多技术工作要做的。
Q13:在FMEA最终的报告中有时候需要单点故障清单,这个单点故障是怎么定义、分析的?跟β值有关系吗?
赛思党炜:单点故障是该功能模块故障后导致系统故障,通过FMEA可以分析,也可以通过可靠性建模进行分析。在FMEA中,该故障模式发生,对上一级的影响是任务失败,对系统的影响也是任务失败,则为单点故障;在可靠性模型中,该功能模块没有冗余,发生故障后则可靠性逻辑链条断裂,则为单点故障。单点故障模式可以用β值表示去做进一步分析。
穆尔勒:单点故障建立可靠性模型的时候就能看出来,只要该器件/功能电路/SRU(看你要分析到哪一层)发生故障,就会导致整个系统功能故障,严酷度极高,那这个就是单点故障吧。。。这么说来,和beta值确实有点关系。自家理解的,有纰漏请轻点拍砖。(为穆尔勒鼓掌)
CISS元器件
元器件行业最有态度的微信公众号
Sochips,最权威的元器件信息共享平台
每一天,都有新的期待…