超越“降额” 值得现代工程师参考的可靠性概念
“可靠性”这个词汇对于不同的人士来说可能有着不同意义,但广泛来讲,底线往往在于成本。可靠性能够满足人的期望,它可能基于广告宣传、技术规格或合同,也可能与工程师以外的很多人士息息相关。例如在社会经济学的层面上,我们的生态系统以道德及伦理为基础。虽然工程师必须遵守雇主定下的行为标准,但是从个人品德的立场而言,道德规范可能比经济效益更加重要。历史常常告诉我们,任何文明都不能单凭经济基础而持久。完整的可靠性概念才是关键所在。
随着人们逐渐关注到产品制造和弃置对环境带来的影响,消费者的目光也由最低采购成本转移到最低拥有成本。无金钱或环境处罚而频繁更换低质量产品的年代已经一去不复返。相反,讲求可靠性的设计在今天的价值生态系统中变得尤为重要。
故障模式与机制
要达到令人满意的可靠性,便需要对故障模式与机制有充分的理解。故障模式说明了一个零件如何失效,也就是造成故障的“应力”。故障机制反映了零件的强度如何在不同的应力下被减弱。透过故障模式分析,我们可以归纳出故障的成因,从而改善产品的可靠性;明白了故障的机制后,我们又懂得选择合适的鉴定试验去验证某项应用的可靠性。
故障模式的分类如下:
* 电气性
* 灾难性(破坏性)
* 功能性 – 元件不能够提供正确的输出数据或信号
* 参量性 – 电流或电压超出允许误差
* 编程 – 非挥发性记忆体元件不能够做出正常响应
* 时序 – 例如由于传播延迟、读/写时间、升降时间及建立时间不符合规格而造成故障
* 机械性 – 例如引线受损、封装破裂、污染
* 外观 – 例如标记难以辨认
* 行政管理 – 例如产品、数量、封装、方向、日期和代码出现错误
故障机制的分类如下:
* 物理故障
* 与时间有关的介质击穿
* 负偏压温度不稳定
* 电子漂移
* 热载流子注入
* 辐射故障 (反应器、空间)
* 中子
* Beta粒子
* 伽马
分析和预测
可用信息能够估算出故障概率,却无法提供实际故障数据,这是实施可靠性工程的一大挑战。一般来说,用上几千小时去测试一个装置的做法是不切实际的,所以我们通常无法得到一个元件或系统在实际寿命中的测试数据。新产品的可靠性数据往往等于零,然而这并不代表有关产品永远不会出现故障。虽然以更高温度加快寿命测试或许能提供恰如其分的实验数据,不过该实验前提包括了活化能量恒久不变的假设,而在实际情况下,它是电压和温度的一个函数 (图1)。这限制了加快的寿命测试在预测可靠性方面的准确度。因此,现场故障的监察及反馈对提高产品可靠性的预测能力十分重要。
图1
图2
图2显示了在某时段内的累积故障。这个概念在常用的产品故障曲线 (又称浴盆曲线) 中得到进一步的展示 (图3)。有关曲线包含3个清晰的区段,每个区段都包含了若干有可能造成故障的因素,也牵涉某些人士。他们可以因为某些行动而影响了客户对可靠性的理解。
第1个区段描述了装置的失败率。只要在生产装置中进行若干测试,就可以把故障率降低到一个在实际运行中可以接受的水平。第2个区段描述了实际工作寿命中有可能出现的随机故障。它们与时间无关,有关装置也不会预先替换,一般都会在发生故障时才会被替换。第3个区段显示了装置的寿命接近终结而开始出现损耗。假如不加以替换,有一半产品都会在寿命中期开始失效。
图3
可靠性组合
故障率 (可靠性的一种指标) 已不单单与电气或热应力有关,同时也与硬件、软件/逻辑及传输媒体相互影响。降额是指在制造厂商针对环境或使用情况而定出的最大限制下对元件施加应力的做法,而该做法已不再是加强可靠性的良方妙法。它只是在最广泛的程度上有条不紊控制产品质量的一种要素。
这方面的最大挑战,是只能够在同一段时间内一个元件降额;而且由于制造厂商的数据册逐渐变成了只提供“最低定义”的责任文件,设计员必须在元件中内置额外的缓冲 – 这不但增加了成本,还有可能降低产品的性能表现。
高可靠性产品 (军事及宇航) 一般都会使用独立鉴定的零件。不过,这样不但增加了成本,也拖长了产品推出市场的时间。假如基于可靠性和质量来设计产品,无疑是更经济实惠的方法。针对可靠性的设计必须对故障模式有充分了解,同时选择成本最少的硬件冗余、软件控制及传输媒体组合,从而达到甚至超越可靠性目标。产品鉴定包括了解故障机制,并且设计出一套完善的鉴定计划,务求在限定的成本和时间内,对有关可靠性的预测作出精确的验证。
针对可靠性的设计
可靠性设计是指通过平衡硬件、固件和软件分配,务求以最低成本实现理想的可靠性表现。工程师应该紧记,硬件的可靠性是在元件寿命终结时的一个时间函数,软件的可靠性则是一个成本函数。软件一般都没有耗损机制。
假如要以最少成本、在最短时间内达到预期的可靠性目标,就必须充分利用设计分析、故障模拟和工程判断的重要资料。强大的设计技术包括为易受损元件提供冗余,同时意识到每个元件的可靠性都与整体可靠性密不可分。合适的话,可以利用硬件或软件把监察与控制功能加入元件设计中,为元件提供周全的应力保护。
灵巧的工程设计还会考虑到终端应用环境的设计决定。比方说,一枚导d与一台洗衣机的设计需求显然有着天壤之别。导d要在短时间内发挥强大的性能;相反,洗衣机却需要针对数以百计的运行周期提供最完美的耐久性。两者的需求在根本上截然不同。
可靠性的增长
图4
如图4所示,每个产品寿命周期都包含不同阶段的转变,由原型到开发,再由开发到生产,过程中的可靠性会不断增长。换句话说,每项设计在其寿命周期中,可靠性都会增加,而成本则会下降。这反映了可靠性的增长不单是设计工程师的责任而已。
事实上,随着可靠性在价值生态系统中的角色日趋重要,不论是从事技术、管理、物流或面向客户的人员,都有责任让可靠性持续增长 (图5)。
图5
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)