什么是MTBF?MTBF是什么意思?

什么是MTBF?MTBF是什么意思?,第1张

MTBF的意思是平均故障间隔时间。

MTBF,即平均故障间隔时间,英文全称是Mean Time Between Failure。是衡量一个产品的可靠性指标。单位为小时

它反映了产品的时间质量,是体现产品在规定时间内保持功能的一种能力。具体来说,是指相邻两次故障之间的平均工作时间,也称为平均故障间隔。

扩展资料:

随着服务器的广泛应用,对服务器的可靠性提出了更高的要求。所谓可靠性,就是产品在规定条件下和规定时间内完成规定功能的能力。

反之,产品或其一部分不能或将不能完成规定的功能是出故障。故障率常用λ表示,例如正在运行中的100只硬盘,一年之内出了2次故障,则每个硬盘的故障率为0.02次/年。

当产品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间假设一款可用于服务器的WD Caviar RE2 7200 RPM 硬盘,MTBF 高达 120万小时,保修 5年。

120万小时约为137年,并不是说该种硬盘每只均能工作137年不出故障。由MTBF=1/λ可知λ=1/MTBF=1/137年,即该硬盘的平均年故障率约为0.7%,一年内,平均1000只硬盘有7只会出故障。

参考资料来源:百度百科—MTBF

具体来说,是指相邻两次故障之间的平均工作时间,也称为平均故障间隔。它仅适用于可维修产品。同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。

通常,我们在产品的手册或包装上能够看到这个MTBF值,如8000小时,2万小时,那么,

MTBF的数值是怎样算出来的呢,假设一台电脑的MTBF为3万小时,是不是把这台电脑连续运行3万小时检测出来的呢?答案是否定的,如果是那样的话,我们有那么多产品要用几十年都检测不完的。其实,关于MTBF值的计算方法,目前最通用的权威性标准是MIL-HDBK-217、GJB/Z299B和Bellcore,分别用于军工产品和民用产品。其中,MIL-HDBK-217是由美国国防部可靠性分析中心及Rome实验室提出并成为行业标准,专门用于军工产品MTBF值计算,GJB/Z 299B是我国军用标准;而Bellcore是由AT&T Bell 实验室提出并成为商用电子产品MTBF值计算的行业标准。

就MBTF本身而言,是关系着广大消费者的稳定性指数。MTBF值越高,表示PC的稳定性越好。其实,国家为了保护广大消费者的权益,规定PC产品的MTBF要达到一定的水平,中国对MTBF平均无故障工作时间的规定是4000小时。从正规的角度讲,4000小时是一个比较合理的数值,它也是消费者可以感知到的数值。

假设一台电脑的MTBF为3万小时,是不是把这台电脑连续运行3万小时检测出来的呢?当然不是,否则有那么多产品要用几十年都检测不完。MTBF值的计算方法,目前最通用的权威性标准是MIL-HDBK-217(美国国防部可靠性分析中心及Rome实验室提出并成为行业标准,专门用于军工产品)、GJB/Z299B(中国军用标准)和Bellcore(AT&T Bell 实验室提出并成为民用产品MTBF的行业标准)。

MTBF计算中主要考虑的是产品中每个元器件的失效率。但由于器件在不同的环境、不同的使用条件下其失效率会有很大的区别,所以在计算可靠性指标时,必须考虑这些因素。而这些因素几乎无法通过人工进行计算,但借助于软件如MTBFcal和其庞大的参数库,就能够轻松地得出MTBF值。

每天工作三班的工厂如果要求24小时连续运转、无故障率P(t)=99%以上,则机床的MTBF必须大于4500小时。MTBF5000小时对由不同数量的数控机床构成的生产线要求就更高、更复杂了,我们这里只讨论单台机床:

如果主机与数控系统的失效率之比为10:1(数控系统的可靠性要比主机高一个数量级),数控系统的MTBF就要大于5万小时,而其中的数控装置、主轴及驱动部分等主要部分的MTBF就必须大于10万小时。

当然了,也不是MTBF值越高越好,可靠性越高机床成本也越高,根据实际需要选择适度可靠就行了。

MTBF并不是在实际运行中检测出来的,它是通过国家标准的检测算法换算出来的。例如,联想扬天的6万小时MTBF,是通过送检192台联想扬天电脑,在为期40天的实验周期内,以特定的频率,对受试产品施加电压、温度、湿度交变等综合的环境应力,根据电子产品可靠性与时间特性的对应关系,将实验结果采用标准的数据模型换算出来。同样,同方超越E350的10万小时MTBF则是由400台电脑,通过18天的检测结果换算出来的。

要知道,当PC的MTBF值达到了1万小时以上时,其电脑的稳定性已经相当不错了。正是因为如此,HP、DELL等国际PC厂商都没有过分强调MTBF值,都没有把MTBF值突破几万小时作为产品稳定的标准。

“MTBF是PC稳定性的重要标准,但当超过一定数值后,它就没有特别意义,但别的厂商都在炒,我们也不能不跟啊!”某业内人士如此坦白。

可用能力计算方法是:TBF/(MTBF+MTTR), 其值越高,代表可用性越高。因为TBF 越高说明出现故障的次数越少;另一个指标是 MTTR,表示平均恢复时间,MTTR 越小说明故障恢复时间越短,系统受影响时长越短。

MTBF 和 MTTR:MTBF(全称是Mean Time Between Failures,即平均故障间隔),是指系统在运行期间的平均连续无故障时间,提升 MTBF 就意味着减少故障出现的次数,加大系统正常运行的服务时长。

MTTR(全称是Mean Time To Recovery,也就是平均修复时间),是指系统有故障状态转为正常运行状态所需修复时间的平均值。降低 MTTR 就意味着加速故障恢复的速度,例如故障在秒级恢复。

如何提升 MTBF:

1、规范上线 *** 作流程:开发环境、测试环境及生产环境要严格区分开,禁止混合部署,禁止未经测试的功能或任意变更直接上线生产。

2、严格审核线上变更 *** 作:数据库线上变更 *** 作需要指定审核及执行流程。建议流程是开发(DEV)提交变更申请,开发 Leader 或质量管控(QA)负责审核变更,由运维人员或 DBA 进行二次变更审核及执行 *** 作。

数据库变更执行需要全自动化,而且在 *** 作前必须备份,当出现问题时能够快速回滚。 同时应收集线上变更的所有信息,方便审计。

3、合理参数优化:数据库相关参数必须严格测试,明确知晓参数的利弊情况。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/9989652.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-04
下一篇 2023-05-04

发表评论

登录后才能评论

评论列表(0条)

保存