半导体的重要性就不细说了,大家可以想象到的日常生活中的所有电子产品都有使用到半导体器件。
其中,我们对这些产品最关心的一个共性指标就是:这货到底能用多久?
这个问题我们能否让用户帮我们检验?当然不能,除非是一锤子买卖。
为了产品在市场上不尴尬,就得从产品的可靠性说起了。也就是需要做芯片制造中三大测试之一的可靠性测试。
那什么是可靠性?引用某个规范中的一段话来说:
“可靠性”是一个含义广泛的概念,以塑封芯片为例,狭义的“可靠性”一般芯片级可靠性,包括电路相关的可靠性(ESD、Latch-up、HTOL)和封装相关的可靠性(PC、TCT、HTSL、HAST等)。但是芯片在应用场景中往往不是“独立作战”,而是以产品方案(PCB板上的一个元器件)作为最终应用。
因此,可靠性分为芯片级可靠性和产品级可靠性。
在其评价标准上,我们通常用 MTBF(Mean Time Between Failures,平均无故障工作时间)和 MTTF(Mean Time To Failure,平均失效时间)来衡量产品的可靠性。
下面我们就来简单看看说说MTTF是咋算的?
对于一组不可修复的产品,假设我们有 N0 个产品,每个产品分别在Ti时刻失效,则 MTTF 的计算公式为:
- N0 是失效的产品数量;
- Ti 是第 i 个产品失效时所经历的时间。
举个栗子,假如有 5 个不可修复的产品,它们分别在 1000 小时、1500 小时、2000 小时、2200 小时和 2300 小时时失效,则MTTF可以通过上述公式计算得出。
这里细心的粉线朋友们可以注意到,我们强调了一个“不可修复的产品”,指的是某些分立器件或一次性使用的器件。而对于 IC 、存储设备、电源管理单元、芯片等, MTBF 更加常用。有兴趣的朋友可以留言说说 MTBF 咋算的。
就半导体芯片而言:它描述了一个芯片在其预期工作条件下能够连续运行而不发生故障的平均时间长度或故障概率。在业界,我们通常会用浴盆曲线模型来描述产品在整个生命周期内故障率的变化趋。当然这个模型也在其他行业的可靠性测试中广泛使用。
如上图所示,浴盆曲线模型由三个阶段组成:
- 早期失效期:初期由于制造缺陷等原因,故障率较高。这个阶段对应 MTTF ,即产品从出厂到首次失效的平均时间。
- 使用期:经过筛选后的合格产品在此期间,故障率相对较低且较为稳定。这个阶段的 MTBF 最为明显,因为它表示在这个时间段内两次连续故障之间的平均时间。
- 耗损期:随着时间和使用条件的影响,元件逐渐老化,故障率再次上升。此时的 MTTF 或 MTBF 同样适用,但主要是反映了设备接近其使用寿命终点的情况。
可以想象,上面这一浴盆泡下来,时间将非常非常地长。因此,我们就不得不想办法人为加速这一过程。搞一个类似时光机一样的东西:老化测试系统。老化测试正是为了模拟并加速进入耗损期的这一过程,以便提前发现潜在的可靠性问题。但要明白,老化测试是可靠性测试的一种具体形式,而并不是全部的可靠性测试。
无论是老化还是其他测试,对于产品的关键是发何发现早期的缺陷,也就是针对早期失效性的质量保证,如果产品刚上市就出现大量故障的产品,厂家离倒闭也就不远了。
再来举个案例:苹果 iPhone X 系列因老化测试不充分,引发性能问题,导致市场受损,这个不知道大家是否还有印象?
回到主题。老化这种测试,就需要充分且比正常环境更严格的测试,比如说施加高于正常工作条件的电压、电流或温度,促使芯片在较短时间内表现出可能在长时间使用后才会出现的故障现象。通过监测芯片在极端条件下的性能变化,工程师可以识别出潜在的失效模式和机制,例如热载流子效应、电迁移、机械应力老化等。
老化系统主要包括硬件设施,如老化炉、温控装置、电源模块、数据采集系统等,以及软件控制系统。在芯片老化测试中,测试方案有多种,如HTOL(High Temperature Operating Life Test,高温工作寿命测试),HAST( Highly Accelerated Stress Test,高度加速应力测试)或其它定制化老化方案。其中,认为最不可或缺的测试是HAST测试。
其中 HTOL 主要用于评估芯片的寿命和电路可靠性。在这个测试中,芯片会在高温环境下持续通电工作,通过监控芯片的各项电气参数,如漏电流、阈值电压的变化,来预测芯片在正常工作温度下的长期稳定性。
我在星球中放了一份华为海思“海思芯片 HTOL 老化测试技术规范和海思消费类芯片可靠性测试技术总体规范”,有兴趣的朋友可以下载看看。
用咱们一句比较通俗的话来说:老化,就是在最短的时间内,尽量的折腾产品,期望并检测产品的是否可靠,然后解决潜在问题。
关于可靠性和老化,咱们就先到这里了,感谢阅读,欢迎关注我们!