【導讀】數(shù)據(jù)手冊是元器件、模塊或系統(tǒng)性能的全面的、經(jīng)測試和經(jīng)驗證信息的完美信息庫。在電源單元(PSU)的情況下,數(shù)據(jù)手冊為工程師提供了大量的性能參數(shù)。所提供的信息的數(shù)量和詳細程度為用戶在任何給定應用中實現(xiàn)預期性能提供了極大的信心。但另一個重要的性能參數(shù)--電源可靠性又如何呢?
事實上,當今的知名制造商提供的電源單元(PSU)具有極長的壽命。其壽命在由可靠性標準(如MIL-HDBK-217或Telcordia)規(guī)定的測試條件下進行了精確預測。更重要的是,經(jīng)驗表明,除了這些嚴格定義的參數(shù)之外,高質(zhì)量的電源單元PSU也提供超長壽命。
但是,系統(tǒng)設計人員仍然面臨一個問題:在這些測試條件以外的條件下操作時,他們?nèi)绾巫孕诺仡A測電源單元(PSU)的平均壽命?各種各樣常見因素可能打破這些條件,如:熱、沖擊和振動、電源電壓的瞬態(tài)波動、電解電容的老化等都可能引起過早失效。因此,數(shù)據(jù)手冊的標準壽命額定值很少完全適用于真實世界的產(chǎn)品。
同時,無法控制最終產(chǎn)品的可靠性是難以接受的。品牌的聲譽是一筆寶貴的財富。處置和維修的環(huán)境和費用成本也是一種浪費。
那么,系統(tǒng)設計工程師怎樣才能自信地預估商用現(xiàn)貨(COTS)電源單元的可靠性?而且,最大限度地提高信心水平的最有效的方法是什么?
制造商的可靠性數(shù)據(jù)的限制
最常用的表征一個新的COTS PSU的壽命的值是故障前平均時間(MTTF)或平均故障間隔時間(MTBF)值。故障前平均時間(MTTF)在恒定工作(環(huán)境)溫度下通常為數(shù)千小時。
當然,故障前平均時間(MTTF)并沒有給出從大量單元中隨機抽取的任何單個單元的失效時間:MTTF是一個平均值。有的單元的壽命比額定MTTF值更長,有的則會更早失效。事實上,假定一個恒定的故障率在電子設備的操作條件下是不切實際的假設,單個單元的壽命能夠持續(xù)到MTTF值的概率只有37%。換句話說,故障前平均時間(MTTF)經(jīng)過69%后,半數(shù)的單元將失效,如圖1所示。
這是因為,具有恒定故障率的故障由一個指數(shù)因子表征,如以下等式所示,用于計算元器件在給定時間后沒有發(fā)生故障的可能性:R(t) = e-λt
其中:λ = 元器件的平均故障率
PSU制造商采用基于高度加速測試的模型以預測其產(chǎn)品的故障率。他們不能在正常操作條件下運行PSU的測試,并等待觀察故障,因為需要許多年的時間來收集統(tǒng)計顯著性數(shù)據(jù)。因此,他們將其產(chǎn)品暴露于過高的溫度、振動、電流和電壓應力下,以便使它們迅速失效。
顯然,需要一種合理的方法將加速測試的結(jié)果轉(zhuǎn)換成數(shù)據(jù)手冊中的MTTF值;有信譽的PSU制造商應認真核實并完善自己的方法,以確保其能反映用戶的真實世界體驗。
因此,到目前為止,我們也許可以信任由值得信賴的制造商指定的數(shù)據(jù)手冊中的MTTF值。但由于它僅適用于很窄的工作條件,當在一系列競爭產(chǎn)品中進行選擇時,最好僅將它作為一個比較工具。換句話說,MTTF適用于指示在類似條件下經(jīng)過測試的不同PSU的相對壽命。
但是,任何給定應用中的MTTF真實值高度依賴于該應用的操作條件。溫度對壽命的影響最大,但壽命也受輸入和輸出電流和電壓的絕對水平、這些參數(shù)的變化率、機械應力以及其他因素的影響。
因此,盡管MTTF值是基于一系列的“典型”和恒定操作條件而計算的,但許多用戶的應用將在以下條件下運行:
·充滿變化
·與“典型”值不同
即使應用具有恒定的條件,這些條件也幾乎不可能與數(shù)據(jù)手冊的典型應用條件相同。
因此,當在任何給定的真實世界應用中估計故障率的時候,數(shù)據(jù)手冊中的故障率和可靠性信息僅能提供有限的效用。電源系統(tǒng)設計人員必須設計適應其終端產(chǎn)品的最大可接受的故障率。不管該目標故障率是幾乎為零(在任務關(guān)鍵型應用中)還是每10,000小時一次故障(在低成本消費產(chǎn)品的情況下),設計人員都必須具有高度信心,使現(xiàn)場的實際故障率至少達到最低目標。
如上所述,數(shù)據(jù)表中的MTTF不能提供如此高的信心水平,除非在規(guī)定的恒定操作條件下。那么,電源系統(tǒng)設計人員怎樣才能更自信地預測真實世界的故障率?答案是,部分是藝術(shù),部分是科學。
科學是指有信譽的PSU供應商提供的附加數(shù)據(jù)集。例如,村田電源、Vicor和CUI等制造商都提供現(xiàn)場數(shù)據(jù):聲明返廠進行維修或更換的PSU故障率觀察值。該聲明基于對每個失效單元的檢查,并提供故障原因分析。
該聲明可以幫助PSU的特定型號的潛在用戶:
通過審查它與現(xiàn)場故障率觀察值之間的相關(guān)性來驗證 MTTF的計算,如圖2所示
確定可能引起大多數(shù)故障的特定操作條件、應力或元器件
PSU的壽命有三個階段:“早期故障率”在第一階段很高,持續(xù)時間約24小時。裝運前預燒可避免這些“早期故障率”故障
有信譽的制造商還提供了設計工程師可以學習的如何優(yōu)化其PSU方案的詳細的應用筆記。例如,SL Power等供應商的應用筆記提供了有關(guān)熱和機械設計的有用指導,并體現(xiàn)了其設計優(yōu)化過程的細節(jié)深度。遵循制造商的指南將有助于最大限度延長PSU的使用壽命。
第二個附加數(shù)據(jù)點可以根據(jù)請求提供給用戶,例如,Vicor電源:專為用戶應用的典型操作條件而定制的應用專用的MTTF額定值。即使考慮到加速測試方法所固有的不確定性,以及用戶自己的應用操作條件的不確定性,與基于典型工作條件的標準MTTF值相比,該定制MTTF值仍然提供了對用戶應用中的各種Vicor PSU的更可靠的平均故障率預估。
每個有信譽的PSU制造商可提供的第三個數(shù)據(jù)點是熱圖,它顯示了該電源單元的安全操作曲線,以及它如何受到應用中的改變(如增加一個冷卻氣流)的影響。
但是,即使加上這些數(shù)據(jù),也無法保證可以在任何給定應用中絕對確定地計算平均故障率:變量的數(shù)量影響PSU的工作,制造商測試方法固有的不確定性也太大。事實上,隨機真實世界事件所固有的不確定性的性質(zhì)已經(jīng)對一些最偉大的科學家提出了挑戰(zhàn):據(jù)說,Alan Turing這樣對同事描述過這個問題:
“在一個城鎮(zhèn)中,你如何通過看到的隨機車牌最好地估計整個城鎮(zhèn)的出租車數(shù)量?”
那么,科學只提供了部分答案;電源系統(tǒng)設計人員還必須運用工程師的藝術(shù)。經(jīng)驗為設計人員提供了對于每個制造商的數(shù)據(jù)的可靠性直覺。通過檢查自己產(chǎn)品的現(xiàn)場故障,OEM設計人員可以建立實際故障率的圖像、故障的原因,并與他們僅基于制造商的數(shù)據(jù)所形成的期望做比較??此鼈兪欠裼忻芮械南嚓P(guān)性,或?qū)嶋H上性能更好還是更差?以及與預期性能有多大差距?
工程師對這些問題的直覺有助于加強其通過測量和統(tǒng)計計算結(jié)果來預估故障率的信心。
有信心地預測
當數(shù)據(jù)手冊描述了PSU的可靠性或不可靠信息時,它具有明顯的數(shù)學確定性。但是,這些數(shù)據(jù)本身在任何給定應用中預測MTTF時僅提供了有限的信心。
但當設計工程師選擇的PSU來自一家已知的、有信譽的制造商,或者當他們對制造商的數(shù)據(jù)有自己的經(jīng)驗,或受信任的第三方(如電源分銷商)的經(jīng)驗時,他們可以對其壽命性能有更高的信心??傊@些產(chǎn)品已經(jīng)積累了多年的知識經(jīng)驗,但令人驚訝的是,并非所有經(jīng)驗的獲得都需要很高的代價。
換句話說,幫助工程師對PSU的使用壽命做出良好判斷的不是單純的藝術(shù),也不是單純的科學,而是藝術(shù)與科學的結(jié)合。