- 宇宙射線對(duì)汽車(chē)電子系統(tǒng)的損傷分析
- 探討太空射線引發(fā)電子系統(tǒng)的故障
- 采用具有SRAM FPGA的汽車(chē)系統(tǒng)
設(shè)想一下:如果你驅(qū)車(chē)以每小時(shí)75英里的速度在高速公路上疾馳,一邊駕駛著2006才購(gòu)買(mǎi)的新車(chē),一邊欣賞著Steve Miller的Greatest Hits樂(lè)曲。突然間,引擎管理系統(tǒng)或穩(wěn)定控制系統(tǒng)失效。如果出現(xiàn)這一幕,您不僅僅可能會(huì)遭遇嚴(yán)重或可能是致命的車(chē)禍,而且車(chē)廠也可能被毀譽(yù)一旦,假設(shè)類(lèi)似情況不止你一個(gè)的話。
隨著汽車(chē)從純機(jī)械設(shè)備向現(xiàn)代高度集成的線控駕駛汽車(chē)電子系統(tǒng)發(fā)展,設(shè)計(jì)工程現(xiàn)在面臨越來(lái)越多的挑戰(zhàn)。它們必須持續(xù)把復(fù)雜的電子設(shè)備添加到每一個(gè)后續(xù)車(chē)型年,與此同時(shí),仍然要維持高標(biāo)準(zhǔn)的品質(zhì)和可靠性,并滿足嚴(yán)格的低成本和大批量生產(chǎn)的要求。
傳統(tǒng)上,這些開(kāi)發(fā)商一直采用微控制器(MCU)、ASIC和碩大的線束來(lái)實(shí)現(xiàn)和控制這些系統(tǒng)并擴(kuò)展每一代汽車(chē)的性能。目前,這些技術(shù)已經(jīng)逼近了它們的極限,并因復(fù)雜性呈指數(shù)增長(zhǎng)而引發(fā)了對(duì)可靠性問(wèn)題的關(guān)注。為了解決這些問(wèn)題,許多設(shè)計(jì)工程師正在轉(zhuǎn)向采用FPGA作為下一代汽車(chē)電子設(shè)計(jì)的靈活和低成本的解決方案。
太空射線引發(fā)的故障
為了確?,F(xiàn)代汽車(chē)中各種系統(tǒng)的功能運(yùn)轉(zhuǎn)正常,必須對(duì)元器件提出可靠性數(shù)據(jù)的要求。雖然人們掌握元器件可靠性的大部分原理,但是,在選擇可編程邏輯器件如FPGA的過(guò)程中,要把一些獨(dú)特的問(wèn)題納入應(yīng)該考慮的因素。
明確地說(shuō),技術(shù)決策人要預(yù)見(jiàn)到將影響可編程邏輯系統(tǒng)的故障源。雖然來(lái)自太空(宇宙射線)的中子轟擊的概念聽(tīng)起來(lái)就像蹦出Star Trek的插曲,中子導(dǎo)致的錯(cuò)誤現(xiàn)實(shí)上對(duì)許多類(lèi)型的電子設(shè)備都有危害。
中子導(dǎo)致的固件錯(cuò)誤(firm error)已經(jīng)從一件麻煩事變?yōu)橹卮髥?wèn)題。例如,如果中子導(dǎo)致基于SRAM(基于靜態(tài))的FPGA的(以下簡(jiǎn)稱(chēng):SRAM FPGA)配置單元被擾亂,就可能導(dǎo)致功能喪失。如果出現(xiàn)這種情況,它就可能造成主系統(tǒng)失常。展望未來(lái),這種問(wèn)題將更為嚴(yán)重,因?yàn)閷?lái)的深亞微米制造工藝將持續(xù)為基于FPGA的汽車(chē)電子系統(tǒng)的設(shè)計(jì)工程師帶來(lái)實(shí)實(shí)在在的挑戰(zhàn)。
在集成電路內(nèi)部由中子造成的單事件擾亂(SEU)可能在各種類(lèi)型非易失性存儲(chǔ)單元中都會(huì)出現(xiàn)。上述SRAM FPGA采用內(nèi)部存儲(chǔ)單元來(lái)保持FPGA的配置狀態(tài)或(個(gè)性)。這些存儲(chǔ)器單元面對(duì)更為嚴(yán)重的可靠性威脅。當(dāng)內(nèi)容被改變的時(shí)候,它被稱(chēng)為“軟錯(cuò)誤”,因?yàn)槭菙?shù)據(jù)錯(cuò)誤,而功能不受影響。雖然該器件可以采用校正數(shù)據(jù)成功地重新寫(xiě)入,對(duì)SRAM數(shù)據(jù)和寄存器可以分別采用EDAC(錯(cuò)誤檢測(cè)和校正)或TMR(隧道磁阻)。軟錯(cuò)誤可能導(dǎo)致數(shù)據(jù)丟失或“系統(tǒng)出現(xiàn)意外故障”。
如果SRAM FPGA配置存儲(chǔ)器單元受到破壞,那就稱(chēng)為“固件錯(cuò)誤”,因?yàn)檫@些錯(cuò)誤不易檢測(cè)或校正并且本質(zhì)上不是瞬時(shí)現(xiàn)象。一旦在FPGA中出現(xiàn)固件錯(cuò)誤,必須采用初始配置對(duì)該器件進(jìn)行重新載入。在一些情況下,必須重新上電以清除故障,然后,重新配置。
這些配置單元中,只要有一個(gè)遭遇中子導(dǎo)致的SEU,后果都是嚴(yán)重的。如果配置為被擾亂并改變狀態(tài),它可能會(huì)改變整個(gè)器件的功能,導(dǎo)致重大數(shù)據(jù)崩潰或向系統(tǒng)中的其它電路發(fā)送虛假的信號(hào)。在極端情況下,如果固件錯(cuò)誤長(zhǎng)期未被檢測(cè)到其存在,那么,就能變成“硬故障(hard errors)”并對(duì)器件本身或包含該器件的系統(tǒng)造成破壞。這類(lèi)問(wèn)題的常見(jiàn)例子是:中子導(dǎo)致的穩(wěn)故障把信號(hào)導(dǎo)向錯(cuò)誤的路徑,從而造成短路。
對(duì)于采用SRAM FPGA的、執(zhí)行重要任務(wù)的汽車(chē)電子應(yīng)用系統(tǒng),中子導(dǎo)致的錯(cuò)誤有著重要的影響?,F(xiàn)有的檢測(cè)技術(shù),每隔一定間隔讀回FPGA的配置,對(duì)防止系統(tǒng)內(nèi)的錯(cuò)誤毫無(wú)幫助。
此外,能夠檢測(cè)受破壞配置的讀回電路本身就易于遭受SEU或破壞。進(jìn)一步說(shuō),在檢查汽車(chē)系統(tǒng)抗中子導(dǎo)致的錯(cuò)誤中,隨著易受影響的FPGA技術(shù)的廣泛應(yīng)用,人們要求把創(chuàng)新的質(zhì)量認(rèn)證體系添加到AEC-Q100標(biāo)準(zhǔn)之中,以補(bǔ)充JEDEC標(biāo)準(zhǔn) 89的不足。當(dāng)前檢測(cè)和校正FPGA固件錯(cuò)誤的方案增加了系統(tǒng)設(shè)計(jì)的額外復(fù)雜性,并增加了電路板的大小和物料的成本,從而增加了發(fā)現(xiàn)中子導(dǎo)致的錯(cuò)誤的“成本”。
中子導(dǎo)致的固件錯(cuò)誤可能對(duì)整個(gè)系統(tǒng)按時(shí)間計(jì)算的故障(FIT)率影響很大。由于難以檢測(cè)和幾乎不可能診斷,軟和穩(wěn)故障可能引發(fā)維護(hù)和服務(wù)問(wèn)題,從而有可能造成擔(dān)保費(fèi)用攀升。在三種主流FPGA技術(shù)—反熔絲、閃存和SRAM—之中,只有反熔絲和閃存免受抗中子導(dǎo)致的軟錯(cuò)誤和固件錯(cuò)誤的影響。
[page]
實(shí)例:具有SRAM FPGA的汽車(chē)系統(tǒng)
本例分析一個(gè)安裝在駕駛室內(nèi)地板中的系統(tǒng)。中子射線密度以Denver計(jì)算,元素鈷放置在5000英尺的高處,用SpaceRad 4.5(一種廣泛應(yīng)用的輻射效應(yīng)預(yù)測(cè)軟件程序)工具測(cè)量。根據(jù)已出版的關(guān)于0.22um SRAM FPGA的輻射數(shù)據(jù),每天每1百萬(wàn)門(mén)FPGA的預(yù)測(cè)擾亂率為1.05E-4。
如果供應(yīng)商在乘員傳感器和氣袋控制模塊中部署1百萬(wàn)門(mén)SRAM FPGA,把每天每1百萬(wàn)門(mén)器件為1.054E-4的擾亂率乘以每天每系統(tǒng)為模擬4.38E-06的擾亂率或4375FIT。這意味著,如果同一供應(yīng)商在50萬(wàn)輛車(chē)中采用基于1百萬(wàn)門(mén)SRAM FPGA的安全系統(tǒng),把擾亂數(shù)1.05E-4乘以路上的車(chē)輛/系統(tǒng)的數(shù)量,就得到所有車(chē)輛每天有52.5的總擾亂數(shù)(假設(shè)車(chē)輛做恒速工作)。
這就相當(dāng)于每27.4分鐘出現(xiàn)一次擾亂。即使對(duì)于每天兩小時(shí)的中等車(chē)輛使用率,仍然有每天兩次擾亂。因?yàn)檫@些都是穩(wěn)故障,它們都將持續(xù)下去,直到SRAM FPGA被二次加載(通常要重新上電或強(qiáng)迫配置)。
在目前的半導(dǎo)體技術(shù)中,器件中的軟錯(cuò)誤已經(jīng)受到高度關(guān)注。隨著器件尺寸持續(xù)縮小,人們廣泛認(rèn)為這些軟錯(cuò)誤將成為主要問(wèn)題。這些錯(cuò)誤可能常常極大地降低系統(tǒng)的可用性。為了把系統(tǒng)的可用性維持在可以接受的水平,人們強(qiáng)烈要求避免出現(xiàn)軟錯(cuò)誤。
未來(lái)要做的工作
當(dāng)選擇FPGA的時(shí)候,至關(guān)重要的是評(píng)價(jià)每一種可編程架構(gòu)所有權(quán)的總成本,并識(shí)別具有本質(zhì)上可靠的內(nèi)核技術(shù)的供應(yīng)商,不要采用為低檔次要求應(yīng)用而設(shè)計(jì)的二等品質(zhì)的商用產(chǎn)品。
對(duì)于采用SRAM FPGA的設(shè)計(jì)工程師來(lái)說(shuō),有必要實(shí)現(xiàn)檢測(cè)和校正配置錯(cuò)誤的電路,盡管這會(huì)增加系統(tǒng)成本和復(fù)雜性。此外,輻射測(cè)試數(shù)據(jù)表明,反融絲和基于閃存的FPGA不易于出現(xiàn)因中子導(dǎo)致的擾亂而造成的配置丟失。這使它們特別適用于可靠性要求高的應(yīng)用。
現(xiàn)在,想象以下稍微不同的外景:你以每小時(shí)75英里的速度駕駛著新的2006車(chē)型在高速公路奔馳,耳畔聆聽(tīng)著優(yōu)美的Steve Miller的Greatest Hits樂(lè)曲。由于對(duì)引擎管理系統(tǒng)中采用的基于非易失性閃存的FPGA充滿信心,你推桿加速狂飆,體驗(yàn)著極速帶來(lái)的快樂(lè),享受著舒適和無(wú)故障的旅行。