【導讀】如今,數(shù)據處理架構呈現(xiàn)出一種“分裂”的特性。擁有龐大規(guī)模和計算能力的“云”計算成為了關注焦點,而“邊緣”計算將處理過程置于“一線”,連接著電子設備與真實世界。在云端,數(shù)據存儲量巨大,處理過程需要排隊和調度;而在邊緣,處理工作則有針對性地即時完成。
如今,數(shù)據處理架構呈現(xiàn)出一種“分裂”的特性。擁有龐大規(guī)模和計算能力的“云”計算成為了關注焦點,而“邊緣”計算將處理過程置于“一線”,連接著電子設備與真實世界。在云端,數(shù)據存儲量巨大,處理過程需要排隊和調度;而在邊緣,處理工作則有針對性地即時完成。
這使得系統(tǒng)能夠針對本地指令和應用程序反饋做出快速響應,同時減少數(shù)據流量,以確保處理過程更加安全。當然,這兩個區(qū)域也會進行交互,邊緣節(jié)點將數(shù)據傳回云端,實現(xiàn)跨設備或地點的匯總與分析;而全局指令和固件更新則反向傳遞至邊緣。
這兩種處理環(huán)境都得益于人工智能(AI)和機器學習(ML)的最新發(fā)展。例如,在數(shù)據中心,包含數(shù)萬顆處理器(主要為GPU)的數(shù)千臺服務器執(zhí)行大規(guī)模并行計算,以生成和運行ChatGPT等大語言模型(LLM)。從某些指標看,這些平臺的性能現(xiàn)在已經超越了人類。
在邊緣,處理過程根據操作算法對反饋傳感器和指令做出反應。但借助機器學習,算法現(xiàn)也能夠有效地從反饋中學習;由此改進算法及其計算系數(shù),讓受控過程更為準確、高效和安全。
云端和邊緣的能耗差異
在能源的使用規(guī)模層面,云計算和邊緣計算存在很大的實際差異。這兩種情況的能耗都必須降至最低;但數(shù)據中心的電力消耗十分巨大,據國際能源機構(IEA)估計,約為240-340太瓦時(TWh),占全球需求的1%-1.3%。人工智能和機器學習將進一步加速能源消耗;IEA預測在未來幾年內將增長20%-40%,而這一數(shù)字的歷史數(shù)據僅為3%左右。
與游戲和視頻流媒體等按需數(shù)據處理任務不同,AI包含學習和推理兩個階段;其中,學習階段借助數(shù)據集來訓練模型。據報道,ChatGPT在這個過程中消耗了超過1.2TWh的電力。另一方面,根據de Vries的統(tǒng)計,處于推理或運行階段的LLM每天可能需要消耗564MWh的電力。
而在數(shù)據處理架構的另一端,物聯(lián)網(IoT)節(jié)點或可穿戴設備中的邊緣計算功耗可能不超過毫瓦級。即使對于電機控制和電池管理等工業(yè)及電動汽車(EV)類應用,為控制電路預留的損耗預算也很小,無法適應AI和機器學習引入帶來的大幅能耗提升。
因此,微型機器學習(tinyML)已發(fā)展為一個在設備上實施傳感器數(shù)據分析的應用及技術領域;同時,其也經過優(yōu)化,旨在實現(xiàn)極低功耗。
tinyML和電源管理
在具體應用中采用機器學習技術是一個涉及到多個維度的問題。舉例來說,tinyML可用于電池管理,其目標是在盡可能快速、安全并高效充電的同時,以最小的壓力控制放電。電池管理還會監(jiān)控電池的健康狀況,并主動平衡電芯以確保其均衡老化,從而獲得最高的可靠性和使用壽命。
受監(jiān)控的參數(shù)包括單個電芯的電壓、電流和溫度;管理系統(tǒng)通常需要預測電池的充電狀態(tài)(SOC)和健康狀況(SOH)。這些參數(shù)均為動態(tài)量,與電池的使用歷史及測量參數(shù)間存在復雜且多變的關系。
盡管任務復雜,但實現(xiàn)AI處理并不需要使用昂貴的GPU。ARM Cortex M0和M4系列等現(xiàn)代微控制器可輕松勝任電池管理中的機器學習任務,且它們的功耗很低,現(xiàn)已集成至針對該應用的專用片上系統(tǒng)(SoC)中。
電池管理IC十分常見,但在實施機器學習算法的MCU助力下,基于傳感器的歷史和當前數(shù)據的信息與模式可用于更好地預測SOC及SOH,同時確保高度安全性。與其它ML應用一樣,這需要一個基于訓練數(shù)據的學習階段;數(shù)據可以來自包含不同環(huán)境條件和多個電池制造公差的日志記錄;在缺少現(xiàn)場實際數(shù)據的情況下,也可以利用建模得到的合成數(shù)據。
正如AI的本質一樣,模型可隨現(xiàn)場數(shù)據的積累不斷更新,以擴大或縮小應用規(guī)模,或用于其它類似系統(tǒng)。雖然學習過程通常是應用投入使用前的一項工作,但也可以成為基于傳感器數(shù)據的后臺任務,在本地或通過云端進行離線處理,以獲得持續(xù)的性能改進。自動機器學習(AutoML)工具結合電池管理SoC的評估套件可實現(xiàn)這一功能。
機器學習模型
在機器學習和電池管理等邊緣應用領域中,有多種可供選擇的模型。一個簡單的分類決策樹所占用資源很少,最多僅需幾千字節(jié)的RAM,但能夠為此類應用提供足夠的功能。該方法可將采集到的數(shù)據簡單地分為“正?!被颉爱惓!?;示例如圖1所示。
圖1:在此決策樹分類器示例中,“類別1” = 正常,“類別0” = 異常
此處使用兩個參數(shù)來描述多電芯電池組放電過程中的狀態(tài):最強電芯的SOC(充電狀態(tài)),以及最強與最弱電芯間的電壓差。藍色和白色節(jié)點代表正常數(shù)據;分類區(qū)域用藍色(“類別0”= 正常)和灰色(“類別1”= 異常)表示。
如要評估輸出數(shù)據的連續(xù)值,而不僅僅是類別,可以使用更復雜的回歸決策樹。其它常見的ML模型包括支持向量機(SVM)、核近似分類器、近鄰分類器、樸素貝葉斯分類器、邏輯回歸和孤立森林。神經網絡建模可以包含在AutoML工具中,以增加復雜度為代價來提高性能。
一個ML應用程序的整個開發(fā)過程被稱為“MLOps”,即“ML Operations”,包括數(shù)據的收集與整理,以及模型的訓練、分析、部署和監(jiān)控。圖2以圖形方式展示了使用PAC25140芯片的電池管理應用開發(fā)流程;該芯片可監(jiān)控、控制和平衡由多達20個電芯組成的串聯(lián)電池組,適用于鋰離子、鋰聚合物或磷酸鐵鋰電池。
圖2:上述設計示例突出展示了tinyML開發(fā)流程
案例研究:弱電芯檢測
退化電芯檢測是電池SOH監(jiān)測的一部分。這些電芯的特征之一可能體現(xiàn)為在負載下電池電壓異常偏低。然而,電壓還受實際放電電流、充電狀態(tài)和溫度的影響,如圖3所示;圖中突出顯示了強弱電芯在不同溫度及負載電流下的示例曲線。
圖3:強、弱電芯的放電曲線
圖3顯示了在電芯電量接近耗盡時,強弱電芯電壓間出現(xiàn)的顯著差異;然而,在此時檢測到弱電芯可能為時已晚,無法避免過熱和安全問題。因此,實施ML成為一種解決方案,從而在放電周期的較早階段從數(shù)據中尋找相關模式。
ML方法的有效性在Qorvo進行的實驗中得到充分體現(xiàn)。該實驗將一顆弱電芯插入一個由10顆電芯組成的電池組,并與一個狀態(tài)良好的電池組進行比較。兩組電芯在不同恒定電流倍率和溫度下放電,并生成訓練數(shù)據;監(jiān)測參數(shù)包括它們的電流、溫度、最強與最弱電芯電壓差,以及最強電芯的SOC。
在20個放電周期中,每10秒對參數(shù)進行同步采樣,并使用表1所列的不同模型進行分析。將結果與20個放電周期的獨立測試數(shù)據進行比較,顯示兩種方法的一致性非常接近;隨著訓練樣本的增加,其一致性將進一步提高。
圖4:從不同ML模型的訓練及測試數(shù)據中提取示例結果
SoC足以實現(xiàn)對ML的支持
雖然當前AI的關注焦點集中在大規(guī)模、高功率應用;然而,針對電池監(jiān)測等應用,使用MCU和tinyML技術 的“邊緣部署型”AI也可以成為高性能、低功耗解決方案的一部分。在這種場景下,SoC解決方案擁有所需的全部處理能力,并可集成各種機器學習算法。
所有必要的傳感器和通信接口均已內置;此外,SoC還擁有豐富的評估與設計工具生態(tài)系統(tǒng)的支持。
(來源:Qorvo半導體,作者:Paul Gorday,Qorvo DSP和機器學習技術總監(jiān))
免責聲明:本文為轉載文章,轉載此文目的在于傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯(lián)系小編進行處理。
推薦閱讀:
意法半導體公布2023年第四季度及全年財報和電話會議時間安排
百家跨國公司看中國丨意法半導體曹志平:持續(xù)完善在華產業(yè)鏈部署