Kaustubh Gandhi,Bosch Sensortec軟件產(chǎn)品經(jīng)理
人工智能(AI)目前正在為社會(huì)的方方面面帶來(lái)革新。比如,通過(guò)結(jié)合數(shù)據(jù)挖掘和深度學(xué)習(xí)的優(yōu)勢(shì),如今可以利用人工智能來(lái)分析各種來(lái)源的大量數(shù)據(jù),識(shí)別各種模式、提供交互式理解和進(jìn)行智能預(yù)測(cè)。
這種創(chuàng)新發(fā)展的一個(gè)例子就是將人工智能應(yīng)用于由傳感器生成的數(shù)據(jù),尤其是通過(guò)智能手機(jī)和其他消費(fèi)者設(shè)備所收集的數(shù)據(jù)。運(yùn)動(dòng)傳感器數(shù)據(jù)以及其他信息比如GPS地址,可提供大量不同的數(shù)據(jù)集。因此,問(wèn)題在于:“如何使用人工智能才能充分發(fā)揮這些協(xié)同作用?”
運(yùn)動(dòng)數(shù)據(jù)分析
一個(gè)說(shuō)明性的的真實(shí)應(yīng)用程序?qū)⒖梢酝ㄟ^(guò)分析使用數(shù)據(jù)來(lái)確定用戶(hù)在每個(gè)時(shí)間段的活動(dòng),無(wú)論是在坐姿、走路、跑步或者睡眠情況下。
在這種情況下,智能產(chǎn)品的好處不言而喻:
1. 提高客戶(hù)生命周期價(jià)值
提高用戶(hù)參與度可以降低客戶(hù)流失率。
2. 更具競(jìng)爭(zhēng)力的產(chǎn)品定位
下一代智能產(chǎn)品滿足消費(fèi)者日益增長(zhǎng)的期待。
3. 為終端用戶(hù)創(chuàng)造真正的價(jià)值
對(duì)室內(nèi)運(yùn)動(dòng)的準(zhǔn)確檢測(cè)和分析可實(shí)現(xiàn)靈敏的導(dǎo)航功能、進(jìn)行健康風(fēng)險(xiǎn)監(jiān)控,同時(shí)提高設(shè)備的效率。 對(duì)多種智能手機(jī)和可穿戴平臺(tái)實(shí)際使用情景的深度掌握,將大大有助于產(chǎn)品設(shè)計(jì)師了解用戶(hù)的重復(fù)習(xí)慣和行為,例如確定正確的電池尺寸或確定推送通知的正確時(shí)機(jī)。
智能手機(jī)制造商對(duì)于人工智能功能的興趣正濃,這也正突出了識(shí)別簡(jiǎn)單日?;顒?dòng),如步數(shù)的重要性,這必將發(fā)展為更為深入的分析,例如體育活動(dòng)。對(duì)于像足球這樣的流行體育運(yùn)動(dòng),產(chǎn)品設(shè)計(jì)師不會(huì)只著眼于運(yùn)動(dòng)員,而是會(huì)為更多的人提供便利,比如教練、球迷甚至是廣播公司和運(yùn)動(dòng)服裝設(shè)計(jì)公司等大型公司。這些公司將從深層次的數(shù)據(jù)分析中獲益,從而可以準(zhǔn)確量化、提高和預(yù)測(cè)運(yùn)動(dòng)表現(xiàn)。
數(shù)據(jù)獲取和預(yù)處理
在識(shí)別這一商機(jī)之后,下一個(gè)合理的步驟就是思考如何有效收集這些巨大的數(shù)據(jù)集。
比如在活動(dòng)跟蹤方面,原始數(shù)據(jù)通過(guò)軸向運(yùn)動(dòng)傳感器得以收集,例如智能手機(jī)、可穿戴設(shè)備和其他便攜式設(shè)備中的加速度計(jì)和陀螺儀。這些設(shè)備以完全隱蔽的方式獲取三個(gè)坐標(biāo)軸(x、y、z)上的運(yùn)動(dòng)數(shù)據(jù),即以便于用戶(hù)應(yīng)用的方式連續(xù)跟蹤和評(píng)估活動(dòng)。
訓(xùn)練模型
對(duì)于人工智能的監(jiān)督式學(xué)習(xí),需要用標(biāo)記數(shù)據(jù)來(lái)訓(xùn)練“模型”,以便分類(lèi)引擎可以使用此模型對(duì)實(shí)際用戶(hù)行為進(jìn)行分類(lèi)。舉例來(lái)說(shuō),我們從正在進(jìn)行跑步或是走路的測(cè)試用戶(hù)那里收集運(yùn)動(dòng)數(shù)據(jù),并把這些信息提供給模型來(lái)幫助其學(xué)習(xí)。
由于這基本上是一種一次性方法,簡(jiǎn)單的應(yīng)用程序和照相系統(tǒng)就可以完成給用戶(hù)“貼標(biāo)簽”的任務(wù)。我們的經(jīng)驗(yàn)表明,隨著樣本數(shù)量的增加,在分類(lèi)上的人為錯(cuò)誤率隨之減少。因此,從有限數(shù)量的用戶(hù)那里獲取更多的樣本集比從大量用戶(hù)那里獲得較小的樣本集更有意義。
只獲取原始傳感器數(shù)據(jù)是不夠的。我們觀察到,要實(shí)現(xiàn)高度準(zhǔn)確的分類(lèi),需要仔細(xì)確定一些特征,即系統(tǒng)需要被告知對(duì)于區(qū)分各個(gè)序列重要的特征或者活動(dòng)。人工學(xué)習(xí)的過(guò)程具有反復(fù)性,在預(yù)處理階段,哪些特征最為重要還尚未明確。因此,設(shè)備必須要依據(jù)可能對(duì)分類(lèi)準(zhǔn)確性有影響的專(zhuān)業(yè)知識(shí)進(jìn)行一些猜測(cè)。
為了進(jìn)行活動(dòng)識(shí)別,指示性特征可以包括“濾波信號(hào)”,例如身體加速(來(lái)自傳感器的原始加速度數(shù)據(jù))或“導(dǎo)出信號(hào)”,例如高速傅里葉變換(FFT)值或標(biāo)準(zhǔn)差計(jì)算。
舉例來(lái)說(shuō),加州大學(xué)歐文分校的機(jī)器學(xué)習(xí)數(shù)據(jù)庫(kù)(UCI)創(chuàng)建了一個(gè)定義了561個(gè)特征的數(shù)據(jù)集,這個(gè)數(shù)據(jù)集以30名志愿者的六項(xiàng)基本活動(dòng),即站立、坐姿、臥姿、行走、下臺(tái)階和上臺(tái)階為基礎(chǔ)。
模式識(shí)別和分類(lèi)
收集了原始運(yùn)動(dòng)數(shù)據(jù)之后,我們需要應(yīng)用機(jī)器學(xué)習(xí)技術(shù)來(lái)將其分類(lèi)并進(jìn)行分析??晒┪覀兪褂玫臋C(jī)器學(xué)習(xí)技術(shù)從邏輯回歸到神經(jīng)網(wǎng)絡(luò)等不一而足。
支持向量機(jī)(SVMs)就是這樣一個(gè)應(yīng)用于人工智能的學(xué)習(xí)模型。身體活動(dòng),比如走路包括了由多種運(yùn)動(dòng)構(gòu)成的序列,由于支持向量機(jī)擅長(zhǎng)于序列分類(lèi),因此它是進(jìn)行活動(dòng)分類(lèi)的合理選擇。
支持向量機(jī)的使用、培訓(xùn)、擴(kuò)展和預(yù)測(cè)均十分簡(jiǎn)單,所以可以輕松地并列設(shè)置多個(gè)樣本采集實(shí)驗(yàn),以用于處理復(fù)雜的現(xiàn)實(shí)生活數(shù)據(jù)集的非線性分類(lèi)。支持向量機(jī)還可實(shí)現(xiàn)多種不同的尺寸和性能優(yōu)化。
確定一項(xiàng)技術(shù)后,我們必須為支持向量機(jī)選擇一個(gè)軟件圖書(shū)館。開(kāi)源庫(kù)LibSVM是一個(gè)很好的選擇,它非常穩(wěn)定并且有詳細(xì)的記錄,支持多類(lèi)分類(lèi),并提供所有主要開(kāi)發(fā)者平臺(tái)從MATLAB到Android的拓展。
持續(xù)分類(lèi)的挑戰(zhàn)
在實(shí)踐中,用戶(hù)在移動(dòng)的同時(shí),使用中的設(shè)備要進(jìn)行實(shí)時(shí)分類(lèi)來(lái)進(jìn)行活動(dòng)識(shí)別。為了將產(chǎn)品成本降到最低,我們需要在不影響結(jié)果也就是信息質(zhì)量的前提下,平衡傳輸、存儲(chǔ)和處理的成本。
假設(shè)我們可以負(fù)擔(dān)數(shù)據(jù)傳輸?shù)馁M(fèi)用,所有數(shù)據(jù)都可以在云端上獲得存儲(chǔ)和處理。實(shí)際上,這會(huì)為用戶(hù)帶來(lái)巨大的數(shù)據(jù)費(fèi)用,用戶(hù)的設(shè)備當(dāng)然要連接互聯(lián)網(wǎng),無(wú)線網(wǎng)絡(luò)、藍(lán)牙或4G模塊的費(fèi)用不可避免地將進(jìn)一步提升設(shè)備成本。
更糟糕的是,在非城市地區(qū),3G網(wǎng)絡(luò)的訪問(wèn)效果通常不理想,例如徒步旅行、騎自行車(chē)或游泳時(shí)。這種對(duì)云端的大量數(shù)據(jù)傳輸?shù)囊蕾?lài)會(huì)使更新變慢,并且需要定期同步,從而大大抵消人工智能運(yùn)動(dòng)分析帶來(lái)的實(shí)際益處。與之相反,僅在設(shè)備的主處理器上處理這些操作會(huì)明顯導(dǎo)致耗電量的增加,并且減少其他應(yīng)用的執(zhí)行周期。同理,將所有數(shù)據(jù)都儲(chǔ)存在設(shè)備上會(huì)增加存儲(chǔ)成本。
化圓為方
為了解決這些彼此沖突的問(wèn)題,我們可以遵循四個(gè)原則:
1. 拆分——將特征處理從分類(lèi)引擎的執(zhí)行中拆分。
2. 減少——智能選擇準(zhǔn)確的活動(dòng)識(shí)別所需的特征,來(lái)減少存儲(chǔ)和處理的需求量。
3. 使用——使用的傳感器須能夠以較低耗電量獲取數(shù)據(jù)、實(shí)施傳感器融合(將多個(gè)傳感器的數(shù)據(jù)結(jié)合在一起),并且能夠?yàn)槌掷m(xù)執(zhí)行進(jìn)行特征預(yù)處理。
4. 保留——保留能夠確定用戶(hù)活動(dòng)的系統(tǒng)支持性數(shù)據(jù)的模型。
通過(guò)將特征處理與分類(lèi)引擎的執(zhí)行拆分,與加速度和陀螺儀傳感器連接的處理器可以小得多。這有效避免了將實(shí)時(shí)數(shù)據(jù)塊連續(xù)傳輸?shù)礁鼜?qiáng)大的處理器的需求。諸如用于將時(shí)間域信號(hào)變換為頻率域信號(hào)的高速傅里葉變換的特征處理將需要低功耗融核處理器,以執(zhí)行浮點(diǎn)運(yùn)算。
此外,在現(xiàn)實(shí)世界中,單個(gè)傳感器存在物理限制,并且其輸出隨時(shí)間發(fā)生偏差,例如由于由焊接和溫度引起的偏移和非線性縮放。為了補(bǔ)償這種不規(guī)則性,需要傳感器融合,以及快速、內(nèi)聯(lián)和自動(dòng)的校準(zhǔn)。
圖1:活動(dòng)分類(lèi)的功能流程(來(lái)源Bosch Sensortec)
此外,所選擇的數(shù)據(jù)捕獲速率可以顯著影響所需的計(jì)算和傳輸量。通常來(lái)說(shuō),50Hz采樣率對(duì)于正常的人類(lèi)活動(dòng)就足夠了。但在對(duì)快速移動(dòng)的活動(dòng)或運(yùn)動(dòng)進(jìn)
行分析時(shí),需要200 Hz的采樣率。同樣地,為了取得更快的響應(yīng)時(shí)間,可以安裝2 kHz單獨(dú)加速計(jì)來(lái)確定用戶(hù)目的。
為了迎接這些挑戰(zhàn),低功耗或者應(yīng)用特定傳感器集線器可以顯著降低分類(lèi)引擎所需的CPU周期。比如Bosch Sensortec的BHI160和BNO055兩個(gè)產(chǎn)品就是這種傳感器集線器。相關(guān)軟件可直接以不同的傳感器數(shù)據(jù)速率直接生成融合后的傳感器輸出。
對(duì)待處理特征的初始選擇隨后會(huì)極大地影響訓(xùn)練模型的大小、數(shù)據(jù)量以及訓(xùn)練和執(zhí)行內(nèi)聯(lián)預(yù)測(cè)所需的計(jì)算能力。因此,對(duì)特定活動(dòng)分類(lèi)和區(qū)分所需的特征進(jìn)行選擇是一項(xiàng)關(guān)鍵的決定,同時(shí)也很可能是重要的商業(yè)優(yōu)勢(shì)。
回顧我們上文提到的UCI機(jī)器學(xué)習(xí)數(shù)據(jù)庫(kù),其擁有561個(gè)特征的完整數(shù)據(jù)集,使用默認(rèn)的LibSVM內(nèi)核訓(xùn)練的模型進(jìn)行活動(dòng)分類(lèi)的測(cè)試準(zhǔn)確度高達(dá)91.84%。然而,完成培訓(xùn)和特征排名后,選擇最重要的19項(xiàng)功能足以達(dá)到85.38%的活動(dòng)分類(lèi)測(cè)試準(zhǔn)確度。經(jīng)過(guò)對(duì)排名進(jìn)行仔細(xì)檢查,我們發(fā)現(xiàn)最相關(guān)的特征是頻域變換以及滑動(dòng)窗口加速度原始數(shù)據(jù)的平均值、最大值和最小值。有趣的是,這些特征都不能僅僅通過(guò)預(yù)處理實(shí)現(xiàn),傳感器融合對(duì)于確保數(shù)據(jù)的足夠可靠性十分必要,并因此對(duì)分類(lèi)尤為實(shí)用。
結(jié)論
總而言之,科技發(fā)展現(xiàn)在已經(jīng)達(dá)到在便攜式設(shè)備上運(yùn)行高級(jí)人工智能來(lái)分析運(yùn)動(dòng)傳感器的數(shù)據(jù)的程度。這些現(xiàn)代傳感器以低功耗運(yùn)行,而傳感器融合和軟件分區(qū)則明顯提高了整個(gè)系統(tǒng)的效率和可行性,同時(shí)也大大簡(jiǎn)化了應(yīng)用程序開(kāi)發(fā)。
為了補(bǔ)充傳感器的基礎(chǔ)架構(gòu),我們利用開(kāi)源庫(kù)和最佳實(shí)踐來(lái)優(yōu)化特征提取和分類(lèi)。
為用戶(hù)提供真正的個(gè)性化體驗(yàn)已成為現(xiàn)實(shí),通過(guò)人工智能,系統(tǒng)可以利用由智能手機(jī)、可穿戴和其他便攜設(shè)備的傳感器所收集的數(shù)據(jù),為人們提供更多深度功能。未來(lái)幾年,一系列現(xiàn)在還難以想象的設(shè)備和解決方案將會(huì)得到更多發(fā)展。人工智能和傳感器為設(shè)計(jì)師和用戶(hù)打開(kāi)了一個(gè)充滿了激動(dòng)人心的機(jī)會(huì)的新世界。
圖4:人工智能和傳感器為設(shè)計(jì)師和用戶(hù)打開(kāi)了一個(gè)充滿了激動(dòng)人心的機(jī)會(huì)的新世界。(來(lái)源:Bosch;圖片:Depositphotos/Krisdog)
關(guān)于Bosch Sensortec
Bosch Sensortec GmbH是羅伯特·博世有限責(zé)任公司(Robert Bosch GmbH)的全資子公司,為智能手機(jī)、平板電腦、可穿戴設(shè)備及物聯(lián)網(wǎng)產(chǎn)品開(kāi)發(fā)并提供定制MEMS傳感器與解決方案。產(chǎn)品組合包括3軸加速度計(jì)、陀螺儀和地磁傳感器、集成6軸和9軸傳感器、環(huán)境傳感器,以及全面的軟件組合。自2005年成立起,Bosch Sensortec已成為上述市場(chǎng)的MEMS技術(shù)領(lǐng)先企業(yè)。博世公司自1995年至今一直是MEMS傳感器領(lǐng)域的先鋒與全球市場(chǎng)的領(lǐng)導(dǎo)者,至今所銷(xiāo)售的MEMS傳感器數(shù)量已超過(guò)80億。全球每?jī)刹恐悄苁謾C(jī)中便有一部使用Bosch Sensortec的傳感器。
推薦閱讀:
手機(jī)凈空區(qū)越來(lái)越小,天線設(shè)計(jì)該如何應(yīng)對(duì)?
智能燈具中zigbee無(wú)線技術(shù)方案解析
SimpleLink無(wú)線MCU平臺(tái),為何最具代表
電子車(chē)牌識(shí)別替代傳統(tǒng)車(chē)牌識(shí)別已成趨勢(shì)