【導(dǎo)讀】近年來巨頭們都在積極布局眼球追蹤技術(shù),除了眼球追蹤在人機交互的巨大潛能以外,眼球追蹤技術(shù)還可能成為VR和AR的基礎(chǔ)性技術(shù),為AR的VR的發(fā)展提供必要的支持。目前我們的人機交互還主要靠的是鍵盤、鼠標、觸摸,這些輸入并不直接也不高效。人機互動的發(fā)展方向應(yīng)該是越來越人性化,要能“聽”、能“看”,能主動探索和回應(yīng)需求。
眼球追蹤讓機器更懂你
眼球追蹤就是這樣一個讓機器人更懂人類的技術(shù)。
眼球追蹤主要是研究眼球運動信息的獲取、建模和模擬。一是根據(jù)眼球和眼球周邊的特征變化進行跟蹤,二是根據(jù)虹膜角度變化進行跟蹤,三是主動投射紅外線等光束到虹膜來提取特征。
早在2012年,眼控技術(shù)研究科技公司Tobii宣布研發(fā)出了適配Windows 8的眼控Gaze界面。這是一家做眼球追蹤技術(shù)較早的瑞典公司。2007年公司估值1400萬美元,2009年則達到了2680萬美元。2012年,英特爾注資2100萬美元進Tobii公司,也是出于對windows 8操作系統(tǒng)一次投資。2014年,Tobii 推出了第二代智能眼鏡 Glass 2,利用每個鏡片配備 2 個攝像頭以及相應(yīng)的軟件技術(shù),實現(xiàn)對眼球動作的精準捕捉。
Tobii 智能眼鏡
英特爾雖然很早就收購了眼球追蹤的公司,但是經(jīng)過多年,眼球追蹤依然未成為筆記本電腦的核心交互方式。而VR的發(fā)展卻讓我們看到了眼球追蹤技術(shù)應(yīng)用的更多的可能性。
眼球追蹤解決VR/AR三大問題
Oculus的創(chuàng)始人Palmer Luckey曾表示,眼部跟蹤技術(shù)會成為VR技術(shù)未來的一個“重要組成部分”。不僅能實現(xiàn)注視點渲染技術(shù),它還能用來創(chuàng)造一種視覺深度,以創(chuàng)作出更好的用戶界面。
(1)減少眩暈
VR要帶給人沉浸感,就要做到能讓人在虛擬空間里自然運動,這需要通過運動追蹤來改變場景的呈現(xiàn)。目前的VR設(shè)備主要是利用空間定位技術(shù)來捕捉人的身體的位置運動,用慣性傳感器來捕捉人的頭部的運動,人在轉(zhuǎn)動頭部時,視角會發(fā)生相應(yīng)的變化。
但是這只是比較初級的動作捕捉,人其實大多數(shù)時候都是通過轉(zhuǎn)動眼球而不是頭部來改變視覺。人們習(xí)慣用眼球轉(zhuǎn)動(而不是頭部轉(zhuǎn)動)去觀察。
目前的VR只追蹤頭部不追蹤眼球運動容易使人眩暈(Motion Sickness)。人類對于頭部轉(zhuǎn)動和相對應(yīng)的視野的變化是極度敏感的。如果用戶的頭轉(zhuǎn)動了,而相對的,視野轉(zhuǎn)動有延遲,只要很微小的延遲就能感覺得到。有多微小呢?研究表明,頭動和視野的延遲不能超過20ms,不然就會非常明顯。而眼球追蹤技術(shù)運用在這里正好可以解決這一問題,以眼球的變化來控制場景的變化。
(2)注視點渲染
場景的變化很必要,但是要讓VR呈現(xiàn)出同自然世界一樣的場景和空間感所需的信息量和計算量是極大的。目前的VR大多數(shù)是將全部場景以同等的清晰度來呈現(xiàn),用戶移動頭部和身體時虛擬物體也會相應(yīng)地變換位置,視點拉近和退后都會影響景深,這些變化都需要大量的計算和不斷更新。
目前的VR能達到每秒36次的刷新,而要達到人眼場景轉(zhuǎn)換的速度則需要2000-3000次每秒,要實時渲染出這些場景,就連很高配的電腦都達不到。
而事實上,VR根本就不需要也不應(yīng)該以全部的清晰度來呈現(xiàn)場景里的所有物體。在日常生活中,我們都明白“近大遠小”,并且當我們注視一個物體時,這個物體會變清晰而其他物體會變模糊,這樣我們看物體才有空間感和景深。如果當我們的視線轉(zhuǎn)移了,畫面中的物體還是全部清晰的,那么我們的眼睛就會感到“不適應(yīng)”,并且會因為處理過多信息而疲勞。
注視點渲染的效果
注視點渲染可以解決VR里畫面呈現(xiàn)的問題,通過追蹤眼睛的注視點,計算機可以只清晰渲染出注視點的場景,而將周邊的場景模糊呈現(xiàn)。這樣我們眼睛在虛擬環(huán)境中看物體和在自然場景中看物體的體驗就會變得一致,這樣虛擬和現(xiàn)實的切換就不會有明顯的障礙,由視點和運動帶來的眩暈也會減輕。
Oculus首席科學(xué)家Michale Abrash在談及VR趨勢時說道,VR將在5年內(nèi)解決聚焦的景深問題。而視點渲染技術(shù)和眼球追蹤技術(shù)是關(guān)鍵的解決辦法。前文已寫到,英偉達與七鑫易維展開合作將從底層技術(shù)實現(xiàn)GPU基于眼球追蹤的注視點優(yōu)化渲染技術(shù)。
(3)眼球觸發(fā)的交互界面
VR中的交互目前還是一個尚需探索的領(lǐng)域,用戶已經(jīng)習(xí)慣了2D的平面界面信息呈現(xiàn),在進入VR里時會出現(xiàn)信息迷失的狀態(tài)。在很多的試驗中發(fā)現(xiàn),用戶不會通過轉(zhuǎn)動頭部來獲取整個環(huán)境信息,也很難自己找到隱藏的菜單和選項,通常需要工作人員的指引或者是游戲語音的引導(dǎo)。
眼控VR將會為VR帶來全新的玩法,在射擊類游戲中可以由眼睛控制光標鎖定,當用戶閉上一只眼時自動調(diào)出瞄準鏡等,還可以根據(jù)玩家在游戲場景中注視點不同觸發(fā)不同的劇情,當玩家注視路口時,會自動出現(xiàn)地圖導(dǎo)航,當注視NPC不同部位觸發(fā)不同的劇情等。除此之外眼控的交互方式還可以應(yīng)用于游戲菜單,不需要使用的菜單會自動隱藏,使用時通過眼控觸發(fā),使VR界面更加干凈。
當然,虛擬現(xiàn)實中的交互方式還有待探索,不管是Leap Motion主張的手勢交互,還是眼球控制的技術(shù)點交互,都必須符合人們的交互習(xí)慣。
眼球追蹤的下一步怎么走?
雖然各大巨頭都各自收購、投資了眼球追蹤技術(shù)公司,眼球追蹤技術(shù)在解決VR因為的眩暈癥、提升沉浸感、增強交互方面都有極大的作用,眼球追蹤技術(shù)已然成為AR/VR發(fā)展的關(guān)鍵性和基礎(chǔ)性技術(shù)。
但是目前有一些顯在的問題需要解決。
(1)眼球追蹤產(chǎn)品價格高昂
Tobii Glass 2 售價最低為 14900 美元,高級版 29900 美元,包括了眼鏡、輔助記錄器和分析軟件。七鑫易維的眼控模組aGlass的售價是單眼1500元,包括一個眼控追蹤配件和三個分別是200度、400度、600度的近視鏡片。The Eye Tribe的眼球追蹤開發(fā)者套件,售價99美元,面向消費者的眼球追蹤盒子,售價199美元。
黃通兵表示,將眼球追蹤模組化集成到頭顯內(nèi)有望將成本降低到20-30美元,但是即使這樣,要HTC、Oculus這樣的頭盔廠商消化這部分的成本,需要擴展眼球追蹤技術(shù)的應(yīng)用場景。目前眼球追蹤的最大價值在于在于與英偉達、AMD這樣的GPU廠商合作,利用注視點渲染技術(shù)降低VR頭顯對GPU的需求。
(2)設(shè)備可用性有待提升
眼球追蹤技術(shù)針對人眼,因此要對人眼的生物體征有很好的了解,眼球追蹤設(shè)備需要能夠識別出不同的健康程度、不同膚色、不同特征的人眼。目前僅是近視這個問題就會困擾很多做智能眼睛和VR頭盔的用戶,更不用說一些患有斜視的用戶。
另外,我們可以看到目前眼球追蹤的設(shè)備有各種不同的形態(tài),包括Tobii的智能眼鏡、The Eye Tribe的眼球追蹤盒子、七鑫易維的VR眼控模組。眼球追蹤盒子的形態(tài)顯然更適用于電腦,智能眼鏡可以整合到AR眼鏡里。
(3)VR/AR應(yīng)用差異較大
目前來看,眼球追蹤技術(shù)應(yīng)用于VR是一個必然的趨勢,目前已有帶眼球追蹤的VR頭盔Fove,各大廠商也計劃推出有眼球追蹤功能的VR一體機。
英偉達主要是希望以眼球追蹤技術(shù)幫助VR做注視點渲染,降低GPU負載,專注移動VR的高通的移動處理器可能集成眼球追蹤算法,更好地支持移動VR體驗。
雖然在此文主要集中分析VR,但是眼球追蹤在AR的應(yīng)用也是不可忽視的,AR在未來的應(yīng)用場景會比VR更為廣闊。
在采訪國內(nèi)另一家眼球追蹤技術(shù)公司“上海青研”時了解到,相比于VR,上海青研更為傾向于眼球追蹤在AR上的應(yīng)用,青研結(jié)合眼控技術(shù)與AR技術(shù),在可穿戴的AR眼鏡上添加眼控模組。
“AR眼控技術(shù)與VR眼控技術(shù)的應(yīng)用場景不同:VR看的是虛擬世界,AR看的是真實世界;VR偏重娛樂更多一些,AR偏重實用更多一些;VR to C更多一些,AR to B更多一些。青研公司開發(fā)AR眼控技術(shù)是為了滿足B端客戶的需求。”青研CEO杜煜解釋到。AR和VR不僅在客戶群,應(yīng)用場景上有不同,需要解決的問題也有很大不同。
杜煜認為:“AR眼控技術(shù)與VR眼控技術(shù)的主要不同在于:VR眼控需要把眼睛注視點坐標和VR屏幕對應(yīng),AR眼控需要把眼睛注視點坐標和真實世界的物體坐標對應(yīng),所以在VR眼控技術(shù)的基礎(chǔ)之上,AR還需要拍攝用戶前方的真實場景,并將眼睛注視點坐標與真實場景建立起三維的對應(yīng)關(guān)系。
AR眼控的主要難點有:
- 通常VR屏幕是2D的,但AR前置場景是3D的。3D位置坐標與眼睛注視點的匹配比2D坐標與眼睛注視點的匹配更復(fù)雜。
- AR眼控比VR眼控要求體積更小,功耗更低,工業(yè)設(shè)計、結(jié)構(gòu)設(shè)計、電路設(shè)計的要求更高。
- AR眼控很多場合是室外使用,VR一般是室內(nèi)使用,AR眼控對室外陽光的抗干擾能力要求更高。“
(4)合作模式不明朗
2016年,風(fēng)投機構(gòu)Accel Partners的科比·富勒(Kobie Fuller)說:“眼球追蹤技術(shù)可能非常強大,但從投資角度看,還無法確定其具備的價值。現(xiàn)在有價值數(shù)十億美元的眼球追蹤技術(shù)公司嗎?我還不知道。”
從目前各大巨頭對眼球追蹤技術(shù)公司收購的金額來看,價值數(shù)十億美元的眼球追蹤技術(shù)公司并不是不可能。7月16日,美國市場研究機構(gòu)MarketsandMarkets發(fā)布了關(guān)于眼動追蹤市場的分析報告,其預(yù)計該市場在2023年將達到13.765億美元的市值,2017年-2023年的年均復(fù)合增長率為27.4%。眼球追蹤的軟件和硬件在這幾年都會呈明顯上升趨勢?;蛟S現(xiàn)在仍不明朗的是合作模式,眼球追蹤會成為獨立的產(chǎn)品還是作為內(nèi)嵌技術(shù)?
目前我們看到,眼球追蹤公司也都在生產(chǎn)眼動儀,智能眼鏡等to C的產(chǎn)品,以及開些幫助企業(yè)開發(fā)的to B產(chǎn)品,同時也在與大廠合作,做VR/AR的外接或內(nèi)嵌技術(shù),商業(yè)模式相對靈活。但是卻始終沒有獲得一個明顯的發(fā)展。VR和AR的發(fā)展對眼球追蹤技術(shù)或許能帶來不一樣的活力。
小結(jié)
目前蘋果、谷歌、Facebook、英偉達、高通這些巨頭公司幾乎占領(lǐng)互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的大半壁江山,也主導(dǎo)著人工智能、自動駕駛、AR/VR等前沿技術(shù)的發(fā)展。
資本+技術(shù),巨頭們的任何一個舉動都可能有改變我們的生活的潛力,而通過長期的行業(yè)報道發(fā)現(xiàn),近年來巨頭們都在積極布局眼球追蹤技術(shù),除了眼球追蹤在人機交互的巨大潛能以外,眼球追蹤技術(shù)還可能成為VR和AR的基礎(chǔ)性技術(shù),為AR的VR的發(fā)展提供必要的支持。雖然未來還有不少挑戰(zhàn),但是我們很欣喜地看到在眼球追蹤技術(shù)上,中國公司的發(fā)展已經(jīng)完全與國外接軌,站在同一競爭舞臺上。
(節(jié)選自雷鋒網(wǎng))
推薦閱讀: