你的位置:首頁 > 測試測量 > 正文

學術界的AI vs 工業(yè)界的AI:區(qū)別在哪里?

發(fā)布時間:2017-11-27 責任編輯:wenwei

【導讀】很多關心研發(fā)的人會有這樣的疑問。去年,講到人工智能時人們會談到它具有“三要素”:算法、算力和數(shù)據;從今年開始,把場景加入進來,開始用“四元分析”的方式來理解人工智能。加入場景非常重要的原因是人工智能終究是一種技術,人工智能必須要落實到精準的場景,才有它實實在在的價值。
 
現(xiàn)在不少學界的科學家都到公司里做研發(fā),那么,在工業(yè)界從事研發(fā)和以前在學界究竟有哪些不同?
 
學術界追逐精度的極限
 
人工智能的概念實在太大了,現(xiàn)在深度學習最熱,學術界里研究深度學習會做些什么事情呢?一般情況下,學術界把問題設立好后,去思考研究一些新的算法,然后在具體的問題上,力圖在精度上達到極限。從深度學習上設計更好的模型結構方面,過去這些年,像最初的Hinton用最基本的網絡結構,到谷歌的GoogleNet,微軟的殘差網絡(ResNet),可以看到基礎網絡結構是推動學術界往前走的核心。但是除了基本的網絡結構之外,更大的網絡、更深的網絡以及不同的網絡模型的融合,也是大家追逐精度的常用方法。
 
另一方面,我們要訓練這些網絡,可能需要更多的計算資源,比如需要圖形處理器集群(GPU Cluster),比如希望有更便捷的訓練平臺,像Caffe、MxNet、Tensorflow等等。當然,更重要的是大家在一點點往前推動的同時,積累了很多小的經驗,這些經驗通過學術報告、論文的形式來分享。
 
大家都站在巨人的肩膀上一步一步往前走。當然,還有怎么樣用其他的非標注的數(shù)據來提升解決問題的能力。所有的一切都結合在一起,在解決具體問題的時候,能夠把精度達到極限。
 
學術界很多時候研究的目的,是要有成果論文發(fā)在最頂級的學術雜志上,也希望這些算法能夠具有普適性,除了能解決自己的問題,其他人也能借鑒,最好能開源,所有人都可以去使用,這樣就能很好地提升自己在這個領域的影響力。
 
沒有瑕疵的用戶體驗如何產生
 
但工業(yè)界不是這樣。工業(yè)界要去探索商業(yè),注定要有經濟上的考慮,思考盈利模式,那對人工智能的考慮就會不一樣。
 
在工業(yè)界待過就會明白,人工智能本身并不是一個產品,不是單純靠人工智能就能獲得利益,必須要與自己的業(yè)務和場景相結合,才能發(fā)揮它的價值,核心算法只是其中的一個模塊而已。無論是往前端走,還是往后端走,還是需要很多不同類型的人,才可以做出一個產品。
 
最重要的是,人工智能并不是一個靜態(tài)的東西。比如說訓練出來的模型,要用到某個業(yè)務場景里面,業(yè)務場景里產生新的數(shù)據,這些數(shù)據進一步提升人工智能模型的能力,再用到場景里面,這是一個閉環(huán)和不斷迭代的過程。
 
另一方面,也是很多從學術界到工業(yè)界的教授和學者很容易犯的一個很嚴重的錯誤,就是認為技術在真正推動產品。但其實,用在具體的場景里面,技術只是起到一個非常小的作用,它的貢獻大概30%到40%就不錯了。
 
一個成功的產品,還需要產品工程師和非常多的人,大家一起才能做出一個具備非常完美的用戶體驗的產品出來。一個核心點就是我們做技術的人,做研究的人,要明白永遠沒有完美的算法,算法永遠是有瑕疵存在的,我們一定要和場景工程師在一起,通過好的產品設計,把這些算法上的瑕疵避免掉,打造沒有瑕疵的用戶體驗。
 
學術界的AI vs 工業(yè)界的AI:區(qū)別在哪里?
 
此外,除了考慮用戶體驗,工業(yè)界設計一個產品還會考慮其他方面。比如,當前把視覺,語音和相關的技術用在智能硬件上的時候,工業(yè)界可能會想,到底這個產品能不能滿足某種高頻的剛需?
 
工業(yè)界還會考慮一款產品用到的技術有沒有成熟?比如說家用機器人,可以端茶送水,可以聊天,這是不可能的,技術上還有一個過程。
 
另外,工業(yè)界還會考慮技術成熟了,但有沒有壁壘?假設沒有技術壁壘的話,今天做一個產品出來,比較前沿的大公司,都有專家團隊,你把這個產品做出來立馬又失掉了,技術上的壁壘也一定要有。
 
另外一方面,就是學術界想得最少的:我們做一個場景,一定要有變現(xiàn)的模式。沒有一個變現(xiàn)的模式,產品出來了,但是今后掙不了錢,也不可能讓這個公司維系下去。
 
用四元分析來看學界和工業(yè)界的區(qū)別
 
總的來說,學界進行人工智能、深度學習的研究,一直是在追求精度和極限。用四元分析的方法來說就非常有意思,即場景和數(shù)據確定了,然后設定一個問題,設定一個數(shù)據集,假設有足夠多的計算機資源,怎么樣設計新的算法,讓精度能夠達到極限?
 
有很多的數(shù)據集,比如ImageNet,號稱人工智能的世界杯;人臉研究界有LFW(人臉圖片的數(shù)據庫,用來研究不受限的人臉識別問題);在視頻領域有美國組織的TRECVID;語音的話有Switchboard。他們共同特點就是:問題和數(shù)據都是確定的,用盡量多的計算機資源,去設計不同的算法,最終希望達到精度的上限。
 
但不得不承認,很多成果是沒辦法商業(yè)化的。為什么?在ImageNet上,假設訓練了1000多層的網絡,把9個或更多網絡全部合在一起能達成一個很好的精度,在現(xiàn)實的場景下是不可能用這么大的模型和這么多的資源去做一件事情。所以,很多的成果,是假設將來計算能力達到一定的程度,精度能夠達到這個上限。
 
AI研究的另外一個維度是追求用戶體驗的極限。用四元分析的方法,是把場景和算力固定了。這是什么意思?假設我們要做一個機器人,希望它能識別你,這時候場景是確定的。算力確定了是說,這個場景推出的時候,用什么樣的芯片和什么樣的硬件,其實已經確定了。我們要做的事情是在這樣一個確定場景和算力的情況下,怎么樣去提升數(shù)據和算法,跟具體的應用場景去形成一個閉環(huán),去不斷地迭代,去提升它的性能。這跟學術界把場景和數(shù)據固定是完全不一樣的。在這種場景下,可以不停地用收集到的新數(shù)據不停提升和優(yōu)化模型,在數(shù)據、算法和場景三要素中形成一個閉環(huán)。雖然我們能把所有的問題解決,但是在具體的場景下,也有可能逐步地提升它的性能。
 
這時候做的事情很有意思——要做很多數(shù)據的清洗、標注。為了把產品的價格降低,比如用一個很差的CPU就能夠去做計算,肯定要不停地去優(yōu)化模型的速度。另一方面,很多時候,滿足這種體驗的需求會使一些新的問題誕生出來。
 
仔細想一想,學術界多數(shù)做的事情是在思考,在想它的極限在哪,主要用腦;工業(yè)界并不是強調用腦,而是用心——就是怎么樣能把這個場景做出來,并不一定要有非常高大上的算法,就是要從用戶使用產品的維度上,讓用戶感覺這個產品非常好。
 
學術界和工業(yè)界又不是完全割裂的:工業(yè)界敢去提某一個產品的設想,是看到了在學術界有一些前沿的成果,可以在工業(yè)界來用。同時,工業(yè)界也在逐步提煉它的問題,扔給學術界,希望他們去做這種前沿的探索。比如說工業(yè)界可以想,三年、五年以后會往哪些方向去推動,他就可以把這些任務推給學術界。
 
在人工智能、深度學習的研究領域,學術界和工業(yè)界的差別還是很大的,同時也相互作用,相互增強。學術界和工業(yè)界一起合作,研究和產業(yè)相結合,一定會把人工智能帶上另外一個階段。
 
本文作者系360公司首席科學家、人工智能研究院院長。
 
(來源:中國經濟網)
 
 
 
 
 
 
 
 
 
 
推薦閱讀:



用了30年的電流反饋放大器錯了?PSpice仿真來判定
功耗低了器件卻燒了?低電流損耗也可能帶來麻煩
以高轉換速率進行負載瞬態(tài)測試
高速模數(shù)轉換器精度透視(第三部分)
那些長短不一的PCI-E插槽都有什么不一樣?
 
 
 
要采購轉換器么,點這里了解一下價格!
特別推薦
技術文章更多>>
技術白皮書下載更多>>
熱門搜索
?

關閉

?

關閉