無人駕駛汽車上主要的傳感器:激光雷達、攝像、毫米波雷達、GPS、超聲波雷達和車輪轉(zhuǎn)角傳感器等。ElonMusk曾經(jīng)在公開場合多次說過,不用激光雷達只用攝像頭,也能實現(xiàn)Level4以上的無人駕駛。但是我個人覺得他這么說其實是有商業(yè)化方面的考慮。

大數(shù)據(jù)與算法之于實現(xiàn)無人駕駛 誰能更勝一籌?
特斯拉的汽車已經(jīng)在售,賣出去的車只能更新軟件,肯定不能換硬件,比如全部重新裝上激光雷達(不然今天特斯拉也不會說現(xiàn)在在產(chǎn)的特斯拉汽車會換上新的硬件系統(tǒng))。
況且,Google無人車用的64線Velodyne激光雷達本身的價格高達75000美元,這幾乎和低配版特斯拉在美國的售價差不多了。
特斯拉的車要賣的好必須控制成本,Google的無人車目前還只是處于測試階段,幾百輛的規(guī)模當(dāng)然可以什么好用用什么,相比于特斯拉幾萬的產(chǎn)銷量,花不了多少錢。
今年5月7日,美國佛羅里達州的一位特斯拉車主在使用Autopilot時發(fā)生車禍,最終不幸生亡。由此還導(dǎo)致給特斯拉提供計算機視覺技術(shù)的Mobileye創(chuàng)始人AmnonShashua與ElonMusk之間的口水戰(zhàn),雙方最終還鬧掰了:Mobileye宣布在與特斯拉合同結(jié)束后不再繼續(xù)合作。
在特斯拉9月11日發(fā)布的Autopilot8.0版本中,特斯拉把毫米波雷達采集到的數(shù)據(jù)作為了控制系統(tǒng)判斷的主要依據(jù),而不是之前Mobileye的攝像頭。
說起5月份的車禍,其實在車禍發(fā)生前,特斯拉的毫米波雷達已經(jīng)感知到有障礙物,但是攝像頭因光線的問題,沒有發(fā)現(xiàn)在藍天白云背景下的大貨車,最后導(dǎo)致車禍發(fā)生。Musk肯定也知道了攝像頭并不靠譜,所以才在Autopilot的新版本中把毫米波雷達的數(shù)據(jù)作為主要參考依據(jù)。
綜上所述,Musk說「不用激光雷達只用攝像頭,也能實現(xiàn)Level4以上的無人駕駛」更多是出于商業(yè)化方面的考慮。
此舉意在一邊用現(xiàn)有的傳感器收集數(shù)據(jù),一邊等激光雷達價格降下來。個人認為,如果固態(tài)激光雷達的價格真能如宣傳中所說下降到100美元到200美元,為了保證汽車行駛的安全性,Musk肯定是會用的。
有了這些數(shù)據(jù)之后,Google可以訓(xùn)練出更精確的“點擊模型”,而點擊模型貢獻了今天搜索排序至少60%到80%的權(quán)重,這將吸引更多的用戶,整個過程是一個典型的不斷自我強化的正反饋過程。
在Google內(nèi)部,產(chǎn)品經(jīng)理們都遵循這樣一個規(guī)則:在沒有數(shù)據(jù)之前,不要給出任何結(jié)論。由此可見,Google的企業(yè)使命已經(jīng)融入了員工的日常工作中。Google正是充分利用了大數(shù)據(jù)的力量,順利成為了對整張互聯(lián)網(wǎng)舉足輕重的樞紐節(jié)點,非常自然地實現(xiàn)了對互聯(lián)網(wǎng)的壟斷。
再舉一個例子,9月27日Google發(fā)布了新版本的神經(jīng)機器翻譯系統(tǒng)(GoogleNeuralMachineTranslation,GNMT),宣稱該系統(tǒng)的翻譯質(zhì)量接近人工筆譯
大多數(shù)網(wǎng)友在實際測試過后,表示眼前一亮。與此同時,這也引起了某些翻譯工作者的恐慌:「作為翻譯看到這個新聞的時候,我理解了18世紀(jì)紡織工人看到蒸汽機時的憂慮與恐懼?!苟@其實也是充分利用大數(shù)據(jù)的結(jié)果。
其實早在2005年,Google的機器翻譯質(zhì)量就讓全世界從事自然語言處理的人震驚不已了:從來沒有從事過機器翻譯的Google,在美國國家標(biāo)準(zhǔn)技術(shù)研究所(NationalInstituteofStandardsandTechnology,NIST)的年度測評中遙遙領(lǐng)先。
在阿拉伯語到英語翻譯的封閉測試集中,Google系統(tǒng)的BLUE評分為51.31%,領(lǐng)先第二名將近5%,而提高這5個百分點在過去需要研究5到10年。
Google究竟是做到的呢?除了Google一貫的行事風(fēng)格——把該領(lǐng)域全世界最好的專家、南加州大學(xué)ISI實驗室的弗朗茲-奧科(FranzOch)博士挖過來之外,最關(guān)鍵的還是Google手里握有改進機器翻譯系統(tǒng)所需要的大數(shù)據(jù)。
從奧科2004年加入Google到2005年參加NIST測試,期間只有一年時間,如此短的時間只夠他將在南加大的系統(tǒng)用Google的程序風(fēng)格重新實現(xiàn)一遍,完全沒有額外的時間做新的研究。而從上圖中我們可以看到,Google和南加大系統(tǒng)的水平差了5到10年。
其中的秘密就在于:奧科在Google還是用的在南加大使用過的方法,但充分利用了Google在數(shù)據(jù)收集和處理方面的優(yōu)勢,使用了比其他研究機構(gòu)多上萬倍的數(shù)據(jù),訓(xùn)練出一個機器翻譯的六元模型(一般來講N元模型的N值不超過3)。當(dāng)奧科使用的數(shù)據(jù)是其他人的上萬倍時,量變的積累導(dǎo)致了質(zhì)變的發(fā)生,而這就是當(dāng)今人工智能領(lǐng)域最權(quán)威的幾位專家之一杰弗里-辛頓(GeoffreyHinton)教授所堅持的“多則不同”吧。
值得一提的是,SYSTRAN公司是一家使用語法規(guī)則進行翻譯的企業(yè),在科學(xué)家們還沒有想到或者有條件利用統(tǒng)計的方法進行機器翻譯之前,該企業(yè)在機器翻譯領(lǐng)域是最領(lǐng)先的。但現(xiàn)在與那些采用了數(shù)據(jù)驅(qū)動的統(tǒng)計模型的翻譯系統(tǒng)相比,它的翻譯系統(tǒng)就顯得非常落后了。
經(jīng)過上述分析,對本小結(jié)的問題終于可以下一個較安全的結(jié)論:在當(dāng)下的企業(yè)競爭中,相比于算法或數(shù)學(xué)模型,數(shù)據(jù)的重要性的確要大得多,即數(shù)據(jù)為王。
因為前者往往由學(xué)術(shù)界在幾十年前就已經(jīng)發(fā)現(xiàn)了,所有企業(yè)都可以加以利用,但是多維度的完備數(shù)據(jù)并不是每一個企業(yè)都擁有的。
今天很多企業(yè)在產(chǎn)品和服務(wù)的競爭,某種程度上已經(jīng)是數(shù)據(jù)的競爭了,可以說沒有數(shù)據(jù)就沒有智能。因為從理論上講,只要能夠找到足夠多的具有代表性的數(shù)據(jù),就可以利用概率統(tǒng)計結(jié)果找到一個數(shù)學(xué)模型,使得它和真實情況非常接近,從而節(jié)省了大量人力成本或給予了用戶更愉悅的體驗。
總結(jié)
特斯拉已經(jīng)積累的2.22億英里行駛數(shù)據(jù),以及未來將要積累的數(shù)據(jù),對于他們研發(fā)Level4以上的無人駕駛汽車是非常有幫助的,特斯拉可能會最終會先Google一步實現(xiàn)量產(chǎn)。
目前出于商業(yè)化的考慮,已量產(chǎn)的特斯拉用“攝像頭毫米波雷達超聲波雷達”作為主要傳感器,但是等到低成本的固態(tài)激光雷達性能更穩(wěn)妥。我相信Musk肯定是會裝上去的(有網(wǎng)友已經(jīng)在加州的道路上拍到頭上頂著激光雷達的特斯拉汽車偷偷在做測試了),因為這對于保證實現(xiàn)99.9999%的車輛行駛安全性是非常有幫助的。
一方認為:數(shù)據(jù)為王,再牛的智能算法也拼不過海量的數(shù)據(jù)。而另一方則認為:數(shù)據(jù)只是建材,強大的分析能力才能讓它變成摩天大樓,對效率的追求導(dǎo)致了算法,大數(shù)據(jù)取代不了算法。
日前,Google和特斯拉都公布了各自的測試?yán)锍虜?shù)。據(jù)外媒報道,Google宣布自己的無人駕駛汽車剛剛完成200萬英里道路行駛里程。而特斯拉創(chuàng)始人ElonMusk也于幾天后在個人Twitter上宣布:特斯拉Autopilot發(fā)布后的1年中累計行駛里程已達到2.22億英里。
Google和特斯拉兩方的表態(tài)表面上似乎也印證了微博討論中雙方的觀點:數(shù)據(jù)為王VS算法為王。那實際情況究竟如何?
我們不妨考慮另一個類似的現(xiàn)象:大多數(shù)人認為Google的搜索比微軟的Bing搜索在質(zhì)量上做得略好一點的原因是Google的算法好。
但在前Google工程師吳軍博士看來,這種看法在2010年之前是對的,因為那時Bing在技術(shù)和工程方面明顯落后于Google。但今天這兩家公司在技術(shù)上已經(jīng)相差無幾了,Google還能稍稍占優(yōu),很大程度上靠的是數(shù)據(jù)的力量。
與搜索算法尚不成熟的2000年不同,今天已經(jīng)不存在一個未知的方法,僅憑它就能將準(zhǔn)確率提高哪怕一個百分點。Google憑借PageRank算法給搜索結(jié)果帶來了質(zhì)的變化,而好的搜索結(jié)果能吸引更多的用戶使用Google的搜索引擎,這不知不覺間給Google提供了大量的點擊數(shù)據(jù)。
