個(gè)人機(jī)器人將無處不在

2018/12/21 14:50:05??????點(diǎn)擊:

個(gè)人機(jī)器人是在智能音箱之后,下一個(gè)重要的個(gè)人助理物品。這可不是科幻小說;家用助理機(jī)器人今天就可以出貨...

我最近參加了上海世界通信大會(huì)(MWC)。機(jī)器人的聲勢(shì)浩大,而且是非常浩大。我看到幾十家公司,尋找顧客打造品牌,并提供他們眾多應(yīng)用程序中的任何一種。

舉個(gè)應(yīng)用程序的例子,機(jī)器人護(hù)士Tug。它看起來一點(diǎn)也不像我們?cè)诳苹闷锌吹降臋C(jī)器人形象,除非你想的是星際大戰(zhàn)(Star Wars)中某些比較實(shí)用的例子。它看起來像是一個(gè)有輪子的箱子,但擁有許多我們期待行動(dòng)機(jī)器人具備的功能,包括巡游和回避障礙物。這可以在醫(yī)院里巡游,若是有人走道它面前,就會(huì)停下,還會(huì)繞過不對(duì)的點(diǎn)滴站;這臺(tái)機(jī)器人還能呼叫電梯,前往其他樓層。Tug的重點(diǎn)是送藥和食物給病人,且已經(jīng)在美國(guó)37間榮民醫(yī)院服務(wù)。

想象這能替忙碌的護(hù)士減輕多少肩頭負(fù)擔(dān)。廠內(nèi)還有多種其他助理應(yīng)用服務(wù),在長(zhǎng)者照護(hù)、在教學(xué)支持、餐廳與旅館。把這當(dāng)成在智能音箱之后,下個(gè)重要的個(gè)人助理物品(Amazon已經(jīng)有超過十萬臺(tái)機(jī)器人在倉(cāng)庫(kù)工作,所以很明顯他們正在開發(fā)家用機(jī)器人當(dāng)作Echo的后繼者)。這不是科幻小說;家用助理機(jī)器人今天就可以出貨。

機(jī)器人健康助理

很顯然,生產(chǎn)這種機(jī)器人的技術(shù)挑戰(zhàn)和自動(dòng)駕駛問題類似,不過依然有明顯的不同。巡游和回避障礙是共通點(diǎn),但清晰駕駛車道和交通管理的概念,無法運(yùn)用在這些機(jī)器人身上;一切都關(guān)乎在建筑物內(nèi)的障礙回避與巡游(要重新規(guī)劃地圖以繞過臨時(shí)不可移動(dòng)的障礙)。雖然車子有自然語言接口只是還不錯(cuò),但是對(duì)機(jī)器人助理來說,卻是不可或缺。誰想要在藥房送錯(cuò)藥,或是餐廳搞砸點(diǎn)單時(shí)學(xué)著怎么按鈕?

Gartner 最近推出一份機(jī)器人人工智能與感應(yīng)要求的前十大清單,其中包括了:

? 計(jì)算機(jī)視覺-場(chǎng)景分析、對(duì)象識(shí)別等等
? 生物識(shí)別與驗(yàn)證-誰在跟我說話,他們是否獲準(zhǔn)下達(dá)此等命令
? 對(duì)話接口-話語識(shí)別與自然語言處理
? 聲音場(chǎng)景分析-識(shí)別明顯的噪音如狗吠或玻璃破裂
? 地點(diǎn)感應(yīng)-我在哪,誰/什么在我附近
? 自動(dòng)移動(dòng)-能夠不撞倒對(duì)象或人,移動(dòng)到建筑物其他地方的能力
? 機(jī)器人內(nèi)建人工智能功能-不只是仰賴云端

現(xiàn)今對(duì)于建立具有這些能力的系統(tǒng)默認(rèn)取向,從根據(jù)多核心繪圖處理器(GPU)平臺(tái),在機(jī)器人內(nèi)建人工智能系統(tǒng)。這可以理解──產(chǎn)品建立者可以使用現(xiàn)成的平臺(tái)做樣品,無須擔(dān)心專用集成電路(ASIC)細(xì)節(jié),就像他們會(huì)使用中央處理器(CPU)開發(fā)板給更傳統(tǒng)應(yīng)用程序使用的方式一樣。但是隨著產(chǎn)品數(shù)量暴增,或著你正推動(dòng)其暴增的時(shí)候,成本與顧客滿足/差異化就愈來愈重要?,F(xiàn)成的解決方案很貴,耗電量很大,且使用和別人一樣的平臺(tái)就很難有所差異。這就是為什么無可避免地,大量解決方案轉(zhuǎn)向ASIC平臺(tái)。你無須放棄所有已經(jīng)投入樣品的投資;成本較低的GPU平臺(tái)可能還是解決方案的一部份,但是重要層次的人工智能功能性可以轉(zhuǎn)移到更有成本效率、更加統(tǒng)合的平臺(tái)上。

在機(jī)器學(xué)習(xí)(ML)應(yīng)用程序中,數(shù)字信號(hào)處理(DSP)優(yōu)于GPU的每瓦特效能遠(yuǎn)近馳名,有一部分原因是固定點(diǎn)優(yōu)于浮動(dòng)點(diǎn)操作,還有某些平臺(tái)的量化彈性。訂做解決方案的價(jià)格優(yōu)勢(shì)(以數(shù)量算)也很出名。這就是為何你更有可能看到具數(shù)量/價(jià)格敏感性的ML應(yīng)用程序在邊際采用DSP而不是現(xiàn)有的GPU。

智能屏幕-無屏幕機(jī)器人的形式之一?

但你能做到所有用GPU可以做到的事嗎?答案是還真不少。拿計(jì)算機(jī)視覺,亦即定位、追蹤、對(duì)象識(shí)別、手勢(shì)識(shí)別為例。這個(gè)程度的視覺處理現(xiàn)在在某些DSP為基礎(chǔ)的內(nèi)建平臺(tái)上已經(jīng)有了?;蛘哂米詣?dòng)移動(dòng)支持本地重新訓(xùn)練(無須連上云端)。再一次,支持此一智能的核心識(shí)別能力,也是你在GPU會(huì)發(fā)現(xiàn)的同樣能力,在DSP上也找得到。

語音識(shí)別/驗(yàn)證與聲音場(chǎng)景分析也可以卸下。這些(和其他這里舉的例子)明白地點(diǎn)出,為何卸除的意義這么重要。這每一種智能操作都分解成多重步驟,就說從取得聲音,到方向解析,到也許基本字詞識(shí)別,最終甚至是自然語言處理(NLP)。最后一步非常困難,可能需要上云端。但是在那之前的步驟都可以很輕松用內(nèi)建解決方案處理。某些應(yīng)用程序,只須識(shí)別很有限的單字,或是你希望偵測(cè)非語言信號(hào),例如打破窗戶的地方,你可能根本不需要云端(或本地GPU)。已經(jīng)有人暗示,甚至有限的NLP在不久的未來便能在邊際支持。

例如CEVA打造了一連串龐大的解決方案,在邊緣人工智能用平臺(tái)、前端語音處理、物聯(lián)網(wǎng)深入學(xué)習(xí)上,使用人工智能支持這些前端功能。