谷歌的定制張量處理器(TPU)芯片是去年谷歌云平臺客戶可以使用的最新一代芯片,專為人工智能推理和培訓(xùn)任務(wù)量身定制,如圖像識別,自然語言處理和強(qiáng)化學(xué)習(xí)。為了支持開發(fā)應(yīng)用程序的開發(fā),Mountain View公司擁有穩(wěn)定的開源架構(gòu),如BERT(一種語言模型),MorphNet(一種優(yōu)化框架)和UIS-RNN(一種揚(yáng)聲器二值化系統(tǒng)),通常還附帶了數(shù)據(jù)集。延續(xù)這一思路,谷歌今天在其庫中添加了兩種新的圖像分割模型,并聲稱這兩種模型都實(shí)現(xiàn)了部署在云TPU pod上的最先進(jìn)的性能。
該模型- Mask R-CNN和DeepLab v3+ -自動標(biāo)記圖像中的區(qū)域,并支持兩種類型的分割。第一類是實(shí)例分割,它為一個或多個對象類(例如,家庭照片中的人)的每個實(shí)例提供一個惟一的標(biāo)簽,而語義分割則根據(jù)圖像所代表的對象或紋理類對圖像的每個像素進(jìn)行注釋。(例如,一個城市的街景可能被標(biāo)記為“人行道”、“人行道”和“建筑物”。)
正如谷歌所解釋的,Mask R-CNN是一個兩階段的實(shí)例分割系統(tǒng),可以同時定位多個對象。第一個階段從輸入照片中提取模式,以識別潛在的感興趣區(qū)域,而第二個階段在為每個輸入照片生成像素級掩碼之前,對這些建議進(jìn)行細(xì)化,以預(yù)測對象類。
另一方面,DeepLab 3+優(yōu)先考慮分割速度。使用谷歌最新一代TPU硬件(v3)上的TensorFlow機(jī)器學(xué)習(xí)框架,在開源PASCAL VOC 2012圖像語料庫上進(jìn)行培訓(xùn),在不到5小時的時間內(nèi)完成培訓(xùn)。
本周起,Google為Mask R-CNN和Deeplab 3+提供的協(xié)作平臺上的教程和筆記就可以使用了。
TPU是一種特定于應(yīng)用程序的集成電路(asic),它是液態(tài)冷卻的,設(shè)計(jì)用于插入服務(wù)器機(jī)架,內(nèi)部用于支持谷歌照片、谷歌云視覺API調(diào)用和谷歌搜索結(jié)果等產(chǎn)品。第一代設(shè)計(jì)于5月在谷歌I發(fā)布。最新一代(第三代)于2018年5月發(fā)布。谷歌聲稱它可以提供高達(dá)100千萬億次浮點(diǎn)運(yùn)算的性能,大約是其第二代芯片的8倍。
谷歌并不是唯一一家為人工智能優(yōu)化的云托管硬件。今年3月,微軟開設(shè)了Brainwave,這是一支用于加速機(jī)器學(xué)習(xí)操作的現(xiàn)場可編程門陣列(FPGA),用于選擇Azure客戶。(微軟表示,這使得其為Bing搜索引擎提供動力的模型的性能提高了10倍。)據(jù)報道,亞馬遜正在開發(fā)一種人工智能芯片,該芯片將加速其Alexa語音引擎的模型訓(xùn)練。
https://venturebeat.com/2019/04/24/microsoft-earnings-q3-2019/
來源:venturebeat