智慧製造2019.09.10

新世代核心處理 AI Accelerators 創意玩

飛飛

機器人 物聯網 創新

 

AI Neural Network 所開啟具里程碑指標的Machine Learning / Deep Learning,將電腦功能從單純資料處理協助工具,帶入全面擬人化小助手的新境界。 與此同時,在其螢幕背後的核心計算機資料處理概念及體系,也開始全面解構,搖身成為如同新境實戰王國電玩遊戲的創意競逐遊樂場。

 

類神經網路改寫了計算機資料處理,使得資料透過層遞與累進處理,實質提升為可經 training  而具決策/推理的處理能力;也等於是賦與資料具維度特性的進階運算方式,譬如: 影像演算 CNN,以 Matrix 概念解讀影像畫素;Natural Language Processing 演算 RNN,以遞進概念解譯文字,都促使資料處理,從線性躍為涵蓋 3D 維度縱橫交錯的數據量。因此,過往 Central Processing Units 的傳統序列資料處理就成了必然變革的關鍵點。再者,物聯網實務應用下,從 Sensor、Image、NLP 直到預測/決策的 Algorithm 演算,不但都務求 Low-latency ,還可能成了同時運用的綜合性功能(譬如:3D AR 卡通人物,還將開口與觀眾對話;或是透過影像照片解譯文字等),才能因應動態環境下的人我互動,進而在資料流量於透過維度側寫實境而爆增的情況下,再增添實時的時間因素。

 

AI Accelerator 即是如此背景下,作為支援 CPU 運算效能與負荷的 AI-focused 核心運算處理工具,主要分攤(A)NN 的資料處理,其中包括:Sensor fusionFacical/ Ojbect Detection/Recognition、NLP(如 intent extraction 或是 semantic parsing)、Machine Vision 等 。

 

Microprocessor 中,其核心運算處理包括:

解讀 INSTRUCTION ->找到 RAM 暫存記憶 的 address 位址 -> 提取 address 裡的 value  ( DATA ) ->針對所提取資料進行運算,而後獲得結果;並週而復始地執行使用者下指令後所需的運算處理。

 

傳統上,CPU 採簡單的序列作工即可應付我們所熟知的單純資料處理:即每一次循序完成上述流程後,再進行下一次的運算。然而,序列作工代表著上述流程中,先完成的程序譬如「解讀 INSTRUCTION 」必須等待後序程序如「提取 DATA」以至最終完成運算處理的閒置時間。因此, 對於 AI 維度導向資料運算處理,着眼 INSTRUCTION 及 DATA 兩個流程元素,出現 MIMD、SIMT、MIMT等多種運算處理流程,可以解讀一次指令後,先一次提取所需資料,再一次全部運算處理;也可以並行多重指令、以多緒並行運算處理等各種流程安排。除此之外,目前也有從 CPU 主流選擇以一維陣列數據資料量為單次資料處理單位的 Vector Processing 向量處理;或是GDP / NVIDIA 所採用以單一數據為單次資料處理單位的 Scalar processing 純量處理等各有觀點的資料處理概念,直到新近發展出 General Purpose GPU 、Vision Process Units 專攻機器視覺等各具特色與專用的核心運算處理工具,促使市場上羅列形形色色的創新 AI Accelerator,創意、優勢、用途等各有巧妙。

 

從上述的運算處理流程,我們可知核心處理效能不僅在於運算的表現,如:Floating Point Data 浮點數運算量, 還包括:與 RAM 暫存記憶之間的 interconnection 順利程度或延遲性等效果、溢量運作等情況所需的 auto error correction,或是 Power Consumption  耗能等相關因素。過往大多側重簡單運算的純資料處理層面,如今光是單個物件偵測、語音辨識,或是推理演算等所需的資料處理已是維度導向的爆量 0 與 1 串列,以致即使是些微差異的作工流程,都將因 DATA 資料流量的膨脹而有著倍數級甚至指數級的差異,那麼無論是作工時間、耗能等也將具有感差異。

 

AIoT 的物聯資料處理具分流專用特性,有的優先注重低延遲性,如:開刀房、機器協作等;也有的著重高量資料處理,如:Cloud AI 的 training 機制,AI Accelerator 不僅在於支援 CPU,也具分工專業的差異效能顯現,這些都將透過終極的核心運算處理機制變革而實現。不僅是上述 INSTRUCTION 指令 vs DATA 資料之間的流程變異,還有 Cache 記憶存取、I/O 等各個元素的創意發揮;而這些元素的變動其實相互箝制,畢竟在有限物質體積與空間,還有無形的流程、條件制定等前提下,如:實時、瞬間高量資料流等效能顯現之間,所求取的是最適平衡點,而非僅止於追求各自極限。眼前不僅摩爾理論已達極限的晶片製程,觸動了晶片設計創新變更的必要與必然;衝勁最強而有力的 GDP / NVIDIA 亦始終不諱言以完全取代 CPU 功能為長遠目標。無可質疑的是,更多創意玩將帶來更多無限可能,令人期待。

 

延伸討論

智慧製造

AI Chips 口味眾多,混搭聯名時尚風

飛飛
隨著通訊市場進入 5G 開通初始階段,AI 市場的發展也愈發如火如荼。AI Accelerator 的競爭朝向從硬體到軟體/軟體到硬體建構出完整的 OT-CT-IT 生態系。這也就是說,如:NVIDIA、Intel 等硬體商,開始發展自身的 AI Instance;而像 Google 這樣軟體起家者,則反向跨足 AI Chip 硬體。相對的,有道是現成的最好用,因此如 NVIDIA 用上了可謂 AI 生態系競爭對手的 Tensorflow 框架;或是 Google Clouds 反之用上了 NVIDIA 的 GPU;或者像 Intel 直接採取併購策略。可以說,不僅是 AI 晶片發愈多元,AI 生態系更是混搭聯名現正夯。
智慧製造

AI Mobile Robots 腦袋裡都裝些什麼?

飛飛
自主移動的兩大關鍵字:決策、動態。決策的前提在於具備適足條件,據以評估而後反應/作動。想像一下如植物固定不動的視角,對環境的感測也就自然是以自我為中心的絕對位置。要達成如動物般自主移動,其視角的空間感就因距離、方向而更偏重於相對位置,因此其決策所倚賴的適足條件也就從感測提升到 Interference 推理、Alogirthem 演算層次的空間測距、視覺辨識、經驗累積值等綜合性訊息處理。
智慧製造

Mobile Robots 愈來愈聰明 從搬貨、偵察到自駕樣樣行

飛飛
《我是傳奇》(I am legend)裡, 「瓦力」(WALL-E) 是地球一片廢墟中倖存的 Mobile Robots。即使觸目所及不見人類,瓦力依然持續忠貞執行廢棄物清理、打包、堆棧工作。不僅如此,瓦力還具高度自主等級的自我修復能力,從懂得如何為自己充電到拆卸其他同型失效 Mobile  Robots 的零件做為己用,可說是目前機器人產業裡持續追求的 Mobile Robots 完美原型。