智慧製造2019.07.02

資料怎麼用?從 大數據 直到 AI 、ML

飛飛

物聯網 雲端服務 機器人

 

我們實體世界身處三維空間,時問軸為一條只能向前、無法倒轉的線性指標。如此,過往曾發生的種種只剩殘缺不全的記憶、未來可能發生的種種也只能憑藉預測。資料學的起源發展可說是在此種時空背景下,試圖構建從過去到未來的索驥。

 

在這眼下資料處理技術發展的關鍵時點,也可以說是從過去的歷史性資料分析,進階到未來預測準確性。

 

過去

 

歷史性資料不具備時效急迫性。IT 技術以人工紀錄當下發生的事,事後再輸入如電腦的資料處理專用裝置,累積建立資料庫;而後應用軟體,透過預設函式,產出統計數據、圖表, 用以瞭解過去經驗的概括性描述,歸結出指標性意義,供決策者評估過去經驗、未來可能趨勢及應採取的管理方法等因應之道。CRM 軟體即是一例,具客戶關係管理的目標,並以跨部門、資訊管道為資料來源,歸結出統計數據,用以改善先前憑業務經驗、分散各處的資料、小道消息等碎瑣資訊據以決策所可能產生的缺失,如:片面印象、個人偏好。

 

現在

 

物聯網概念的核心,就在於廣域性實時收集發生於現在的事,即時匯流於過去的歷史性資料庫,擴展資料原料的維度、廣度、時效性;並透過資訊 IoT、Edge Computing ,實時回應現在發生的事,將以往由軟體處理「過去的事」,轉為雲端系統處理「現在的事」,一改事後補救的缺憾,實現當下回應、修正。

 

大數據

所謂的 Big Data 不只是資料在質與量的大幅改善,也包括資料的爬梳。

受惠於網路建構愈越成熟,資料庫不限於過往孤立資料流軟體時代的內部資料,也囊括社群、法規機構、新聞、供應鍊生態系、相關電郵等透過物聯體系所匯入的外部資料,增進資料廣度。

隨著 IT 躍入物聯網實時收集資訊,資料量突破過往重點式單次資訊,可預見具時間上的密集連續性,從而伴隨巨量資料流。量度方面的增進,可改善過往以管窺天,轉為空中鳥瞰式透視資料,描繪出更深度立體清晰度的全貌。

  • 爬梳

資料的清理、結構化及整合,整理資料原料為具結構性的資訊面貌,以洞察巨量資料裡的有用資訊。

 

Data Mining

資料探勘的重點在於根據大數據的資料庫,從不同面向挖掘資訊傳達的(有意義)訊息,譬如: IIoT 裡,以零件故障影響因素為出發點,透過零件故障 vs 作業環境的可能相對關係;零件故障 vs 作業方式的可能相對關係等各種在資料間所潛藏可能成立的諸多有意義模式,並經綜合判斷,進而評估出零件故障發生時點的構成因素。

 

未來、未知

 

演算法是綜合資料依據,對未來或未知的預測。最古早的演算法,或可以星象學占卜為例,透過星像 vs 人類社會變化,試圖預測將來可能的變動;或是農民曆,經由節氣 vs 雨水/溫度,據以估測年度收成。現代演算法則藉由精準數據、廣泛資料來源,並能持續反饋於端大數據,實現永續性傳承。

 

Artificial Intelligence

人工智慧即是試圖映照人類思考於演算機制,透過類有機成長的智慧發展, 降低誤植又低效率人工手動與運作的機會與比例,達成綜合歷史資料庫、實時資料流,經大數據、資料探勘後所得演算法,自動即時判斷後產出;並能融匯當下發生的事,預測未知可能情況。

針對實時資訊,比對預設條件及產出的演算法,實時回應未來變化。

例如:智慧零售所使用 Kiosk,經由演算設定影像辨識出女性,即播放女性用品廣告。

  • 深度 AI

基於淺度 AI,具自動 Data Mining 的能力,並據此自動改善演算法,進而改變未來的互動關係。

例如:原本是偵測到行人即變化號誌證;經三個月資料收集後, 歸結出特定時間均有固定行人出現,即自動調整所有相關路口的號誌時相頻率,順暢交通。

 

 AI 賴以憑斷的僅為資料庫所建立經驗法則,然而人類則不僅具推理能力,還具想像力,也不受經驗法則拘束。

 

機器學習

Machine Learning 則為透過經驗累值,自動修正的演算能力。目前最為人知的即為圖像辨識、語言翻譯。ML 為 AI 的核心關鍵能力。機器學習是圖像資料運用的另一里程碑,而圖像辨識能力也標註著 AI 的其一特點。

 

AI 建構於大數據的基礎上、演算法也與 Data Mining 息息相關。而大數據的資料來源,未來將有大半取決於 Sensor 感測器裝置所得取的資料原料。這就像我們人類骨架為我們外形體現的關鍵所在,資料原料的取得本身也將成為開啟往後智慧良窳的宇宙大爆炸起點。

延伸討論

智慧製造

Edge AI 準備好了,創意商機起飛

飛飛
在軟體作為使用者介面的時代,軟體是為大量生產的現成品。使用者以既有功能為工具,或解決問題;或協助工作;或實現自我創意。使用者回饋通常透過日後不定期的更新、迭代或新產品才將之納入。換句話說,軟體的設計仍偏向開發端決定。物聯網不只是物物相連,其中 AI 智慧可說是直接邀請參與者加入軟體設計,並透過經驗值自動達到持續客製化,以建構資料流的相對低廉成本(長期遞減)方式,提供以個別使用者為中心的可客製化產品。
智慧製造

AIoT 資料流生態系, Edge AI 上場了!

飛飛
AI 的關鍵核心在於 Machine Learning 機器學習,尤其是 Deep Learning 深度學習,將機器運算層次從線性思維走向立體化處理,變革資料處理的機器運算概念,更從而徹底改變自 IT 產業堀起以來將近百年的基礎運算硬體組構,並連帶物聯網的願景,自此硬體組構衍生全新 AIoT 資料流生態系。在如今 5G 規格底定、全球邁入正式開通的時點上,AIoT資料流生態系也已經從 Cloud AI 延伸到 Edge AI。
智慧製造

I/O 也能虛擬化?

飛飛
Virtualization 是 IT 資源擴展的新興潮流;透過 isolation 隔離技術,能夠在相同的 IT 實體資源下,增生多套虛擬運作環境,相當適合雲端系統,也能在成本考量下,回應物聯網所可預見爆增需求的資料流及運算資源。