智慧製造2020.01.07

Database 資料庫祕藏寶庫別有洞天

飛飛

物聯網 雲端服務 創新

物聯網說穿了,資料庫三個字成金庫。

 

物聯網說穿了,資料庫三個字成金庫。

 

三個字看起來好簡單,但是如何讓金庫變聚寶盆,而不只是當裝飾的珠寶盒、也不致於變成蜘蛛結網的儲藏室,那就成了一門有深度的學問。物聯網的祕藏寶庫,看不到也摸不到,因此如何有效管理及取用Database 內的資料金幣,就是將寶物變現的祕訣。在管理方面,包括:Database 的建置、資料的存放與保護、節能省電等考量;資料庫的規劃愈完善,也就愈助益於效率管理,不但能以資源經濟的方式存放資料內容,也能更輕鬆方便地存取資料內容。至於資料取用層面,正確、精準地取用適足資料,亦足以影響最終資料運算,乃至終極決策;然而,不光是品質方面的正確、精準,目標正確下還需取用所有符合的資料,既不錯多也不漏少,才能具備獲得後續運算效益的前提。

 

過往電腦專屬設置時代,資料庫的連結具孤立性,其延伸至多及於限定的區域性,因此資料來源侷限,資料內容也相對簡易,多半以數據、文字為大宗。 5G物聯網所面對的資料流,來自四面八方,資料內容也將是Content 相對爆增的時代,因此,Database 的管理及取用顯然面臨新的挑戰。

 

IoT 資料運用

 

Relational Database 關聯式資料庫,是早於 50年前即問世的資料庫技術,及至目前為一般產業界普遍採用的資料庫技術。其關鍵字「關聯式」也就是透過縱橫交叉的矩陣式資料存放,賦與每個單元資料具相互關聯性,例如:直排具「客戶名稱」的定義/屬性,橫列則為「每次購買數量」的實際數值,兩個資料單元即具可相互參照的Relation,並可為「客戶名稱」或「每次購買數量」等不同的主要關鍵字檢索,像是:「客戶 A 的所有購買數量」、「每次購買超過5 (個)的客戶名稱」等;當使用者欲取用資料庫內資料時,從而能基於自身需求所連結的條件,例如:業務端為「產品A」+「購買數量」的結果;財務端為「產品A」+「Q1」+「購買金額」等,檢索所有縱橫矩陣列資料結構內的關聯性資料。這就像是直接連結所有Excel 表格,據以檢索出符合特定條件的資料值,而不是每次都針對檢索條件,重新製作新的關聯性表格。如此,資料庫內的資料就可透過關聯性連結而靈活運用,實現經濟儲存空間、效率取用資料。

 

Structural Query Language 為關聯式資料庫管理及資料操作的標準溝通語言,以查詢/取用、插入、更新及變更資料。SQL 作為資料庫之間的通用標準語言,其指令可跨越各式各樣關聯式資料庫儲存格式所構成的障礙,作為資料庫連結的溝通介面。美國國家標準協會所提供的ANSI SQL 雖說是常見的SQL,目前也已有許多延伸開發的SQL,如:MySQL/SQLite database。

 

MQTT(原為 Message Queuing Telemetry Transport的縮寫;如今國際標準已直用MQTT)適用於OT現場M2M 通訊傳輸,目前已為OASIS國際標準。MQTT能夠處理資料最前線 Sensor的訊息交流,最主要就在於其低頻寬、低耗能特點,足以回應IoT時代OT現場作業條件。

 

Real-time 實時是 5G物聯網其一重點。實時代表的不僅是資料蒐集,回傳資料庫;也同時取用Database 的資料,用以判斷與決策互動回應,無論Database是指Edge邊緣裝置所屬,還是匯流回Cloud 雲端。由此不難預見,OT-CT-IT 之間的資料流順暢關鍵,絕不是裝上 5G高速通訊就足以了事;前端感測裝置的資訊交流(如MQTT)、傳輸交予後端Database(如SQL),而後Database 儲存、管理、保護等(如關聯式資料庫)都是確保辛苦取得資訊,獲致妥善安排的必要考量。此外,反向取用Database內資料值,傳輸予OT現場運用也將至為重要。尤其Real-time擷取資料中,時序是其一重要檢索依據,然而在取用已儲存的資訊時,檢索條件不一定納含時序,像是:「所有成年男性顧客」+「特定廣告播放」+「特定時段優惠折扣」等;但在大數據分析中,需求關於「所有7:00 – 9:00時段進門的男性顧客」+「購買的咖啡品項」,如此則時序成了資料檢索的首要依據;前述就是同一矩陣資料,活用於存、取之間相異檢索的資料群運用例子。

 

物聯網賦活資料庫內的資料

 

資料庫 Database 過往使用,一直偏向於單地存取,其存取用途亦相對單純,基本上就是透過我們人經電腦的軟體/網頁介面交流;然而,資料沒拿來用時,金幣也不過是塊鐵,還是佔用空間的鐵塊存貨,最終花錢養蜘蛛也不意外。隨著 Cloud - Edge 所構成的物聯資訊交流結構,再加上 Big DataAI 演算機制,某種方面可說是賦與資料本身自動化機制,也就是賦活 Database 內的資料,更活化運用過往沒有人類手動就只能死氣沈沈地默默沈睡於Database 的資料內容。廣泛觀之,這個物聯機制的賦活良方就在於Relation 關聯;同時,從另一角度而言,關聯性也可說是AI演算機制的本質 - 透過演算找出資料之間的關聯性;而正是資料值彼此之間的關聯性,成為賦與資料意義的關鍵所在,不管這樣的本質是透過AI演算取得,還是從資料本身定義/屬性取得,或者更可說是兩者相互作用的深度關聯。經賦活而顯其意義後的資料,就像是流通的貨幣,成為具實質價值的金幣,而不再只是金屬鐵塊。同樣一筆錢可以代表三把葱,也可代表一個紅豆餅,因此同筆資料當然也可透過各種不同意義賦與(關聯性),顯現各種價值,像是:在早晨買拿鐵的成年男性顧客 vs 刮鬍刀廣告潛在客戶的成年男性顧客

 

我們常常說,頭腦久不用就會生鏽,而資料庫等同我們的大腦,亦為同理。物聯網即為活化資料庫,增值資料價值的自動化機制。

 

延伸討論

智慧製造

互通性Interoperability為物聯關鍵

飛飛
萬物相聯透過 Embedded SBC連結,看來捷徑現成,一切觸手可及。事實上,Embedded SBC 不只是在既有資料流處理單元上,加上感測器、無線通訊就足以實現物聯,其中的Interoperability 互通性還是 Embedded SBC成為實現物聯網新星的無形魅力。
智慧製造

Visual Cloud/CDN網路界的出版發行人

飛飛
Bill Gates 早於20年前即言「Content is King」,如今Content、Content、Content……這個無處不見的字眼,毫無疑問就是物聯網時代的當紅炸子雞。