如何管理模擬世界的大規(guī)模測量數(shù)據(jù)
收集更多的數(shù)據(jù)已經(jīng)不能讓您脫引而出,更重要的是誰能夠迅速分清所收集到的數(shù)據(jù)。 在過去,硬件采樣率由于受模數(shù)轉(zhuǎn)換發(fā)生速度的限制,在物理上局限了采集數(shù)據(jù)的數(shù)量。 而如今,硬件已不再是采集應(yīng)用的限制因素。 如何管理采集到的數(shù)據(jù)才是未來的挑戰(zhàn)。
計算技術(shù)的不斷進步,包括了微處理器速度和硬盤驅(qū)動器存儲容量的提高,加之軟硬件成本的降低,引發(fā)了驚人速度的數(shù)據(jù)爆炸。 特別是在測量應(yīng)用中,工程師和科學(xué)家們每分每秒都能收集大量的數(shù)據(jù)。 歐洲核子研究中心的大型強子對撞機的運行實驗每秒鐘能產(chǎn)生40 TB的數(shù)據(jù)。 而波音噴氣發(fā)動機運行時,每隔30分鐘系就統(tǒng)會創(chuàng)建10 TB的操作信息(Gantz,2011)。 這就是“大規(guī)模數(shù)據(jù)”。
大規(guī)模數(shù)據(jù)現(xiàn)象為數(shù)據(jù)分析、搜索、集成、報告和系統(tǒng)維護帶來了新的挑戰(zhàn),只有滿足這些挑戰(zhàn)才能跟上數(shù)據(jù)飛速增長的步伐。 數(shù)據(jù)的來源是多方面的,而工程師和科學(xué)家認為最為有趣的是來自真實世界的數(shù)據(jù), 即捕獲和數(shù)字化的測量數(shù)據(jù)。 因此,它也被稱作“大規(guī)模測量數(shù)據(jù)”,可以通過測量振動、射頻信號、溫度、壓力、聲音、圖象、光、磁、電壓等現(xiàn)象獲得這些數(shù)據(jù)。 大規(guī)模測量數(shù)據(jù)TM在廣泛的數(shù)據(jù)采集領(lǐng)域激起了三大技術(shù)趨勢。
上下文數(shù)據(jù)挖掘
真實現(xiàn)象的物理特性能夠防止在采集速率不夠高的時候采集數(shù)據(jù),讓小規(guī)模數(shù)據(jù)集變得不再可行。 即使測量現(xiàn)象的特性允許更多的信息采集,小規(guī)模數(shù)據(jù)集往往一開始就限制了結(jié)論和預(yù)測的準(zhǔn)確性。
以挖掘一個金礦為例,其中只有20%的黃金是可見的。 其余的80%是存在于您看不見的泥土中。 礦業(yè)的目的就是充分挖掘礦井的全部價值。 這就引出了術(shù)語“數(shù)字塵土”,意思為數(shù)字化數(shù)據(jù)帶有隱藏價值。 因此,需要通過數(shù)據(jù)分析和數(shù)據(jù)挖掘來發(fā)掘前所未有的見解。
數(shù)據(jù)挖掘的過程就是使用與數(shù)據(jù)一同保存的上下文信息,搜索并削減大規(guī)模數(shù)據(jù)集,使其變得更容易管理及利用。 將原始數(shù)據(jù)與背景,或“元數(shù)據(jù)”共同保存下來,數(shù)據(jù)采集、定位、過后的處理和理解就會變得更為方便。 例如,查看一系列看似隨機的整數(shù): 5126838937。乍看之下,該原始信息的含義不得而知。 然而,當(dāng)它變?yōu)?512)683-8937時,我們就能知道清楚地識別出它是一個電話號碼。
測量數(shù)據(jù)上下文的描述性信息提供了類似的益處,它能夠詳細描述指定測量通道的傳感器類型、制造商與校準(zhǔn)日期,或是整體待測組件的修訂記錄、設(shè)計師或型號。 事實上,原始數(shù)據(jù)存儲的上下文越多,在整個設(shè)計生命周期中數(shù)據(jù)追蹤、搜索或定位,以及通過專用數(shù)據(jù)后處理軟件在今后與其他測量關(guān)聯(lián)才會更為有效。
智能DAQ節(jié)點
數(shù)據(jù)采集應(yīng)用的形式多種多樣。 但由于涉及多種行業(yè)和應(yīng)用,只有在需要時才會采集數(shù)據(jù)。 工程師和科學(xué)家們將重要資源投資在構(gòu)建高級采集系統(tǒng)上,但這些系統(tǒng)生成的原始數(shù)據(jù)也不會因此就無用了。 相反,采集原始數(shù)據(jù),將它輸入分析或處理算法,構(gòu)建設(shè)計者所需的實際結(jié)果系統(tǒng)。
例如,汽車碰撞測試在毫秒之間就能收集千兆字節(jié)有關(guān)速度、溫度、沖擊力和加速度的數(shù)據(jù)。 可以從這些原始數(shù)據(jù)計算得出的一個關(guān)鍵性相關(guān)結(jié)論為顱腦損傷標(biāo)準(zhǔn)(HIC),它是單標(biāo)量的計算值,能夠表示碰撞假人在碰撞中頭部受傷的可能性。
此外,一些應(yīng)用程序—尤其是有關(guān)環(huán)境、結(jié)構(gòu)、機器狀態(tài)監(jiān)測空間—能夠保持周期性的慢采集速率,而當(dāng)檢測到明顯的條件時又能大幅提高。 該技術(shù)的采集速度低,且最大限度地減少了記錄的數(shù)據(jù),同時采樣率要足夠滿足應(yīng)用中高速波形的需求。 想要在滿足特定標(biāo)準(zhǔn)時,采用某項技術(shù),如將原始數(shù)據(jù)轉(zhuǎn)化為結(jié)果,或調(diào)整測量細節(jié),您必須使您的數(shù)據(jù)采集系統(tǒng)智能化。
評論