IBM訪談:如何用物聯(lián)網(wǎng)拯救 PM2.5?
人無時(shí)不刻不在呼吸,而動(dòng)輒爆表的 PM2.5,掙扎的霧霾讓我們不禁憂慮起自身的健康來。
本文引用地址:http://butianyuan.cn/article/201611/339849.htm在一年以前,IBM 研究院推出了 Green Horizon項(xiàng)目,雷鋒網(wǎng)此前也做過報(bào)道。Green Horizon 利用IBM的機(jī)器學(xué)習(xí)技術(shù)及物聯(lián)網(wǎng)技術(shù)(IoT),從大數(shù)據(jù)中挖掘從天氣到污染指數(shù)的一系列海量信息,以反復(fù)的迭代及自適應(yīng)的調(diào)整系統(tǒng),鍛造出世界上最為精確的能源和環(huán)境預(yù)測系統(tǒng)。
IBM 首先把試點(diǎn)城市選在了南非的約翰內(nèi)斯堡,與當(dāng)?shù)氐难芯繖C(jī)構(gòu)進(jìn)行協(xié)作。面對不斷惡化的大氣環(huán)境及氣候變化,它們又會(huì)做出怎樣的嘗試呢?日前,駐該機(jī)構(gòu)的 IBM 科學(xué)家 Tapiwa Chiwewe 與 IBM的 Chris Sciacca 進(jìn)行了一次訪談,雷鋒網(wǎng)摘編如下,未經(jīng)許可不得轉(zhuǎn)載。
Tapiwa Chiwewe
Chris Sciacca(下稱 Sciacca):
目前這個(gè)環(huán)境預(yù)測系統(tǒng)進(jìn)行到了怎樣的階段?
Tapiwa Chiwewe(下稱 TC):
此前試點(diǎn)城市能夠成功預(yù)測明天的環(huán)境狀況,不過經(jīng)過我們的努力,能夠?qū)⑦@一時(shí)間延長到七天。
Sciacca:
那么,這個(gè)預(yù)測系統(tǒng)目前達(dá)到了怎樣的精度?
TC:
現(xiàn)在能夠達(dá)到 10 km*10 km 的空間分布率,而如果能增加更多的計(jì)算源,這一數(shù)字還能提升到 1 km*1 km 的高分辨率。
Sciacca:
如果要用預(yù)測結(jié)果做決策,精度要達(dá)到怎樣的水平?
TC:
如果這些判斷要用于決策的話,準(zhǔn)確度能達(dá)到 70% 以上(包括一些明顯的、肉眼可排除的錯(cuò)誤)就可以稱得上是很不錯(cuò)的結(jié)果了。而預(yù)測污染指數(shù)為環(huán)境提供公共預(yù)警信號肯定是大有裨益。
Sciacca:
我們都知道,在一天內(nèi)或者一個(gè)地點(diǎn)中污染物的數(shù)量不可避免地會(huì)存在一定波動(dòng),那么這一數(shù)字與預(yù)測結(jié)果相比存在多少誤差?
TC:
污染情況的波動(dòng)取決于特定的天氣狀況。一些會(huì)造成強(qiáng)烈影響的天氣狀況(如強(qiáng)風(fēng)、降雨、低氣壓等)能夠在幾個(gè)小時(shí)內(nèi)迅速改變污染指數(shù)。而空氣質(zhì)量的預(yù)測主要借助的是天氣模型來捕獲上述容易影響污染狀況的信息并做出調(diào)整,因此誤差的規(guī)模就會(huì)減小很多。
Sciacca:
目前階段及未來,我們是否能準(zhǔn)確判斷污染源?
TC:
污染源對于預(yù)測系統(tǒng)而言是另一個(gè)全新的命題,因?yàn)樗枰獙γ總€(gè)污染源進(jìn)行判斷,包括直接排放量、天氣影響,伴隨化學(xué)反應(yīng)產(chǎn)生的二次污染等。
我們實(shí)際上可以追蹤污染源來自什么樣的地點(diǎn)。但它需要大量的數(shù)據(jù)源模型,且不能包含目前的試點(diǎn)。不過它可能是未來商業(yè)化的一個(gè)變現(xiàn)手段。另外,風(fēng)是一個(gè)比較簡單的判斷因素,如果我們只考慮污染物的飄散狀況,這個(gè)模型就會(huì)相對簡單。
Sciacca:
要讓這個(gè)系統(tǒng)順利運(yùn)轉(zhuǎn),我們需要什么樣的支持?
TC:
實(shí)時(shí)傳感器的數(shù)據(jù)當(dāng)然必不可少。日常的天氣預(yù)測可以以三天為界,并通過在線站點(diǎn)進(jìn)行分析與整合。
Sciacca:
數(shù)據(jù)的來源是什么,又是如何進(jìn)行收集的?
TC:
數(shù)據(jù)源于三個(gè)南非的空氣監(jiān)測網(wǎng)絡(luò),為約翰內(nèi)斯堡、Thswane及瓦爾河監(jiān)測中心。在三個(gè)網(wǎng)絡(luò)點(diǎn)間,有 21 個(gè)監(jiān)測站,按照南非空氣質(zhì)量數(shù)據(jù)中心的要求收集數(shù)據(jù)。我們準(zhǔn)備將這一功能增加到 IBM 的 The Weather Company 商業(yè)計(jì)劃中。
Sciacca:
是否能為我們解釋一下采用 PM10、PM2.5和二氧化氮這三個(gè)指標(biāo)的原因?可否簡單理解為,這三項(xiàng)為最“簡單粗暴”的判斷標(biāo)準(zhǔn)?
TC:
在監(jiān)測之時(shí),那些容易對人類、野生動(dòng)植物及環(huán)境的健康造成影響的污染物自然首當(dāng)其沖。南非通常每五年就會(huì)重新制定一次空氣質(zhì)量管理計(jì)劃,明確首要關(guān)注的污染物,考慮所可能造成的危害,對干預(yù)策略的有效性進(jìn)行判斷,以控制空氣污染。
Sciacca:
約翰內(nèi)斯堡的哪些信息能夠作為數(shù)據(jù)源?
TC:
數(shù)據(jù)的質(zhì)量會(huì)以多種形式從不同站點(diǎn)收集,包括讀數(shù)記錄、采樣間隔的時(shí)間、還有讀數(shù)的準(zhǔn)確性。這些都受監(jiān)測站設(shè)備維護(hù)狀況的影響。
Sciacca:
后續(xù)將有什么研究計(jì)劃?
TC:
除了收集更多的數(shù)據(jù),我們計(jì)劃推出API,開發(fā)人員能夠基于此創(chuàng)建為消費(fèi)者和企業(yè)使用的應(yīng)用程序。
如果你對他的研究感興趣,歡迎閱讀他的論文:Machine Learning Based Estimation of Ozone Using Spatio-Temporal Data from Air Quality Monitoring Stations
評論