大數(shù)據(jù)時(shí)代,讓行業(yè)分析的精度達(dá)到了一個(gè)新的高度,也為行業(yè)的精細(xì)化管理提供了前所未有的便利條件。供水行業(yè)在大數(shù)據(jù)的應(yīng)用方面似乎滯后于一些行業(yè),但并不阻礙供水行業(yè)對(duì)大數(shù)據(jù)的開(kāi)發(fā)和向往。
《凈水技術(shù)》小編了解到,作為智慧城市的先行者之一,上海近年來(lái)在大數(shù)據(jù)的分析方面開(kāi)展了一些工作,并采用多種模型工具進(jìn)行探索和應(yīng)用。運(yùn)用大數(shù)據(jù)工具,目前上海城投水務(wù)集團(tuán)一方面能夠每天能夠?yàn)橄螺牭?1個(gè)供水所提供未來(lái)3天的供水量預(yù)測(cè)日?qǐng)?bào);另一方面也能用長(zhǎng)期水量預(yù)測(cè)模型做年度的月水量計(jì)劃。
本文為概述,上海城投水務(wù)集團(tuán)在供水水量大數(shù)據(jù)分析的具體工作成果請(qǐng)持續(xù)關(guān)注《凈水技術(shù)》本年度發(fā)表的相關(guān)原創(chuàng)論文。
隨著通信技術(shù)的不斷進(jìn)步,以及業(yè)務(wù)系統(tǒng)的建設(shè)升級(jí),國(guó)內(nèi)各大水司的信息化水平不斷提高,累計(jì)的各類(lèi)業(yè)務(wù)數(shù)據(jù)越來(lái)越多,數(shù)據(jù)規(guī)模及質(zhì)量不斷提高,數(shù)據(jù)統(tǒng)計(jì)分析能力進(jìn)一步提升,數(shù)據(jù)對(duì)業(yè)務(wù)的支撐作用也越來(lái)越強(qiáng)。但是隨著水司對(duì)數(shù)據(jù)分析要求的不斷增強(qiáng),以及現(xiàn)階段水司內(nèi)部單一的業(yè)務(wù)數(shù)據(jù)及基礎(chǔ)的分析工具,對(duì)于將來(lái)實(shí)現(xiàn)智慧供水的目標(biāo)還存在距離,所以我們開(kāi)始重新思考如何豐富數(shù)據(jù)類(lèi)型和如何利用新工具實(shí)現(xiàn)目標(biāo)。
智慧供水的目的是希望決策能像人腦一樣,而我們知道人腦在決策之前首先要同時(shí)感知身體內(nèi)部和外界環(huán)境的信息,然后經(jīng)過(guò)人腦內(nèi)部上億個(gè)神經(jīng)元的計(jì)算分析后得出結(jié)果,同樣如果未來(lái)要實(shí)現(xiàn)智慧供水,利用外部數(shù)據(jù)和先進(jìn)的分析工具必不可少。
上海作為國(guó)內(nèi)智慧城市建設(shè)先試先行的城市,現(xiàn)今已經(jīng)取得了一定的成果,其中城市公共數(shù)據(jù)免費(fèi)開(kāi)放的力度不斷加大,供水作為城市服務(wù)的關(guān)鍵一環(huán),與電力、交通和旅游等其他社會(huì)服務(wù)息息相關(guān),相互之間有很強(qiáng)的關(guān)聯(lián)性,而這些行業(yè)數(shù)據(jù)可以為水司服務(wù),豐富數(shù)據(jù)維度,增強(qiáng)內(nèi)外部聯(lián)系,加深水司對(duì)用戶行為理解。
一
大數(shù)據(jù)下的供水量影響因素
以供水量的預(yù)測(cè)為例,首先市場(chǎng)上產(chǎn)品和服務(wù)的價(jià)格一定會(huì)對(duì)用戶用量產(chǎn)生直接的影響,例如對(duì)于家庭每天都會(huì)用水清洗蔬菜水果等食品,而這些食品的價(jià)格的波動(dòng)會(huì)決定居民采購(gòu)數(shù)量的波動(dòng),進(jìn)而影響供水量的波動(dòng),下面是消費(fèi)者價(jià)格指數(shù)和居民供水量的曲線圖,我們發(fā)現(xiàn)消費(fèi)者價(jià)格的變動(dòng)與居民供水量的變動(dòng)呈現(xiàn)相反的趨勢(shì)。
(藍(lán)線為居民供水量曲線,橙線為消費(fèi)者價(jià)格指數(shù))
進(jìn)一步比較水產(chǎn)品價(jià)格和居民供水量發(fā)現(xiàn),二者的相反趨勢(shì)更加明顯。
(綠線為水產(chǎn)品價(jià)格,藍(lán)線為居民供水量)
季節(jié)、氣溫和節(jié)假日的變化也會(huì)對(duì)供水量的變化產(chǎn)生深刻的影響,下面這張曲線圖清楚的描繪了這些變化,夏季是用水高峰期,國(guó)慶和春節(jié)小長(zhǎng)假由于人口凈流出較多出現(xiàn)短期的用水低谷。
用戶用水一般會(huì)伴隨著用電,比如居民做飯洗澡,加工制造企業(yè)產(chǎn)品生產(chǎn)等,總用電量、第一產(chǎn)業(yè)、第二產(chǎn)業(yè)、第三產(chǎn)業(yè)和城鄉(xiāng)居民的用電趨勢(shì)與用水趨勢(shì)基本一致。
上海作為國(guó)際化大都市每年都會(huì)吸引全球各地的游客前來(lái)旅游,這部分游客也會(huì)對(duì)供水量產(chǎn)生影響。
除了上述舉例,對(duì)居民用水量產(chǎn)生影響的因素還有很多,從時(shí)間的角度看,CPI指數(shù)、PPI指數(shù)、氣溫、溫差、空氣質(zhì)量指數(shù)、節(jié)假日等因素影響較大,我們還發(fā)現(xiàn)每個(gè)月開(kāi)什么花也和供水量有一定的相關(guān)性,比如上海3月份櫻花盛開(kāi),居民會(huì)外出賞花,這些活動(dòng)會(huì)造成餐館人數(shù)的增加,從而影響了供水;從空間的角度看,工廠、餐館、商場(chǎng)、景區(qū)等場(chǎng)所的位置分布也會(huì)影響供水量。
二
大數(shù)據(jù)下的水量預(yù)測(cè)模型工具探索
隨著外部數(shù)據(jù)量的增加以及計(jì)算難度的提高,傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)工具(例如excel)可能無(wú)法實(shí)現(xiàn)要求。近幾年,隨著python編程語(yǔ)言的崛起及算法模型的發(fā)展,數(shù)據(jù)分析的門(mén)檻不斷降低,普通人也能通過(guò)一段時(shí)間的學(xué)習(xí),很快實(shí)現(xiàn)復(fù)雜的數(shù)據(jù)分析運(yùn)算,例如多維度數(shù)據(jù)間的相關(guān)性分析,非線性回歸分析等。
Python編程語(yǔ)言作為一種面向?qū)ο蟮慕忉屝跃幊陶Z(yǔ)言,具有簡(jiǎn)單、易學(xué)、速度快、可移植性高和具有豐富的庫(kù)等特點(diǎn),越來(lái)越受到人們的重視和使用;機(jī)器學(xué)習(xí)模型是一種高效的數(shù)據(jù)分析算法,可以通過(guò)Python語(yǔ)言一步導(dǎo)入進(jìn)行數(shù)據(jù)計(jì)算,免去了復(fù)雜的編程過(guò)程,對(duì)于沒(méi)有計(jì)算機(jī)編程基礎(chǔ)的人員有很好的適用性。
利用上海市公共數(shù)據(jù),通過(guò)Python語(yǔ)言進(jìn)行編程建模取得的水量預(yù)測(cè)模型已經(jīng)在日常工作中得到了初步使用,可以實(shí)現(xiàn)短期、長(zhǎng)期的水量預(yù)測(cè),也可以根據(jù)業(yè)務(wù)要求實(shí)現(xiàn)特定類(lèi)型的水量預(yù)測(cè),具體應(yīng)用情況如下:
1、未來(lái)每天和每小時(shí)短期供水量模型,相對(duì)平均誤差分別為1.5%和1.9%,主要用于根據(jù)未來(lái)短期內(nèi)水量變化情況,為供水調(diào)度提供數(shù)據(jù)支撐。
2、未來(lái)每月長(zhǎng)期水量預(yù)測(cè)模型,相對(duì)平均誤差為2.4%和2.5%,主要用于未來(lái)長(zhǎng)期用水量計(jì)劃制定。
3、邊界流量?jī)x水量預(yù)測(cè)模型,相對(duì)平均誤差為3.0%,主要用于修正流量?jī)x非正常工作狀態(tài)下計(jì)量的水量。
今后隨著技術(shù)的不斷成熟,我們可以縮小供水范圍,例如利用預(yù)測(cè)結(jié)果控制小區(qū)的供水量,實(shí)現(xiàn)供水的精細(xì)化調(diào)度;還可以將這種方式應(yīng)用于水質(zhì)、水壓等數(shù)據(jù)分析中,發(fā)現(xiàn)數(shù)據(jù)之間的相互關(guān)聯(lián)程度,從而逐步打通數(shù)據(jù)孤島,實(shí)現(xiàn)智慧供水。
本文 作者:高赫余 王圣 吳瀟勇
本文 采編:《凈水技術(shù)》雜志社 阮辰旼
排版:張蕾
校對(duì):黎翔