近日,中國科學院重慶綠色智能技術(shù)研究院大數(shù)據(jù)挖掘及應用中心研究團隊在時間序列的多粒度預測模型的研究方面取得進展,相關(guān)研究成果發(fā)表在Chemometrics and Intelligent Laboratory Systems 和Neurocomputing上。
具有不確定性特征的數(shù)據(jù)集一直以來都是數(shù)據(jù)挖掘領(lǐng)域的難點和熱點問題,傳統(tǒng)的時間序列預測模型幾乎都是采用數(shù)據(jù)填充等不確定性的方法處理不確定性數(shù)據(jù)集,這使得這些模型在許多領(lǐng)域得不到預期的預測精度。大數(shù)據(jù)挖掘研究團隊通過分析不同領(lǐng)域的時間序列數(shù)據(jù)的共同基本特征,以粒計算理論為基礎(chǔ),分別建立了基于水平?;▽傩粤;┖痛怪绷;颖局盗;┑亩嗔6戎R空間,然后結(jié)合模糊時間序列預測、時間序列近似周期和粒子群優(yōu)化算法等,提出了兩種時間序列的多粒度預測模型。該模型通過在不同粒度層次上的切換,實現(xiàn)了以確定性方法處理不確定性數(shù)據(jù)集的構(gòu)想,并且在“臺灣加權(quán)股票指數(shù)(TAIEX)”、“城市失業(yè)率”等經(jīng)典的時間序列預測數(shù)據(jù)集上的模擬實驗中獲得了高精度的預測結(jié)果。另外,在三峽庫區(qū)長江干流的水質(zhì)預測模擬試驗中表明,該模型完全可以適應三峽庫區(qū)復雜的時間序列水質(zhì)預測,為庫區(qū)的水質(zhì)預測預警提供依據(jù)。
該研究得到國家科技重大專項“水體污染控制與治理”(2014ZX07104-006)的資助。
標簽:
相關(guān)資訊