【摘要】隨著大數據時代的到來生態環境大數據給生態環境領域研究帶來了新的機遇與發展。本文回顧了生態環境大數據在收集、監測、分析與應用方面的發展現狀。雖然生態環境大數據研究相對于其他領域起步較晚,但是目前正處于蓄勢待發的狀態。生態環境大數據研究未來的發展趨勢為:一、建立數據共享機制;二、需要跨區域的不同監測站點甚至不同觀測網絡進行聯合觀測與研究,建立從樣地到區域甚至到全球多尺度的、系統的觀測與研究,并且應該推進觀測的標準化和規范化,進一步統一不同生態環境觀測網絡的觀測標準,建立國際統一的觀測標準和規范;三、需要開發針生態環境對大數據的統計分析軟件,尤其應該重視地理信息技術與統計分析技術的結合,特別是過程模型與大數據的結合。最后,雖然生態環境大數據的應用研究相對薄弱但未來的發展空間是巨大的,未來生態環境大數據的應用主要應該體現在生態環境資源管理、生態環境動態監測、生態環境評價等方面。
關鍵詞:生態環境大數據;發展現狀;趨勢
1前言
20世紀后半葉以來,伴隨著社會經濟的高速發展全球生態環境問題日趨嚴重。目前全球生態環境問題突出表現在環境污染、土地退化、森林銳減、生物多樣性喪失、水資源枯竭以及氣候變化等方面。而這些問題往往是時間跨度長、涉及部門廣、過程復雜、驅動因素眾多,因此解決起來難度很大。現代社會面臨的生態環境問題首先源于生態系統的內在復雜性,它不僅與地球科學(如地理學、水文學、海洋學、氣象科學等)有密切的聯系,還涉及數學、經濟學、信息科學等學科。生態環境問題正跨越局域尺度擴展至全球尺度,這些都促使生態學家們在更大的時空尺度、更多的領域收集數據,進而完成更為復雜的分析[2,3,5]。隨著大數據時代的到來,生態環境大數據將帶給生態環境研究領域帶來新的機遇與發展。
2生態環境大數據的定義及特點
2.1大數據與生態環境大數據的定義
維基百科(http://en.wikipedia.org/wiki/Bigdata)對大數據的定義為:大數據是指利用常用軟件工具捕獲、管理和處理數據所耗時間超過可容忍時間的數據集。國際前沿學術期刊《Nature》于2008年出版有關大數據的專刊并將大數據定義為:大數據是指數據集的規模是無法在可容忍的時間內用目前的技術、方法和理論去獲取、管理、處理的數據[5]。作為第一家信息技術研究和分析的GartnerGroup公司在2012年提出大數據的定義為:大數據是高容量、高生成速率、種類繁多的信息價值,同時需要新的處理形式去確保判斷的作出、洞察力的發現和處理的優化[9]。目前關于大數據,人們更多從商業、社會經濟、信息技術和數據特征等角度來描述,綜合當前國內外各類關于大數據的定義,可以這樣理解,大數據是指通過傳統技術手段難以有效收集、處理和應用的大而復雜的數據集。根據以上大數據的概念可見,大數據之“大”是相對的,是以傳統數據為參考的,因此各個領域在界定大數據時沒有絕對的標準。
此外,大數據之“大”不僅體現在數據量的大,也包括數據的高度復雜性,這包括數據來源與構成的多樣性、數據流動的快速性(如實時更新)和數據質量的不確定性。隨著大數據時代的到來,生態環境大數據的概念在學術領域和政府部門開始流行,但和大數據一樣,目前還沒有統一的定義和界定標準。生態環境大數據是大數據的一部分,是指生態環境領域所涉及的各類大數據,其具備大數據的一般特征。因此按照大數據的定義,生態環境大數據是指通過傳統技術手段難以有效收集、處理和應用的大而復雜的生態環境數據集。
2.2生態環境大數據的特點
生態環境大數據作為大數據的一個類別同樣具有五大特征:數量大(Volume)、種類多(Variety)、價值大(Value)、快時效(Velocity)、準確性(Veracity)。具體體現為以下幾點:首先從數據規模和類型來看,生態環境大數據體量大、類型多、結構復雜。從內容上包括水、土、氣層等方面的生態數據;從地域上來講,包括全球各個尺度,如大氣、海洋、土壤、植被、森林、濕地等各類生態系統的生態數據;從數據構成上關聯物理過程和化學過程,空間變異性強,多樣復雜,這都導致生態環境大數據來源的多樣性。也由于生態環境大數據來源復雜多樣直接導致其體量大的另一顯著特點;其次從數據價值來看,生態環境大數據無疑具有巨大的潛在應用價值,如何從海量數據中挖掘出最有用的信息是生態環境大數據面臨的最大挑戰;再次從數據動態變化方面來看,由于生態系統結構與功能的動態變化生態環境數據多表現為流式數據特征,實時連續觀測尤為重要。
例如,我國已經開發了一些污染物擴散預測模型,可由于缺乏大量實時數據的支持而不能進行精確地預測;最后從數據真實性來看,由于受野外監測條件的限制,生態環境大數據往往存在一定誤差甚至存在錯誤數據。如何從海量數據中去偽存真獲取真實數據是生態環境大數據面臨的又一挑戰。除了上述基本特征,生態環境大數據較其他領域大數據更加具有數據源多樣又復雜、所在部門分散、監測體系不統一、跨歷史事件長的獨特特點。
3生態環境大數據的發展現狀
早在20世紀中葉,“大數據”的思想已在生態環境領域得到體現,宏觀生態學研究早已認識到了大數據的重要性。大數據在生態系統研究方面的應用,最早可以追溯到國際地球物理年(1957—1958)和國際生物學計劃(IBP)(1964—1974),當時被稱為大科學研究,其目的是通過收集大量的數據研究大尺度生態環境問題,后來這種研究演變成了現在的國際長期生態研究計劃(ILTER)。直至目前隨著科技的發展,生態環境大數據在收集、監測、分析與應用方面都相繼取得了初步發展。
3.1生態環境大數據的收集與監測
目前國際上已經建立了多套覆蓋全球的生態環境監測網絡,總體來說可分為全球衛星遙感監測網絡和地面監測網絡這兩大類。全球尺度的主要觀測網絡包括全球環境監測系統(GEMS)、全球陸地觀測系統(CTOS)、國際長期生態研究網絡(ILTER)、全球通量觀測網絡(FLUXNET)以及國際生物多樣性觀測網絡(GEO·BON)等。有代表性的國家尺度生態環境觀測研究網絡包括美國的US—LTER生態環境觀測研究網絡、英國的ECN生態環境觀測研究網絡、中國的CERN生態環境觀測研究網絡和日本長期生態研究網絡(JALTER)。隨著全球生態環境問題日益突出,衛星遙感技術在生態環境監測與管理中的應用也越來越廣泛,美國、日本及歐洲的一些國家近年來都在大力發展生態環境遙感監測技術。目前在軌運行的和計劃發展的國內外衛星傳感器提供數據的空間分辨率已從公里級發展到亞米級,重復觀測頻率從月周期發展到幾小時,光譜波段跨越了可見光、紅外到微波,光譜分辨率從多波段發展到超光譜,遙感數據獲取技術正走向實時化和精確化,衛星遙感應用也正在向定量化和業務化快速發展[34]。
在陸地生態環境遙感監測方面,通常采用空間分辨率較高的陸地衛星和傳感器,如美國的Landsat/TM系列、法國SPOT/HRV系列、印度IRS-1系列以及高光譜衛星如美國的EO-1/ALI及Hyperion等。在海洋衛星遙感方面也開展了全球范圍的業務化運行,代表性的衛星平臺和傳感器有美國的Seastar/SeaWiFS、EOS/MODIS-TERRA&AQUA及歐空局的ENVISAT/MERIS、日本的ADEOS/GLI、印度的IRS/OCM等。另外,覆蓋全球的大氣監測衛星傳感器主要有美國的NOAA/AVHRR、EOS/MODIS-TERRA&AQUA&AURA和歐空局的ENVISAT/SCIAMACHY、ERS-2/GOME、METOP-1/GOME-2及日本的ADEOS-Ⅱ/TOMS&TOVS等[37]。全球地面監測網絡中,其中比較典型的是地面氣象站監測網絡和全球環境監測網絡等。全球地面氣象站監測網絡集成了不同國家不同地區的實時天氣觀測數據,共包含100多種數據來源和35000個氣象站點。
該監測網絡涉及的氣象站點數據可追溯到1901年,站點數量在二十世紀四十年代和七十年代出現了兩次大幅度的增加,目前已經擁有了14000個每日更新的固定站點。全球地面氣象站監測網絡獲取的氣象參數主要包括風速風向、溫度、云量、氣壓、可見度、降水以及積雪深度等其它要素(https://www.ncdc.noaa.gov)。全球環境監測系統是聯合國環境規劃署下屬的全球和地區環境監測的協調中心,它系統地收集和分析了各種環境狀況變化因素的數據和環境在時間和空間上的變化情況,并在此基礎上對環境狀況進行定期評價,從而提高對環境的管理、監測與評價水平。
該監測網絡主要涉及陸地生態系統監測和環境污染監測,如大氣組成和氣候系統、淡水和海岸污染、空氣污染、森林砍伐、臭氧層耗減、溫室氣體增加、酸雨、全球冰蓋范圍變化以及生物多樣性問題等。我國生態環境大數據的研究起步較晚,環境保護部最近剛剛發布了《生態環境大數據建設總體方案》,但是該方案僅涉及到環保系統大數據的建設規劃,而分布在其它部門的大量生態環境數據并沒有在該方案中得以體現。在生態系統監測方面,我國已于1988年開始組建中國陸地生態系統監測網絡,覆蓋農田、森林、草原、荒漠、湖泊、海灣、沼澤、喀斯特及城市9類生態系統,觀測指標達280多個。其中包括中科院所屬45個站;國家林業局所屬森林站105個、濕地站35個、荒漠站26個;農業部所屬68個野外農業試驗站和185個國家級草原固定監測站;此外水利部、教育部以及地方政府也擁有上百個生態監測站。同時,我國已初步建成包括岸基海洋觀測系統、離岸海洋觀測系統、大洋和極地觀測的海洋生態系統觀測網絡,其中包括海洋站180多個、浮/潛標50多個、調查斷面約120個、極地科考站4個。
此外,我國也初步建立了生態系統通量觀測網,包括200余個通量站。在環境污染監測方面,我國已經初步建立了一套網絡監測系統,涵蓋大氣、水和土壤等領域。其中,大氣監測網包括1436個空氣質量監測站點、82個沙塵暴監測站點、1011個酸雨監測站點、956個地表水水質監測斷面、20401個地下水監測站點、301個近海水質監測站點、35000多個土壤污染監測站點。此外,在氣象觀測方面,近年來國家氣象局已管理高達2000多個常規氣象站,3萬多個自動氣象站和39個沙塵暴監測站點。
在水利方面,已擁有259個水文站及1435個水位站,其中水利衛星通信站達610個;國家水土流失監測網絡目前由7大流域監測中心站、31個省級監測總站和175個重點地區監測站構成。在冰凍監測方面,已有冰川監測站4個,凍土監測站160余個。另外,我國目前已初步建成了綜合資源環境遙感監測平臺,包括陸地衛星9顆、氣象衛星3顆、海洋衛星3顆。至今為止,一套天地立體監測系統已初步建立,但由于我國幅員遼闊,生態環境復雜,這些監測系統還無法完全滿足生態環境建設的需要,很多監測網絡有待進一步補充完善。首先這些網絡系統分散于多個部門,存在著數據收集標準不一、質量參差不齊和數據共享極其困難等問題。另外,上述各類網絡現階段主要側重于數據收集,在數據分析、挖掘、存儲和利用等方面還非常薄弱甚至某些領域還是空白。例如在大數據的硬件支撐方面(超算和云計算),我國目前雖然擁有世界上最快的天河2號計算機,但由于應用軟件開發滯后,數據分析與挖掘能力不足,導致機器利用率很低,從而無法充分發揮大數據在生態環境領域的優勢。
3.2生態環境大數據的集成和分析
雖然大數據本身蘊含了大量信息但更多有用的信息并不在于原數據本身,而在于對數據進行深度分析,剖析數據間的統計關系挖掘其中的潛在價值。統計分析是數據處理最常用的技術,通常包括數據描述性分析、相關分析、回歸分析、聚類分析以及主成分分析等。除具備數據的一般特性外生態環境數據通常還具有地理空間特征,因此空間分析技術是生態環境大數據的常用分析技術。傳統的統計分析技術與大數據相結合對推動生態環境領域的發展起到了舉足輕重的作用,各類統計分析軟件、地理信息軟件等的開發利用對于解決復雜多變的生態環境問題提供了有力的技術支撐。美國環保局聯合美國航空航天局利用衛星技術收集空氣質量數據,以便更好地確定污染源及污染物排放與變化規律。同時利用商業傳感器開發個人空氣質量監測系統和能夠安裝在各種交通工具上的空氣污染監測傳感器系統。美國環保局聯合企業研發力量,通過產學研聯合創新推動了大數據的發展。
在生態環境大數據的建設方面,IBM、惠普、谷歌、微軟等美國IT企業為政府和公眾提供了全球最先進的數據庫、服務器、搜索服務和存儲設備等,幫助政府和研究機構對環境現狀及未來趨勢做出準確判斷。但是國際上跨部門跨行業的大數據平臺目前還比較少見,尤其是在生態環境領域。近年來,隨著計算機和通信技術的飛速發展,大數據在生物多樣性保護領域也得到了廣泛應用,很多國家和地區已經或正在建設生物多樣性信息管理系統。
例如,惠普公司聯合非盈利環保組織“保護國際”(ConservationInternational)于2012年共同啟動惠普地球觀察(HPEarthInsights)項目。通過開發Vertica分析平臺,該項目對全球高達3兆兆字節的生物多樣性和氣候數據進行了系統分析。同時,為了提高生物多樣性信息的可視化程度,研發了野生動物圖片索引分析系統(WildlifePictureIndexAnalyticsSystem),用戶可以通過網絡隨時隨地對該系統進行訪問。通用的統計分析技術給大數據平臺的信息挖掘提供了有力的手段,但是這些用于數據加工的通用分析軟件(如R、SAS、SPASS等)對于解決復雜多變的生態環境問題還遠遠不夠,正是諸多技術瓶頸使生態環境大數據的集成和分析方面相對薄弱。
3.3生態環境大數據的應用
目前大數據在生態環境領域已得到初步應用,主要體現在全球氣候變化預測與區域大氣污染治理等方面。大數據技術有助于整合海量龐雜的觀測數據及模式數據提高的數據存儲速度和管理效率。隨著新的氣象觀測設備的普及與應用,氣象觀測己經由過去相對少量的常規觀測發展到如今海量的非常規觀測,觀測精度也日益提高。目前氣象監測站點已經遍布全球,觀測范圍從地面到幾千米的高空,觀測手段從最原始的人工觀測到高科技的雷達衛星[13]。與此同時為了真實地模擬全球大氣走向大量的模式數據也隨之產生,模式系統一般每天計算2—4次,通常在整點開始利用整點前采集到的實況數據進行計算,每次計算要生成大概幾百個物理量,包括從開始計算的時刻至未來240h或更長時效的一系列二進制網格數據,預報時效通常間隔3h。
目前氣象網格經緯度間距一般在0.25度數量級,一個網格文件大小通常在1—2兆,包含幾十萬個浮點數值[15]。譚清海等(2013)針對氣候模式在超大規模數值模擬中產生的Tb至Pb量級的四維體數據的可視化和分析診斷方法,提出了基于Server-Client方式的遠程數據抽取和并行可視化解決方案[32]。2015年6月,美國宇航局結合了最新超級計算技術、地球系統模型、工作流管理以及遙感數據的協作及分析平臺,發布了從1950年到2100年全球氣候變化預測數據,該數據庫可以在15km的空間分辨率上測算未來全球各地氣溫與降水情況的變化。
國內方面黃剛等(2010)分析了大氣科學數據的特點,同時結合e-Science的大氣科學數據再分析平臺構建了一套新的大氣科學數據的分析和可視化系統,并提出數據處理算法與數據分析系統結合的可行方案[26]。賈韶輝(2013)基于大數據角度研發了集成大數據的信息與專業服務平臺,開展了針對中國石油氣象與地質災害的預報預警工作[28]。2015年5月,中國氣象局與阿里云合作,旨在挖掘全球尺度歷史觀測及預報數據等氣象大數據的深層價值。2015年9月,中國科學院大氣物理研究所等發布了“地球數值模擬裝置”原型系統,該系統是基于中科院地球系統模式1.0版本的高性能計算機系統,填補了中國地球系統模式大數據實踐平臺的空白。
另外,氣候變化觀測數據包含的信息十分豐富可以發揮出跨行業的服務價值,有可能挖掘出新的信息從而拓展新的業務領域和服務范圍。例如美國硅谷一家公司利用多年來的降雨、氣溫、土壤狀況等氣象數據與歷年農作物產量進行關聯分析,預測各地農場來年產量和適宜種植品種,這些結果以個性化保險服務的形式向農戶出售,從而減少了氣象災害給當地農戶帶來的風險及損失。氣象大數據應用還可在林業、海洋、氣象災害等方面拓展新的業務領域[25]。
3.4目前生態環境大數據研究存在的不足之處
雖然生態環境大數據的相關研究已經有了很大進展但仍存在以下幾點不足:1)缺乏數據共享。我國的生態環境建設經過多年努力在快速發展的同時產生了大量的數據,可由于數據標準格式和技術路線不統一導致嚴重的數據割據,形成了“數據孤島”。數據共享一直是制約大數據發展的突出問題,沒有數據共享,就無法形成“大數據”,因此數據共享是開展生態環境大數據建設的前提和基礎。2)技術問題。從基礎架構講,傳統信息技術架構存在擴展性弱、容錯性差、資源利用率低等問題。云計算是解決這些問題的關鍵,但目前在生態環境領域中云計算技術普遍僅在IaaS層實現硬件資源調配,在市場上少見PaaS和SaaS層的成熟產品和解決方案。在數據采集方面,生態環境大數據除傳統的業務數據外還來源于物聯網傳感器、網絡定位、視頻影像,以及互聯網上的文本、圖片等信息。如何將這些多源異構數據轉換成合適的格式和類型,并將這些數據應用于環境決策和監管還在探討之中。
在數據存儲方面,SQL數據庫已不適合用于大規模非結構化數據的存儲和處理,大數據所需要配套的分布式數據庫與混合型數據庫相關技術還有待進一步完善,也需要對相關技術人員進行專業培訓。建模分析是大數據的核心技術,如何使用新一代的機器學習和人工智能等模型實現技術應用創新,為不同客戶提供個性化服務,是我國生態環境建設面臨的重要挑戰,同時也正是生態環境大數據的發展機遇。3)應用不足。迄今為止,我國生態環境大數據的創新應用還很有限,大數據的威力遠遠未能發揮出來,政府綜合運用生態環境大數據的能力較低,沒有形成成熟的生態環境大數據產業鏈和有影響力的數據企業。生態環境大數據在氣象、水利、國土、農業、林業、交通、社會經濟等各部門的應用才剛剛起步,跨領域的應用寥寥無幾。如何促進大數據在生態環境領域中的應用創新,使大數據真正成為提高生態環境監管能力現代化的有力手段,是目前世界各國正在探索的課題。
4生態環境大數據的發展趨勢
4.1在數據的搜集與整理方面應建立數據共享機制
生態環境問題的解決需要長期的數據積累,對這些長期積累數據進行收集和整理是大數據科學中非常關鍵的一部分。與生態環境相關的數據眾多,大致包括地面監測數據、遙感影像數據、社會經濟數據、專項調查數據以及科學研究數據等。由于生態環境的多樣性和復雜性,這些數據的來源、監測對象及收集管理均不統一,而是分布在環保、國土、水利、農業、林業、衛生、氣象、海洋等多個領域。
例如,各類生態環境及污染監測數據,包括污染物排放數據、空氣環境質量數據、水環境質量數據及土壤環境質量數據等;各類農業資源、農業生產及農業市場等數據;森林資源清查數據、林業生態工程數據、自然保護區及生物多樣性數據等林業數據;土地資源、土地利用、礦產資源開發等數據;水文水資源、水土流失、水利設施等數據;各類地面氣象站、氣象衛星、氣象雷達以及探空等氣象數據;海洋生態環境、漁業資源、近海資源開發、濱海濕地保護等海洋數據以及各種環境災害數據以及與環境相關的人體健康等數據等等。
5總結
本文結合生態環境大數據目前的研究現狀,提出了生態環境大數據未來的發展趨勢,而生態環境大數據的發展還需要以下幾點保障:完善大數據發展法律法規,制定統一的規范標準體系等體制保障;加強大數據新技術的研發,成立相關科研機構等技術保障;培養一批復合型人才等人才保障;加大生態環境監測設備、計算機等數據處理基礎設施投入,設立生態環境大數據建設專項基金,設立生態環境大數據人才培養專項基金等資金保障。目前,生態環境大數據的發展尚在起步階段,需要人們不斷開拓的空間很大,如何高效地處理大數據、合理地利用大數據促進生態環境領域的研究仍需要不斷地探索與發現。
參考文獻
[1]ARONOVAE.BigScienceandBigDatainBiology:FromtheInternationalGeophysicalYearthroughtheInternationalBiologicalProgramtotheLongTermEcologicalResearch(LTER)Network,1957–Present[J].HistoricalStudiesintheNaturalSciences,2010,40(2):183–224.
[2]BIGANGF,DEANJ,GHEMAWATS,etal.Bigtable:Adistributedstoragesystemforstructureddata[J].ACMTransactionsonComputerSystems(TOCS),2008,26(2):4.
[3]CASSANDRALAKSHMANA,MALIKP.Cassandra:adecentralizedstructuredstoragesystem[J].ACMSIGOPSOperatingSystemsReview,2010,44(2):35–40.
生態方向論文范文閱讀:林業生態環境保護與林業經濟發展初探
摘要:林業資源的保護是我國林業事業發展的一項重要內容,與人類生活有著廣泛的聯系。尤其是在當前森林資源比較匱乏的情況下,做好林業資源的保護工作有著現實意義。同時,將林業資源的發展與社會經濟發展相互配合,能夠共同促進林業資源的整體進步。本文對林業資源的主要功能進行簡要概述,提出合理的措施以提高林業資源的環境保護與林業經濟發展的共同進步。
相關閱讀