Skip Navigation
Skip to contents

GEO DATA : GEO DATA

OPEN ACCESS
SEARCH
Search

Articles

Page Path
HOME > GEO DATA > Volume 5(4); 2023 > Article
Original Paper
구글어스엔진을 활용한 남한 연속 시계열 토지피복지도
최철현1orcid, 장인영2orcid, 한상학3orcid, 강성룡4,*orcid
Continuous Time-Series Land Cover Maps for South Korea using Google Earth Engine
Chulhuyn Choi1orcid, Inyoung Jang2orcid, Sanghak Han3orcid, Sungryong Kang4,*orcid
GEO DATA 2023;5(4):304-313.
DOI: https://doi.org/10.22761/GD.2023.0044
Published online: December 20, 2023

1전임연구원, 국립생태원 기후탄소연구팀, 충청남도 서천군 마서면 금강로 1210, 33657, 대한민국

2선임연구원, 국립생태원 기후탄소연구팀, 충청남도 서천군 마서면 금강로 1210, 33657, 대한민국

3연구원, 국립생태원 기후탄소연구팀, 충청남도 서천군 마서면 금강로 1210, 33657, 대한민국

4책임연구원, 국립생태원 기후탄소연구팀, 충청남도 서천군 마서면 금강로 1210, 33657, 대한민국

1Associate Researcher, Climate Change and Carbon Research Team, National Institute of Ecology, 1210 Geumgang-ro, Maseo-myeon, Seocheon-gun, 33657 Chungcheongnam-do, South Korea

2Senior Researcher, Climate Change and Carbon Research Team, National Institute of Ecology, 1210 Geumgang-ro, Maseo-myeon, Seocheon-gun, 33657 Chungcheongnam-do, South Korea

3Researcher, Climate Change and Carbon Research Team, National Institute of Ecology, 1210 Geumgang-ro, Maseo-myeon, Seocheon-gun, 33657 Chungcheongnam-do, South Korea

4Team Leader, Climate Change and Carbon Research Team, National Institute of Ecology, 1210 Geumgang-ro, Maseo-myeon, Seocheon-gun, 33657 Chungcheongnam-do, South Korea

Corresponding Author Sungryong Kang Tel: +82-41-950-5491 E-mail: srkang@nie.re.kr
• Received: November 13, 2023   • Revised: November 24, 2023   • Accepted: November 30, 2023

Copyright © 2023 GeoAI Data Society

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

prev next
  • 465 Views
  • 25 Download
  • In this study, we utilized Google Earth Engine to construct, for the first time in South Korea, a long-term (1986-2021) continuous time series of land cover maps with a spatial resolution of 30 meters. Derived from the surface reflectance data of the Landsat satellite series, a total of 44 input variables were generated, including various spectral bands and indices related to land cover. For accuracy verification of the maps, 4,824 reference data were established using areas where land cover remained unchanged, identified by comparing the most recent (2018) and historical (1988) land cover maps from the Ministry of Environment. The Random Forest model was employed to classify seven land cover types (settlements, cropland, forest land, grassland, wetlands, bare land, and water bodies), with an overall accuracy of 0.97 and a Macro F1-score of 0.91, indicating a generally high performance of the model. However, considering the annual variability, potentially due to unidentified or untraceable errors, a composite land cover map dataset, integrated in five-year intervals, was suggested to ensure the generation of stable data.
토지피복지도는 지표면의 물리적 상황을 나타내는 자료로서 환경부 「토지피복지도 작성지침(환경부 훈령 제1577호)」에는 “지구표면 지형지물의 형태를 과학적 기준에 따라 분류하고 동질의 특성을 지닌 구역을 지도형태로 표현한 환경주제도”로 정의하고 있다. 이는 주로 위성영상을 이용한 원격탐사 기술을 통해 제작되며, 토지이용의 변화, 지구 자원조사, 서식지 유형 분류, 농작물의 작황 분석, 홍수나 산불 등의 재해 현황 분석 및 예측 등 다양한 분야에 활용되고 있어 중요한 기초자료라 할 수 있다(Butt et al., 2015; Fan et al., 2022; Kim et al., 2005; Kosmidou et al., 2014; Nunes et al., 2005; Schubert et al., 2008; Zulian et al., 2013).
국내에서 제작 및 활용되고 있는 토지피복지도는 환경부에서 제공하고 있는 토지피복지도가 대표적이다. 대분류 지도(7개 토지피복 유형)의 경우 위성영상 분류 알고리즘을 사용하여 제작되었으며, 전국을 대상으로 약 10년 주기로 4회 구축이 완료되었다. 중분류 지도는 2000-2004년, 2007년(1차 갱신), 2009년(2차 갱신), 2013년(3차 갱신)에 제작되었으며, 영상의 육안판독 및 참조자료(연속수치지도, 지적도, 용도지역지구도, 임상도 등)를 활용하여 중분류 항목(22개)으로 분류하고 있다. 중분류 지도를 더욱 세분화한 세분류 토지피복지도는 2010년부터 2018년까지 전국을 대상으로 작성되었으며, 2019년 이후 매년 현행화하는 단계에 있다. 전 지구를 대상으로 구축되어 국내에서도 활용 가능한 국외의 대표적인 토지피복지도를 살펴보면, 유럽의 경우 Copernicus Global Land Service (CGLS), WorldCover, GlobCover가 있으며, 미국의 경우 National Aeronautics and Space Administration에서 제공하는 MCD12Q1 등이 있다. 이 지도들을 비교해보면 공간해상도가 10 m급인 Worldcover에서 500 m급인 MCD12Q1, 구축 기간의 경우 단기간 (GlobCover: 2009년, WorldCover: 2021년) 또는 장기간(CGLS: 2015-2019년, MCD12Q1: 2001-2020년) 등이 있는 것으로 확인되었다. 이러한 토지피복지도들의 특징으로는 연속적으로 장기간 구축된 토지피복지도는 해상도가 낮고(MCD12Q1: 500 m), 해상도가 높은 경우(WorldCover: 10 m)는 단기간만 제작되어 있다는 점이다. 이러한 원인은 공간해상도가 높으면서 대상 범위가 넓고 구축 기간이 길수록 처리해야 할 데이터의 양이 급격히 늘어나기 때문에 컴퓨팅 성능이 제한될 경우 분석이 불가능하기 때문이다.
한편, 국외의 최근 연구를 보면 Dubertret et al. (2022)은 Landsat 위성영상을 기반으로 미국 Tucson 지역에 대한 연속 시계열(1986-2020년, 2012년 제외) 토지피복지도를 30 m 공간해상도로 구축하였다. 또한 Xu et al. (2022)은 전 지구를 대상으로 Landat 8, Sentinel-2, PROBA-V 위성 자료에 대한 4년간(2015-2018년)의 토지피복 변화 모니터링 성능 비교 연구를 수행하였다. 이러한 연구들의 경우 최근 활용도가 높아지고 있는 구글어스엔진(Google Earth Engine, GEE)을 활용하고 있으며, 이를 통해 공간해상도가 높으면서 전 지구 범위를 대상으로 하거나 장기간의 연속 시계열로 토지피복지도를 구축하였다. 구글어스엔진은 전지구적 규모의 지리공간자료에 대한 분석을 위해 만들어진 클라우드 기반 플랫폼이다. 이 플랫폼은 클라우드 컴퓨팅 서비스를 통해 현재까지 축적된 방대한 양의 위성영상, 기상분석자료, digital elevation model, 모델링 결과 등과 같은 다양한 공간자료의 처리 및 출력 등을 사용자의 로컬 컴퓨팅 성능과 상관없이 활용할 수 있다(Park and Kang, 2022). 특히 같이 제공되는 코드에디터(GEE Code Editor) 서비스를 통해 사용자의 목적에 맞는 코드를 작성하여 다양한 알고리즘을 영상자료 분석에 활용 가능하다.
본 연구에서는 구글어스엔진을 활용하여 현재까지 국내에서 수행되지 않은 공간해상도 30 m 수준의 장기간(1986-2021년) 연속 시계열 토지피복지도를 구축하였다.
2.1 토지피복지도 분류를 위한 기초 영상자료
본 연구의 공간적 범위는 남한 전체이며, 시간적 범위는 남한 영역에 대해 가장 장기간 촬영한 Landsat 위성의 활용 가능한 기간의 범위에 따라 설정하고자 하였다. Landsat 위성 자료를 사용한 이유는 과거 1972년부터 현재까지 지구 전역의 영상을 일관된 방식으로 촬영해왔기 때문에 장기간 지표면의 시계열 지표면 변화를 탐지하는 데 있어 효과적이기 때문이다. Landsat 위성은 기본적으로 다중분광(multispectral) 센서를 장착하여 항공영상(red, green, blue 파장 대역)에 비해 넓은 분광대역의 영상을 획득할 수 있으며, 공간해상도는 Landsat 4, 5에 탑재된 Thematic Mapper (TM) 센서, Landsat 7에 탑재된 Enhanced Thematic Mapper+ 센서 및 Landsat 8, 9에 탑재된 Operational Land Imager 센서의 경우 30 m이다. 본 연구에서는 공간해상도 30 m의 Landsat 5 (1986-2011년), Landsat 8 (2013-2021년) 영상을 활용하였으며, Landsat 7의 경우 Scan Line Corrector (SLC) 오류 문제가 있어 2012년은 제외하고 분석을 수행하였다. Landsat 영상자료의 경우 방사보정, 대기보정, 정사보정, 기하보정 등의 전처리 단계를 거친 산출물을 제공하며, 본 연구에서는 이러한 처리가 완료된 collection 2 자료를 사용하였다. 해당 산출물에서 지표면 반사율 자료(surface reflectance)를 대상으로 분석하였으며, 여기서 blue, green, red, near infrared (NIR), Shortwave infrared (SWIR) 1, SWIR 2 총 6개의 밴드를 사용하였다. 구름이나 기타 결측에 의한 오류 등을 제거하기 위해 collection 2 자료에서 제공하는 QA_PIXEL 밴드 속성값을 활용하여 구름, 구름 그림자 등 지표면 반사율에 영향을 미칠 수 있는 속성을 제거하였다.
2.2 참조점 자료 구축
지상 참조점 자료는 영상 분류에 사용되는 모델의 훈련 및 검증에 활용되며, 연구의 시간적 범위인 1986-2021년간 연도별 참조점 자료를 구축할 필요성이 있다. 본 연구에서는 효율적인 참조점 구축 방법을 마련하기 위해 기구축된 환경부 토지피복지도를 활용하였다. 최종 분류 유형의 목표는 환경부의 토지피복지도의 대분류 유형인 정주지, 농경지, 산림지, 초지, 습지, 나지, 수역으로 설정하였으며, 이에 대한 지상 참조점 구축을 위해 환경부에서 제작한 가장 과거의 1988년대 토지피복지도(원시영상 촬영: 1987-1989년)와 가장 최근 세분류 토지피복지도(원시영상 촬영: 2018년)를 비교하여 각 토지피복 유형별 미변화 지역(토지피복이 다른 유형으로 전환되지 않고 그대로 유지된 지역)을 추출하였다. 산림지역의 경우 임상도 자료를 활용하여 5영급(41-50년) 이상을 재추출하여 연구의 시간적 범위 동안 지속적으로 산림이었던 지역임을 재확인하였다. 토지피복 미변화 지역에 대해 각 유형별 area of interest (AOI)를 생성하였으며, Google Earth Pro V.7.3.6.9345 (Google, Mountain View, CA, USA)의 시계열 영상(1986-2021년)을 활용하여 AOI 지역을 대상으로 변화 여부에 대해 재확인 과정을 거쳤다. 각 토지피복 유형별 참조점의 개수는 2018년 현재의 토지피복 유형별 면적을 참고하여 계층적 무작위 추출 방법(stratified random sampling)을 통해 AOI 지역 내에서 포인트를 추출하였다. 각 참조점 포인트 간 거리는 Landsat 영상의 픽셀 크기(30 m)를 고려하여 50 m 이상 이격되도록 하였다. 이를 위해 거리가 50 m 미만인 포인트는 제거하고 피복 유형별 부족한 참조점은 추가하여 최종적으로 4,824개의 지상 참조점을 생성하였다. 참조점은 분류에 사용될 모델에 대한 훈련과 검증을 위해 5:5로 구분하였다(훈련용 2,412개, 검증용 2,412개) (Table 1).
2.3 모델 입력변수 구축
Landsat 영상의 파장대별 밴드인 blue, green, red, NIR, SWIR 1, SWIR 2 및 각 밴드의 조합을 통해 추출할 수 있는 지수를 산정하여 입력자료 구축에 활용하였다. 토지피복 분류모델에 사용할 입력변수는 각 밴드 및 지수 11개에 대하여 기술통계값을 계산한 결과를 사용하였다. 기술통계값은 모든 픽셀에 대하여 구간별 분위 수(10th , 50th, 90th) 및 사분범위(inter quartile range=75th-25th)를 계산하며, 각 밴드 및 지수 11개에 대해 모두 산정하여 총 44개의 입력변수 영상을 구축하였다(Table 2).
2.4 토지피복 분류 모델 및 정확도 평가
분류 알고리즘은 Random Forest (RF) (10 trees) 모델을 사용하였으며, 이는 계산 부하가 적으면서 높은 정확도를 보이고 기존의 단일 decision tree 모형보다 과적합(overfitting)에 덜 민감하여 최근 예측 모형으로 많이 사용되고 있는 모델이다(Cutler et al., 2007; Gislason et al., 2006; Segal, 2004; Pal, 2005).
참조자료의 훈련용(2,412개) 자료의 각 포인트별 44개의 입력변수 영상의 값을 추출한 뒤, 참조자료의 토지피복 유형별 수치(정주지: 10, 농경지: 20, 산림지: 30, 초지: 40, 습지: 50, 나지: 60, 수역: 70)를 종속변수, 44개 입력변수별 수치를 독립변수로 설정하여 RF 모델을 훈련시킨 후 전체 지역에 대한 토지피복 예측지도를 작성하였다. 예측된 값과 참조자료의 검증용(2,412개) 자료를 사용하여 실제값과의 차이를 분석한 후 정확도를 계산하였다. 정확도 계산은 오차행렬(confusion matrix) 작성 후 전체 정확도(overall accuracy)를 산출하였다. 전체 정확도 외에도 토지피복지도와 같이 유형별 면적이 불균일한 자료에 적합한 F1-score를 토지피복 유형별로 산정하였으며, 전체 유형의 평균 F1-score인 Macro F1-score를 산출하였다.
Landsat 영상을 활용하여 입력변수를 구축하고 RF 모델 실행 및 정확도 평가를 수행하는 일련의 과정은 모두 구글어스엔진의 JavaScript API를 활용하여 수행되었다
2.5 다년도 토지피복지도 통합
장기간의 연도별 토지피복지도에 대한 신뢰성 있는 자료를 생성하기 위해 다수결 기법(majority)을 적용한 다년도 토지피복지도 통합 방식을 사용하였다. 이는 다년도의 토지피복지도 중 가장 빈번하게 나타나는 피복 유형을 대푯값으로 하는 방법으로 각 격자의 토지피복 속성에 대해서 n년 동안 가장 자주 나타나는 토지피복 유형을 해당 격자의 토지피복 속성으로 결정하는 방식이다. 여기서 n년은 시계열 분석에 적합한 값으로 설정하였으며, 기존 환경부 대분류 토지피복지도가 약 10년 단위인 것을 고려하여 개선된 결과를 도출하기 위해 5년으로 설정하였다.
본 연구에서는 ArcGIS Pro 3.0 (Esri, Redlands, CA, USA)의 Cell Statistics 도구를 활용하여 1986년부터 2020년까지의 토지피복지도를 통합하는 작업을 majority 분석을 통해 수행하였다. 개별 토지피복지도는 1986년부터 2021년까지 작성하였으나 시계열 분석에 적합한 5년 단위로 통합하기 위해 1986-2020년 지도를 사용하였다. 단, 2012년은 제외되었기 때문에 해당 시기는 짝수 개로 존재하여 majority 분석 시 오류가 발생할 가능성이 있어 2013년, 2014년, 2015년도의 토지피복지도만을 사용하여 분석을 진행하였다(Fig. 1).
3.1 연도별 정확도 평가 결과
토지피복 분류를 위한 RF 모델 분석 결과에서 모델의 정확도를 전체 정확도(overall accuracy)와 F1-score를 통해 평가하였다. 두 지표 모두 모델이 토지피복 유형을 얼마나 잘 분류하는지 나타내는 척도로서 높을수록 모델의 성능이 좋음을 의미한다. 전체 정확도는 평균 0.97로 상당히 높았으며, 토지피복 유형별 정확도의 평균 F1-score (Macro F1-score)는 0.91로 나타나 모델의 성능은 전반적으로 우수한 것으로 평가되었다.
주요 결과로는 일반적으로 산림지와 수역에 대해서 정확도가 높게 나타났으며, 이러한 유형은 모델을 통해 상대적으로 더 정확히 식별되었음을 의미한다. 나지와 습지의 정확도는 일반적으로 다른 유형보다 낮게 나타났으며, 이러한 유형은 다른 유형에 비해 분광학적으로 복잡한 특성을 나타내는 등의 원인으로 인해 식별하기 어려울 수 있음을 보여준다. 전체 정확도와 토지피복 유형별 F1-score의 평균을 의미하는 Macro F1-score는 시간에 따라 변동하는 경향을 보이지만 전반적으로 높은 성능을 유지하는 것으로 나타났다. 특히 1991년, 2004년, 2017년에는 Macro F1-score가 1에 가까워 상당히 높은 정확도를 보인 것으로 나타났다(Figs. 2, 3).
3.2 변수별 중요도
RF 모델은 사용된 각 변수가 예측 결과에 얼마나 중요한 역할을 하는지 측정하는 변수 중요도(variable importance) 값을 제공하고 있다. 이를 측정한 결과, normalized difference vegetation index (NDVI) 지수의 중위수(NDVI_p50) 변수의 중요도가 가장 높게 나타났다. NDVI가 높은 중요도를 나타냈다는 것은 토지피복 분류에 있어 식생의 밀도 및 상태가 결정적인 역할을 한다는 것을 보여주는 결과라 할 수 있다. 지수형 변수 중 다음으로 높게 나타난 것은 normalized difference built-up index로 인공구조물과 관련된 지수이다. 이는 도시화된 지역과 비도시화 지역을 구분하는 것이 토지피복 분류에 있어서 충분히 고려되어야 한다는 것을 의미한다. 지수형 변수 외 단일 파장 영역 변수인 green 중위수(Green_p50), blue 중위수(Blue_p50), 근적외선 중위수(NIR_p50) 변수가 높게 나타났다. Green과 근적외선 변수는 주로 식생의 존재와 생육 상태를 반영하며, blue 밴드는 특히 수역의 특성과 관련될 수 있어 토지피복의 분류에 있어 주요 변수로 작용하였을 것으로 판단된다(Fig. 4).
3.3 구름의 양과 정확도와의 관계
본 연구에서 제작한 토지피복지도는 Landsat 영상의 구름 지역을 마스킹 방법으로 제거 후 구축된 결과이다. 따라서 구름의 양이 많을수록 입력데이터의 결측이 많을 수 있으며, 이에 오분류될 가능성이 존재한다. 이러한 영향을 확인해보기 위해 구름의 양과 정확도(F1-score)와의 관계를 파악해보고자 하였다. Landsat 영상의 경우 C code based on the Function of Mask 알고리즘을 통해 구름을 제거하게 되는데 여기서 cloud score가 파생되며, 해당 값이 높을수록 구름이 높은 확률로 존재한다는 것을 의미한다(Foga et al., 2017). 해당 점수를 활용하여 검증지점(훈련용 2,412개, 검증용 2,412개)에 대해 각 연도별 전체 검증지점의 평균 cloud score와 Macro F1-score를 비교하였다. 그 결과, 약한 상관관계로 나타나긴 하였으나 구름이 높은 확률로 존재할수록 정확도가 낮아지는 관계를 보였다(Fig. 5).
3.4 연간 토지피복 유형별 면적 변화
전국을 대상으로 토지피복지도 유형별 연도에 따른 변화량 추세를 분석해본 결과, 정주지는 선형적인 증가 추세인 것을 확인하였으며, 농경지는 증가하다 유지되는 추세, 산림과 초지는 점차 감소하는 경향을 보였다. 다른 유형의 경우 증감 추세는 상대적으로 크지 않은 것으로 나타났는데, 초지의 경우에는 연간 변동이 상당히 큰 것을 확인하였으며, 수역을 제외하면 다른 유형에서도 이러한 변동을 관찰할 수 있었다. 초지나 나지의 경우 일반적인 토지피복 관련 연구에서도 확인할 수 있듯이 다른 유형과 비교하여 정확도가 낮다는 특징이 있다(Radoux et al., 2022). 따라서 오분류될 가능성이 다른 유형보다 크며, 이러한 원인으로 연간 변동이 나타날 수 있을 것으로 판단된다(Fig. 6).
3.5 최종 데이터셋
연간 변동은 자연적인 토지피복의 변화라기보다 구체적으로 파악하기 어려운 오류일 가능성이 높기 때문에 이러한 문제를 최소화하여 활용성을 높일 수 있도록 5년 단위로 통합한 토지피복지도 데이터셋을 구축하였다. 5년 단위로 토지피복지도를 통합하여 총 7개의 토지피복지도 데이터셋을 제작하였다. 해당 데이터셋은 래스터 기반 자료로서 Landsat 공간해상도인 30 m와 같으며, 속성은 정주지, 농경지, 산림지, 초지, 습지, 나지, 수역 7개의 속성이 포함되어 있다. 이를 통해 토지피복 면적의 변화 분석이 가능하며, 정주지의 점진적 증가 추세와 산림지의 감소 등을 확인할 수 있다. 또한 변화 탐지 분석 등을 통해 토지피복 유형 간 변화를 확인할 수 있으며, 이는 Sankey Diagram 등의 기법을 통해 시각화가 가능하다. 시각화한 결과, 정주지의 증가는 특히 농경지나 산림지가 정주지화된 것을 명확히 확인할 수 있었다. 또한 산림지와 농경지 간 전환의 경우 `86-`90년에서 `01-`05년 사이에는 산림지에서 농경지화된 비율이 더 높았으나 `01-`05년에서 `16-`20년 사이에는 산림지→농경지, 농경지→산림지로 변화된 비율이 유사한 것을 확인할 수 있다(Figs. 7-9; see Supplementary Figs. 1-7 for details).
연속적으로 구축된 토지피복지도를 통해 각 토지피복 유형의 면적 변화를 장기적 관점에서 분석한 결과, 정주지 면적은 명백한 증가 추세를 나타냈다. 이는 90년대 이후 급격한 산업화의 진전과 함께 인구 증가로 인한 주거 및 상업 지역이 지속적으로 확대해 온 국내의 상황과 일치하는 결과라 할 수 있다. 반면, 산림지는 분석된 토지피복 유형 중 가장 넓은 면적을 차지하고 있으나, 그 면적은 점진적으로 감소하고 있었다. 이러한 감소 추세는 개발 압력과 산업화로 인한 정주지로의 토지 이용 전환에 기인하는 것으로 해석될 수 있다. 토지피복 유형 간 면적 변화를 통해 주로 산림지나 농경지가 정주지로 변화한 것을 확인할 수 있었다. 반면, 토지이용 면적의 변화를 단기적 관점에서 분석해보면 연간 면적이 변동하는 모습을 나타냈다. 특히 초지에서 변동성이 크게 나타났으며, 이러한 변동성은 연도에 따라 정분류와 오분류가 반복될 수 있음을 시사한다. 초지나 나지의 경우 일반적인 토지피복 관련 연구에서도 확인할 수 있듯이 다른 유형과 비교하여 정확도가 낮다는 특징이 있다(Radoux et al., 2022). 각 결과를 통해 전체적인 추세 변화에서는 합리적인 해석을 보일 수 있지만 1년 단위와 같이 단기적인 토지피복지도 변화 분석에 있어서는 한계를 보일 수 있다. 따라서 본 연구에서 제안한 바와 같이 다년도 토지피복지도 통합 방식을 통해 이러한 변동성을 줄여 준다면 신뢰도를 높일 수 있을 것으로 판단된다.

Conflict of Interest

On behalf of all authors, the corresponding author states that there is no conflict of interest.

Funding Information

This study was supported by a grant from the National Institute of Ecology (NIE), funded by the Ministry of Environment (MOE) of the Republic of Korea (NIE-B-2023-43).

Data Availability Statement

The data that support the findings of this study are openly available in EcoBank at http://doi.or.kr/10.22756/GEO.20230000000838.

Supplementary Fig. 1.

Land cover map (1986-1990).
GD-2023-0044-Supplementary-Fig-1.pdf

Supplementary Fig. 2.

Land cover map (1991-1995).
GD-2023-0044-Supplementary-Fig-2.pdf

Supplementary Fig. 3.

Land cover map (1996-2000).
GD-2023-0044-Supplementary-Fig-3.pdf

Supplementary Fig. 4.

Land cover map (2001-2005).
GD-2023-0044-Supplementary-Fig-4.pdf

Supplementary Fig. 5.

Land cover map (2006-2010).
GD-2023-0044-Supplementary-Fig-5.pdf

Supplementary Fig. 6.

Land cover map (2013-2015).
GD-2023-0044-Supplementary-Fig-6.pdf

Supplementary Fig. 7.

Land cover map (2016-2020).
GD-2023-0044-Supplementary-Fig-7.pdf
Fig. 1.
Annual land cover mapping process using Google Earth Engine.
GD-2023-0044f1.jpg
Fig. 2.
Average F1-score by land cover type (error bars indicate standard deviation).
GD-2023-0044f2.jpg
Fig. 3.
Overall accuracy and Macro F1-Score of 35 yearly Random Forest classification models.
GD-2023-0044f3.jpg
Fig. 4.
Average importance of variables over 35-years. Error bars for standard deviation, with p10 representing the 10th percentile, p50 the 50th percentile, p90 the 90th percentile, and IQR representing the interquartile range (75th-25th). NDVI, normalized difference vegetation index; NDBI, normalized difference built-up index; NIR, near infrared; SWIR, Shortwave infrared; BAEI, built-up area extraction index; DBSI, dry bare-soil index; IQR, interquartile range.
GD-2023-0044f4.jpg
Fig. 5.
The Influence of annual mean cloud cover score on classification performance (Macro F1-Score) in training and test points. (A) Training dataset. (B) Test dataset.
GD-2023-0044f5.jpg
Fig. 6.
Annual trends in area by land cover type.
GD-2023-0044f6.jpg
Fig. 7.
Areas of land cover types in majority rule composite map (5-year Intervals).
GD-2023-0044f7.jpg
Fig. 8.
Majority rule composite land cover maps in 5-year intervals (1986-2020).
GD-2023-0044f8.jpg
Fig. 9.
Sankey Diagram of land cover changes in South Korea (`86-`90, `01-`05, `16-`20).
GD-2023-0044f9.jpg
Table 1.
Area and ratio of each landcover class (2018) and number of ground truth datasets
Class Landcover (2018)
Ground truth datasets
Area (ha) Ratio (%) Train Test Total Ratio (%)
Settlements 6,394.3 5.8 146 146 292 6.1
Cropland 18,035.0 16.5 411 411 822 17.0
Forest land 58,070.3 53.0 1,376 1,376 2,752 57.0
Grassland 8,224.2 7.5 82 82 164 3.4
Wetland 3,552.1 3.2 56 56 112 2.3
Bare land 2,839.0 2.6 56 56 112 2.3
Waterbody 12,504.1 11.4 285 285 570 11.8
Total 109,619.0 100.0 2,412 2,412 4,824 100.0
Table 2.
Indices used for predictor variables in land cover classifications
Index Formula
Normalized difference vegetation index (NDVI) NIR - Red
NIR + Red
Normalized difference water index (NDWI) NIR - SWIR
NIR + SWIR
Normalized difference built-up index (NDBI) SWIR - NIR
SWIR + NIR
Built-up area extraction index (BAEI) Red + 0.3
Green + SWIR
Dry bare-soil index (DBSI) SWIR - Green - NDVI
SWIR +Green

NIR, near infrared; SWIR, Shortwave infrared.

  • Butt A, Shabbir R, Ahmad SS, Aziz N (2015) Land use change mapping and analysis using Remote Sensing and GIS: a case study of Simly watershed, Islamabad, Pakistan. Egypt J Remote Sens Space Sci 18(2):251–259Article
  • Cutler DR, Edwards TC Jr, Beard KH, et al (2007) Random Forests for classification in ecology. Ecology 88(11):2783–2792ArticlePubMed
  • Dubertret F, Le Tourneau FM, Villarreal ML, Norman LM (2022) Monitoring annual land use/land cover change in the Tucson metropolitan area with Google Earth Engine (1986-2020). Remote Sens 14(9):2127Article
  • Fan Z, Zhan T, Gao Z, et al (2022) Land cover classification of resources survey remote sensing images based on segmentation model. IEEE Access 10:56267–56281Article
  • Foga S, Scaramuzza PL, Guo S, et al (2017) Cloud detection algorithm comparison and validation for operational Landsat data products. Remote Sens Environ 194:379–390Article
  • Gislason PO, Benediktsson JA, Sveinsson JR (2006) Random forests for land cover classification. Pattern Recognit Lett 27(4):294–300Article
  • Kim SJ, Park GA, Chun MK (2005) Analysis of runoff impact by land use change - using grid based kinematic wave storm runoff model (KIMSTROM). J Korea Water Resour Assoc 38(4):301–311
  • Kosmidou V, Petrou Z, Bunce RG, et al (2014) Harmonization of the land cover classification system (LCCS) with the general habitat categories (GHC) classification system. Ecol Indic 36:290–300Article
  • Nunes MCS, Vasconcelos MJ, Pereira JMC, et al (2005) Land cover type and fire in Portugal: do fires burn land cover selectively? Landsc Ecol 20:661–673ArticlePDF
  • Pal M (2005) Random forest classifier for remote sensing classification. Int J Remote Sens 26(1):217–222Article
  • Park J, Kang KM (2022) Research of water-related disaster monitoring using satellite bigdata based on Google Earth Engine cloud computing platform. Korean J Remote Sens 38(6):1761–1775
  • Radoux J, Bourdouxhe A, Coppée T, et al (2022) A consistent land cover map time series at 2 m spatial resolution-the LifeWatch 2006-2015-2018-2019 Dataset for Wallonia. Data 8(1):13Article
  • Schubert JE, Sanders BF, Smith MJ, Wright NG (2008) Unstructured mesh generation and landcover-based resistance for hydrodynamic modeling of urban flooding. Adv Water Resour 31(12):1603–1621Article
  • Segal MR (2004) Machine learning benchmarks and random forest regression. Center for Bioinformatics and Molecular Biostatistics 2004:1–14
  • Xu L, Herold M, Tsendbazar NE, et al (2022) Time series analysis for global land cover change monitoring: a comparison across sensors. Remote Sens Environ 271:112905Article
  • Zulian G, Maes J, Paracchini ML (2013) Linking land cover data and crop yields for mapping and assessment of pollination services in Europe. Land 2(3):472–492Article
Metadata for Dataset
Sort Field Subcategory#1 Subcategory#2
Essential *Title Continuous time-series land cover maps for South Korea using Google Earth engine
*DOI name http://doi.or.kr/10.22756/GEO.20230000000838
*Category Imagery Base Maps Earth Cover
Abstract Landsat Satellite Imagery-Based Long-Term Continuous Land Cover Maps in South Korea Class: 10 (settlements), 20 (cropland), 30 (forest land), 40 (grassland), 50 (wetland), 60 (bare land), 70 (waterbody)
*Temporal Coverage 35 years
*Spatial Coverage South Korea
WGS84 Coordinates Point
*Personnel Name Chulhyun Choi
Affiliation National Institute of Ecology
E-mail kenix0@nie.re.kr
*CC License CC-BY-NC
Optional *Project Development of Carbon-Biodiversity Linkage Assessment Indicator by Ecosystem Types NIE-B-2023-43
*Instrument Google Earth Engine

Figure & Data

References

    Citations

    Citations to this article as recorded by  

      Figure
      • 0
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      • 7
      • 8
      Continuous Time-Series Land Cover Maps for South Korea using Google Earth Engine
      Image Image Image Image Image Image Image Image Image
      Fig. 1. Annual land cover mapping process using Google Earth Engine.
      Fig. 2. Average F1-score by land cover type (error bars indicate standard deviation).
      Fig. 3. Overall accuracy and Macro F1-Score of 35 yearly Random Forest classification models.
      Fig. 4. Average importance of variables over 35-years. Error bars for standard deviation, with p10 representing the 10th percentile, p50 the 50th percentile, p90 the 90th percentile, and IQR representing the interquartile range (75th-25th). NDVI, normalized difference vegetation index; NDBI, normalized difference built-up index; NIR, near infrared; SWIR, Shortwave infrared; BAEI, built-up area extraction index; DBSI, dry bare-soil index; IQR, interquartile range.
      Fig. 5. The Influence of annual mean cloud cover score on classification performance (Macro F1-Score) in training and test points. (A) Training dataset. (B) Test dataset.
      Fig. 6. Annual trends in area by land cover type.
      Fig. 7. Areas of land cover types in majority rule composite map (5-year Intervals).
      Fig. 8. Majority rule composite land cover maps in 5-year intervals (1986-2020).
      Fig. 9. Sankey Diagram of land cover changes in South Korea (`86-`90, `01-`05, `16-`20).
      Continuous Time-Series Land Cover Maps for South Korea using Google Earth Engine
      Class Landcover (2018)
      Ground truth datasets
      Area (ha) Ratio (%) Train Test Total Ratio (%)
      Settlements 6,394.3 5.8 146 146 292 6.1
      Cropland 18,035.0 16.5 411 411 822 17.0
      Forest land 58,070.3 53.0 1,376 1,376 2,752 57.0
      Grassland 8,224.2 7.5 82 82 164 3.4
      Wetland 3,552.1 3.2 56 56 112 2.3
      Bare land 2,839.0 2.6 56 56 112 2.3
      Waterbody 12,504.1 11.4 285 285 570 11.8
      Total 109,619.0 100.0 2,412 2,412 4,824 100.0
      Index Formula
      Normalized difference vegetation index (NDVI) NIR - Red
      NIR + Red
      Normalized difference water index (NDWI) NIR - SWIR
      NIR + SWIR
      Normalized difference built-up index (NDBI) SWIR - NIR
      SWIR + NIR
      Built-up area extraction index (BAEI) Red + 0.3
      Green + SWIR
      Dry bare-soil index (DBSI) SWIR - Green - NDVI
      SWIR +Green
      Sort Field Subcategory#1 Subcategory#2
      Essential *Title Continuous time-series land cover maps for South Korea using Google Earth engine
      *DOI name http://doi.or.kr/10.22756/GEO.20230000000838
      *Category Imagery Base Maps Earth Cover
      Abstract Landsat Satellite Imagery-Based Long-Term Continuous Land Cover Maps in South Korea Class: 10 (settlements), 20 (cropland), 30 (forest land), 40 (grassland), 50 (wetland), 60 (bare land), 70 (waterbody)
      *Temporal Coverage 35 years
      *Spatial Coverage South Korea
      WGS84 Coordinates Point
      *Personnel Name Chulhyun Choi
      Affiliation National Institute of Ecology
      E-mail kenix0@nie.re.kr
      *CC License CC-BY-NC
      Optional *Project Development of Carbon-Biodiversity Linkage Assessment Indicator by Ecosystem Types NIE-B-2023-43
      *Instrument Google Earth Engine
      Table 1. Area and ratio of each landcover class (2018) and number of ground truth datasets

      Table 2. Indices used for predictor variables in land cover classifications

      NIR, near infrared; SWIR, Shortwave infrared.


      GEO DATA : GEO DATA
      TOP