Skip Navigation
Skip to contents

GEO DATA : GEO DATA

OPEN ACCESS
SEARCH
Search

Articles

Page Path
HOME > GEO DATA > Volume 7(1); 2025 > Article
Data Article
베이지안 혼합 모델을 이용한 Sentinel-1 GRD 데이터 기반 수체 검출 및 저수지 수위 예측
윤동현1,*orcid, 유하은2orcid, 황의호3orcid, 강기묵4orcid, 남기범1orcid, 김진겸1orcid
Waterbody Detection and Reservoir Water Level Prediction Using Bayesian Mixture Models with Sentinel-1 GRD Data
DongHyeon Yoon1,*orcid, Ha-Eun Yu2orcid, Euiho Hwang3orcid, Ki-mook Kang4orcid, Gibeom Nam1orcid, Jin-Gyeom Kim1orcid
GEO DATA 2025;7(1):18-26.
DOI: https://doi.org/10.22761/GD.2024.0052
Published online: February 5, 2025

1선임연구원, K-water연구원 수자원위성센터, 대전광역시 유성구 유성대로 1689번길 125, 34045, 대한민국

2연구원, K-water연구원 수자원위성센터, 대전광역시 유성구 유성대로 1689번길 125, 34045, 대한민국

3센터장, K-water연구원 수자원위성센터, 대전광역시 유성구 유성대로 1689번길 125, 34045, 대한민국

4책임연구원, K-water연구원 수자원위성센터, 대전광역시 유성구 유성대로 1689번길 125, 34045, 대한민국

1Senior Researcher, Water Resources Satellite Center, K-water Research Institute, 125 Yuseong-daero 1689beon-gil, Yuseong-gu, 34045 Daejeon, South Korea

2Researcher, Water Resources Satellite Center, K-water Research Institute, 125 Yuseong-daero 1689beon-gil, Yuseong-gu, 34045 Daejeon, South Korea

3Head of Center, Water Resources Satellite Center, K-water Research Institute, 125 Yuseong-daero 1689beon-gil, Yuseong-gu, 34045 Daejeon, South Korea

4Principal Researcher, Water Resources Satellite Center, K-water Research Institute, 125 Yuseong-daero 1689beon-gil, Yuseong-gu, 34045 Daejeon, South Korea

Corresponding Author DongHyeon Yoon Tel: +82-42-870-7498 E-mail: dhyoon@kwater.or.kr
• Received: November 20, 2024   • Revised: December 27, 2024   • Accepted: January 3, 2025

Copyright © 2025 GeoAI Data Society

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

prev next
  • 322 Views
  • 25 Download
  • In this study, we used a Bayesian mixture model (BMM) to monitor water surface areas and estimate water levels in Yeongcheon Dam through Sentinel-1 synthetic aperture radar (SAR) imagery. Reservoirs serve vital functions such as flood control, drought mitigation, and ecosystem support, highlighting the importance of precise monitoring of their water surface and level variations, especially in the context of climate change and increased human impact. The BMM method was employed to accurately delineate water boundaries, benefiting from SAR’s capability to capture data regardless of weather conditions. Regression analysis was conducted between the extracted water surface area and observed water levels to create a predictive model, yielding a highly accurate equation with an R2 core of 0.981 on the test set. This result indicates a strong correlation between water surface area and water level, affirming the model’s reliability in estimating water levels based solely on surface area data. One of the key findings of this study is that even with a 10 m spatial resolution, reliable water level inferences can be made using water surface area as a proxy. The mean absolute error values obtained validate the model’s capability to monitor water level fluctuations with a satisfactory degree of accuracy. Despite limitations in detecting narrow tributaries or other small-scale features due to SAR resolution, the model performs well overall in monitoring broad water bodies. These findings underscore the potential of Sentinel-1 SAR data for effective reservoir monitoring, especially where real-time water level data may be lacking. For future research, higher-resolution data or complementary algorithms may further enhance detection accuracy for smaller and more complex water features, contributing to more refined water resource management strategies.
저수지는 홍수 조절, 가뭄 예방, 생태계 균형 유지 등 다양한 역할을 수행하며 그 중요성이 점점 더 부각되고 있다(Gao, 2015; Kim et al., 2022; Lehner and Döll, 2004). 그러나 최근 기후 변화와 인간 활동의 영향으로 저수지의 수면 면적과 수위 변동이 심화되면서 이를 정확하고 신속하게 모니터링하는 시스템의 필요성이 커지고 있다(Huang et al., 2018; Refice et al., 2014; Wagner et al., 2021). 수면 면적과 수위는 저수지의 수자원 상태 변화를 반영하는 중요한 지표로 본 연구는 이들 간에 높은 상관관계가 존재한다는 가정하에 진행하고자 한다(Kim et al., 2022).
위성 원격탐사는 넓은 공간적 범위를 관측할 수 있는 장점 덕분에 홍수 평가와 수자원 관리에서 널리 사용되고 있다(Klemas, 2015). 특히 synthetic aperture radar (SAR) 기술은 전천후로 이미지 획득이 가능하여 관측에 있어 날씨의 영향을 받지 않으며 C-밴드 SAR 영상의 경우 수면이 레이더 신호를 거의 반사하지 않아 낮은 후방 산란값을 나타낸다. 이는 SAR 데이터를 활용하여 수체를 효과적으로 추출할 수 있는 기반이 된다(Mudashiru et al., 2021). 이와 같은 특성 덕분에 SAR 기술은 실시간 동적 모니터링에 있어 매우 유용하다(Martinis et al., 2015).
본 연구에서는 한국수자원공사가 관리하는 용수지 중 하나인 영천댐을 대상으로 수자원관리종합정보시스템(Water Resources Management Information System, WAMIS)에서 제공하는 수위 정보와 Sentinel-1 SAR 영상에서 추출한 수체 면적 간의 회귀 분석을 통해 수위 예측 모델을 실험하고자 한다. 이를 통해 저수지의 수체 변화를 보다 효과적으로 모니터링하고 수위 예측의 정확성을 검증함으로써 저수지의 동적 변화를 효율적으로 파악하는 데 기여하고자 한다.
SAR 기반 수체 면적 추출과 수위 예측 모델링을 통해 저수지의 상태를 모니터링하면 기후 변화와 인간 활동으로 인한 저수지 환경 변화를 신속히 파악하여 잠재적인 피해를 예방하고 재해의 영향을 줄이는 데 도움이 될 것으로 기대된다.
2.1 연구 지역
연구 대상지인 영천호는 경상북도 영천시 자양면에 위치한 인공 호수로 낙동강 지류인 금호강 유역에 있으며 1974년에 착공하여 1980년에 준공되었다. 영천호는 포항과 영천 지역의 식수 및 공업용수 공급원으로 활용되며 하루 40만 톤의 물을 주변 일대에 공급하는 중요한 상수원 역할을 한다. 또한 산악 지형에 위치하여 지형 왜곡이 많이 발생하고 겨울철 결빙이 잦으며 복잡한 수체 경계선을 가지고 있어 다양한 알고리즘을 테스트하기 적합하다. 또한 상대적으로 면적이 작아 연산 부담이적으므로 효율적인 알고리즘 검증에도 유리한 환경을 제공한다. 유역 면적은 235 km2에 이른다(Choi and Choi, 2022).
2.2 Sentinel-1 ground range detected 자료
본 연구에서는 Sentinel-1 ground range detected 데이터는 Google Earth Engine (Google, Mountain View, CA, USA)에서 색인된 자료를 Numpy 배열로 반환하여 분석에 사용하였다. 전처리는 Google Earth Engine에서 제공하는 Sentinel-1 toolbox의 표준 처리가 적용되었으며 Perona-Malik 스페클 노이즈 저감 필터(Perona and Malik, 1990)를 사용하여 노이즈를 최소화하였다. 본 연구에 사용된 Sentinel-1 데이터는 Table 1과 같다. 또한 추출된 수체의 정성적 평가를 위하여 참조 영상으로 구름 면적이 10% 이하인 Sentinel-2 multispectral instrument level-2C harmonized 영상을 사용하였다.
연구 대상은 Fig. 1의 영천댐 지역을 통과하는 Sentinel-1 영상이며 연구 기간은 2023년 1월 1일부터 2024년 10월 31일까지의 총 22개월, 39개의 ascending 영상을 사용하였다. 본 연구에서는 수위 데이터를 확보하기 위하여 WAMIS application programming interface를 이용하여 지점수위 자료를 수집하였다. WAMIS는 대한민국 환경부 한강홍 수통제소에서 운영하는 정보 시스템으로 수문 기상, 유역, 하천, 댐, 지하수 등 다양한 수자원 정보를 통합 관리하여 제공한다(Kim, 2001).
본 연구는 수체 면적의 변화를 정교하게 탐지할 수 있다면 이를 통해 수위를 추정하는 회귀 방정식을 도출할 수 있다는 가정에서 시작한다. 10 m 해상도에서 수체 탐지의 유의미한 결과를 얻기 위하여 다음과 같은 과정을 따른다. 첫째, Perona-Malik 필터(Perona and Malik, 1990)를 사용하여 스페클 노이즈를 저감한다. 둘째, VV와 VH 편파 데이터를 모두 사용하기 위해 2차원 벡터 데이터로 변환한다. 셋째, 베이지안 혼합 모델 파라미터를 최적화하여 수체를 탐지하고 탐지 후 작은 벌브 크기의 노이즈를 제거한다. 넷째, 수체와 육지의 면적 비율을 계산한 뒤 하이퍼파라미터 튜닝을 수행하여 최적의 회귀 함수를 추정한다(Yang and Shami, 2020). 이때 파라미터 튜닝의 정확도를 높이기 위하여 테스트 세트에 random sample consensus (RANSAC) 아웃라이어 제거 알고리즘을 적용한다(Meer et al., 1991).
최종적으로 도출된 회귀 방정식을 기반으로 수위를 추정하며 평가 지표로는 root mean square error (RMSE), mean absolute error (MAE), coefficient of determination (R2)을 사용한다. RMSE와 MAE는 각각 예측값과 실제값 사이의 오차를 평가하는 지표로, RMSE는 오차의 제곱 평균을 통해 큰 오차에 민감하게 반응하며 MAE는 오차의 절대값 평균을 통해 전반적인 예측 정확도를 평가한다. R2은 두 변수 간의 상관성을 평가하기 위한 지표로 회귀 모델이 설명하는 데이터 변동 비율을 나타낸다. 이러한 평가 지표들을 통해 테스트 세트와 결과를 별도로 평가하며 특히 아웃라이어를 제거하여 수체 면적과 수위 사이의 상관성을 확인하고자 하였다.
3.1 베이지안 혼합 모델을 이용한 수체 추출
수체와 육지 데이터 분포를 효과적으로 모델링하기 위하여 다음과 같이 베이지안 혼합 모델을 사용하였다. 데이터가 여러 개의 확률분포로부터 생성되었다고 가정하며 각 분포는 특정 파라미터를 가지며 반복적인 최적화 과정을 통해 목적함수를 계산하고 수렴 조건을 만족하는지 판단한다. 이 연구는 연구 지역이 수체와 육지, 무작위한 구성 요소의 혼합된 확률분포를 가지고 있다는 가정하에 진행하였다. 이때 무작 위한 추가 구성 요소는 1개로, 총 구성 요소는 3개로 가정하였다. 구성 요소에 따른 베이지안 혼합 모델은 Eq. 1과 같이 정의된다(Bishop, 2006).
Eq. 1
P(X)=k=1Kπkf(Xθk)
여기서 X는 두 편파 채널 값을 하나의 벡터로, 2차원 실수 공간 R2에 속하는 벡터 Xn = [Svv,Svh]T ∈ R2로 사용하였다. 입력벡터 X는 Sentinel-1의 VV와 VH 편파로 dB 스케일로 변환된 sigma naught를 사용하였다. Sentinel-1 VV와 VH 편파가 2차원 실수 공간에서 동일한 구성 요소에 속한다면 데이터 XFig. 2와 같이 가우시안 분포 형태로 나타난다.
πk는 혼합 계수로 각 구성 요소에 대한 가중치 k=1Kπk=1로 나타낼 수 있다. 구성 요소 k의 확률밀도함수는 f(X|θk) = N(X|μk,∑)으로 각 구성 요소의 다변량 확률분포가 동일한 공분산행렬을 공유한다는 가정으로 설정하였다. 베이지안 접근법은 파라미터의 불확실성을 사전 분포를 통해 모델링한다. 혼합 계수 π와 평균벡터 μk 그리고 Dirichlet process 사전분포함수를 사용하여 데이터에 대한 사후분포를 계산하였다. 데이터 X = {Xn1,…, Xni,j}가 주어졌을 때 파라미터의 사후분포는 P(π,μ,∑|X) ∝ P(X|π,μ,∑)P(π)P(μ)P(∑)와 같다. 여기서 우도함수는 Eq. 2와 같이 표현할 수 있다(Rasmussen, 2000).
Eq. 2
P(Xπ,μ,Σ)=n=1Nk=1KπkN(Xnμk,Σ)
사후 분포는 기댓값 최대화 알고리즘(expectation-maximization [EM] algorithm)을 사용하여 파라미터를 추정한다. EM 알고리즘은 Eq. 3과 같이 입력 데이터 벡터 Xn이 구성요소 k에 속할 기댓값을 계산한다.
Eq. 3
γnk=πkN(Xnμk,Σ)/j=1KπjN(Xnμj,Σ)
반복적으로 구성 요소 단위로 수행되는 베이지안 혼합 모델의 각 파라미터 홉합계수 πkπk=N+n=1Nαk-1/n=1Nγnk+αk-1 로 나타낼 수 있다. 평균벡터는 μk=k0+n=1NγnkXn/k0m0+n=1NγnkXn으로 계산할 수 있다. 공분산 Σ는 Eq. 4와 같이 나타낼 수 있다.
Eq. 4
=ψ0+S+k=1Kk0Nk/k0+Nkμk-m0μk-m0Τ/ν0+N+d+1
여기서 S=k=1Kn=1NγnkXn-μkXn-μk이며 d는 데이터의 차원으로, Xn 2차원 벡터를 입력하여 d = 2로 설정하였다. 본 연구에서는 Sentiel-1 영상에서 구성 요소 K = 3인 경우를 가정하고 진행하였다. 예를 들어 K = 2인 구성 요소는 Eq. 5와 같이 각 항을 계산할 수 있으며 책임도 계산에서 분모의 합산은 모든 구성 요소가 해당 데이터 포인트에 기여하는 확률밀도의 총합을 구하기 위하여 사용된다.
Eq. 5
j=13πjN(Xnμj,Σ)=π1N(Xnμ1,Σ)+π2N(Xnμ2,Σ)+π3N(Xnμ3,Σ)
Eq. 5의 각 항은 구성 요소 인덱스 j가 입력벡터 Xn의 가중치 값을 나타낸다. 이때 구성 요소 K = 2가 수체라고 가정하고 확률밀도 값의 총합은 Eq. 6과 같이 구성 요소 K = 2일 확률을 얻을 수 있다.
Eq. 6
γn2=π2N(Xnμ2,Σ)/π1N(Xnμ1,Σ)+π2N(Xnμ2,Σ)+π3N(Xnμ3,Σ)
본 연구에서는 베이지안 혼합 모델을 파이썬 프로그래밍 언어(Python Software Foundation, Wilmington, DE, USA)로 구현하고 Sentinel-1의 VV와 VH 채널 데이터를 적용하였다. 모델링 과정은 사전 확률분포의 설정, EM 알고리즘을 통한 파라미터 추정을 수행한다. 실험 결과 베이지안 접근법은 일반 이진 분류에 비해 안정적인 수체 탐지 결과를 도출할 수 있다. 이 연구에서 사용된 베이지안 혼합 모델의 의사 코드는 Table 2와 같다.
본 연구에서는 Sentinel-1 데이터를 활용하여 연구 지역인 영천호에서 수체 면적을 추출하고 이를 바탕으로 수위를 추정하는 모델을 구축하였다. 분석 결과 수위가 변함에 따라 수체 경계가 정밀하게 분류되었으며 Sentinel-1의 후방 산란 강도 차이를 통해 수체와 육지 간의 명확한 구분이 가능하였다.
Sentinel-1 수체 탐지 결과와 Sentinel-2 near-infrared false color 영상을 비교한 결과 수위 변화에 따라 수체 경계가 정확하게 분류되었다. Sentinel-1 영상에서 수체와 주변 육지의 후방 산란 강도 차이가 뚜렷하게 나타나 수체 경계 구분이 명확했다. 이러한 결과는 SAR 영상을 활용한 수체 탐지의 정확도를 높이는 데 유용하며 수체 탐지 기법이 저수지와 같은 내륙 수체의 모니터링에 적합하다는 선행 연구(Kim et al., 2022)와도 일치한다.
또한 Fig. 3에서와 같이 여름철 수체 면적이 크게 증가한 모습이 관찰되었는데 이는 앞서 언급한 강우량 증가가 수체 탐지에 미치는 영향을 시각적으로 검증하는 데 도움이 된다(Kim et al., 2022). 이 연구에서는 수체 탐지 결과의 정성적 평가를 위하여 동일한 시기에 촬영된 Sentinel-2 영상을 Fig. 3과 같이 참조하였다. 수체와 육지의 구분이 용이하도록 근적외선 채널을 사용하여 위색(false color, B8-B4-B3)을 사용하였다. Sentinel-2 영상과 비교하였을 때 Sentinel-1 수체 탐지가 일부 세부적인 변화를 표현하지 못한 영역이 있었지만 전체적으로 수위 변화와 경계선 탐지에는 높은 정확도를 보였다. 이러한 결과는 제안된 알고리즘이 집중 호우와 같은 극한 기후 상황에서도 신뢰성 있게 수체를 탐지할 수 있음을 시사한다.
Eq. 7
y = 338.947x + 119.257
영천댐 수위를 추정하는 데 사용된 모델 피팅 프로세스와 평가 지표에 대한 세부 정보는 Table 3과 같다. 회기계수 및 가중치 추정은 과정은 RandomizedSearchCV를 사용하여 수행되었으며 RANSAC 이상치 매개변수는 최소 샘플 비율 0.574, 잔차의 임계값은 1.296으로 설정되었다.
수체 면적과 수위 간의 회귀 방정식을 도출한 결과 영천댐의 최적화된 모델 방정식은 Eq. 7과 같이 도출되었다. Fig. 4와 같이 테스트 세트에서 RMSE는 0.432, MAE는 0.358로 나타났으며 전체 데이터에서 RMSE는 0.583, MAE는 0.465로 계산되었다. 또한 테스트 세트에서 R2값이 0.981, 전체 데이터에 대한 R2값이 0.967로 두 변수 간 높은 상관성을 보였다. 이러한 지표들은 모델이 수위 변동을 정밀하게 추정할 수 있음을 의미한다. 집중호우 후 특정 날짜에 수체 면적이 크게 증가하는 패턴이 확인되었으며 강우량이 수체 탐지에 미치는 영향을 시각적으로 검증하는 데 도움이 되었다.
Figs. 3, 5와 같이 수위 변동이 큰 상황에서도 수체가 정확하게 분류되었음을 육안으로 확인할 수 있었다. 또한 실제 WAMIS 수위 데이터와 예측된 수위 데이터를 비교한 결과 모델이 실제 수위 변화를 효과적으로 추정하고 있음을 알 수 있었다. 평균 잔차는 약 0.453으로 비교적 낮은 범위에 분포하고 있어 수위 예측 모델이 다양한 수위 변동 상황에서 높은 신뢰성을 가지고 작동함을 나타낸다.
이 연구에서 사용된 베이지안 혼합 모델은 데이터 분포를 여러 가우시안 성분으로 모델링하여 클러스터를 효과적으로 식별할 수 있다. 그러나 베이지안 혼합 모델은 구성 성분의 공분산 구조를 공유하거나 유사하게 가정하는 경우가 많아 복잡한 지형이나 폭이 좁은 하천과 같은 세부적인 구조를 정확히 탐지하는 데 한계가 있다. 특히 폭이 수십 미터 이하인 상류 지류는 SAR 영상의 해상도 제한과 신호 반사 특성으로 인하여 탐지가 어렵다. 이러한 제한은 모델의 공분산 공유 가정과 결합되어 작은 수체의 탐지에 어려움을 초래할 수 있다. 따라서 작은 지류를 효과적으로 탐지하기 위해서는 해상도가 높은 데이터나 다른 탐지 알고리즘이 필요하다.

Conflict of Interest

Euiho Hwang and Ki-mook Kang have been an Editorial Board of GEO DATA; however, they were not involved in the peer reviewer selection, evaluation, or decision process of this article. Otherwise, no other potential conflicts of interest relevant to this article were reported.

Funding Information

This research was supported by Ministry of Environment, under the Development of Ground Operation System for Water Resources Satellite.

Data Availability Statement

The data that support the findings of this study are available on request from the corresponding author. The data are not publicly available due to privacy or ethical restrictions.

Fig. 1.
Map of the study area in Youngcheon reservoir using ESRI world imagery.
GD-2024-0052f1.jpg
Fig. 2.
The Otsu threshold for binary classification in each polarization, along with clustering results using a K-means-based GMM algorithm. Unlike binary classification based solely on individual polarization histograms, probabilistic clustering in the two-dimensional real space reveals regions that are either overestimated or underestimated by the binary classification approach. GMM, Gaussian mixture model.
GD-2024-0052f2.jpg
Fig. 3.
Water body detection results using Sentinel-1 VV channel image and BMM with corresponding Sentinel-2 level-2C false color (B8-B4-B3) images. For comparison, Sentinel-2 level-2C false color images (B8-B4-B3) captured on the same dates are shown. From top to bottom, the images correspond to the following dates: January 19, 2023, March 14, 2024, July 12, 2024, and September 10, 2024. BMM, Bayesian mixture model.
GD-2024-0052f3.jpg
Fig. 4.
Regression analysis of water/land area ratio and WAMIS water level for Yeongcheon reservoir. A model evaluation on the test set produced an RMSE of 0.432 and an MAE of 0.358, while the overall dataset yielded an RMSE of 0.583 and an MAE of 0.465. Additionally, the R2 value was 0.981 for the test set and 0.967 for the entire dataset, indicating a strong correlation between the two variables. WAMIS, Water Resources Management Information System; RMSE, root mean square error; MAE, mean absolute error.
GD-2024-0052f4.jpg
Fig. 5.
Comparison of estimated water levels and WAMIS observed water levels with residuals. WAMIS, Water Resources Management Information System; RMSE, root mean square error; MAE, mean absolute error.
GD-2024-0052f5.jpg
Table 1.
List of Sentinel-1 GRD dual-polarization data (VV, VH)
Number Acquisition time (UTC) Orbit properties Relative orbit path
1 2023-01-07 Ascending 54
2 2023-01-19 Ascending 54
3 2023-01-31 Ascending 54
4 2023-02-12 Ascending 54
5 2023-02-24 Ascending 54
6 2023-03-08 Ascending 54
7 2023-03-20 Ascending 54
8 2023-04-01 Ascending 54
9 2023-04-25 Ascending 54
10 2023-05-19 Ascending 54
11 2023-05-31 Ascending 54
12 2023-06-12 Ascending 54
13 2023-06-24 Ascending 54
14 2023-07-18 Ascending 54
15 2023-07-30 Ascending 54
16 2023-07-30 Ascending 54
17 2023-07-30 Ascending 54
18 2023-07-30 Ascending 54
19 2023-09-16 Ascending 54
20 2023-10-10 Ascending 54
21 2023-12-09 Ascending 54
22 2024-03-02 Ascending 54
23 2024-03-14 Ascending 54
24 2024-03-26 Ascending 54
25 2024-04-07 Ascending 54
26 2024-04-19 Ascending 54
27 2024-05-01 Ascending 54
28 2024-05-25 Ascending 54
29 2024-06-18 Ascending 54
30 2024-06-30 Ascending 54
31 2024-07-12 Ascending 54
32 2024-07-24 Ascending 54
33 2024-08-05 Ascending 54
34 2024-08-17 Ascending 54
35 2024-08-29 Ascending 54
36 2024-09-10 Ascending 54
37 2024-09-22 Ascending 54
38 2024-10-04 Ascending 54
39 2024-10-16 Ascending 54
41 2024-10-28 Ascending 54

GRD, ground range detected; UTC, universal time coordinated.

Table 2.
Pseudocode of Bayesian mixture model clustering in Sentinel-1 GRD data
Bayesian mixture model algorithm
Initialize Sentinel-1 GRD, Xn = [Svv,Svh]T ∈ R2
Initialize number of components, K = 3
Initialize parameters for each component:
 - Means μ
 - Covariances Σ
 - Weights π using Dirichlet prior with parameter α
for iteration = 1, max_iter do
 E-step: compute responsibilities γ
  for each data point Xn in X do
   for each component k in n_components do
    Compute γi,k = πk * N(xi μkk)
   Normalize γi over all components k
  end for
 M-step: update parameters based on responsibilities γ
  for each component k in n_components do
   Update weight πk using γ and α
   Update mean μk using weighted sum of xi
   Update covariance Σk using weighted covariance of xi
  end for
 Check for convergence:
  Compute log-likelihood of data under current parameters
  if change in log-likelihood < threshold then break
end for
Output:
 - Cluster labels for each data point based on highest responsibility γ
 - Final parameter values

GRD, ground range detected.

Table 3.
Model fitting and evaluation metrics for water level estimation at Yeongcheon reservoir
Fitting process Randomized search CV
Outlier parameters RANSAC minimum samples, 0.574
RANSAC residual threshold, 1.296
Best model equation y = 338.947x+119.257
RMSE 0.432a)
0.583
MAE 0.358a)
0.465
R2 0.981a)
0.967

RANSAC, random sample consensus; RMSE, root mean square error; MAE, mean absolute error.

a) Test set.

  • Bishop CM (2006) Pattern recognition and machine learning, Springer, New York, 110p
  • Choi S, Choi H (2022) Prediction of outflow of Yeongcheon Dam through artifical neural networks. J Converg Sci Technol 1(2):35–40Article
  • Gao H (2015) Satellite remote sensing of large lakes and reservoirs: from elevation and area to storage. WIREs Water 2(2):147–157ArticlePDF
  • Huang C, Chen Y, Zhang S, Wu J (2018) Detecting, extracting, and monitoring surface water from space using optical sensors: a review. Rev Geophys 56(2):333–360ArticlePDF
  • Kim SJ (2001) GIS-based water resources management information system (WAMIS) in Korea. Korean J Ecology and Environment 34(4):349–356
  • Kim W, Jeong J, Choi M (2022) Evaluation of reservoir monitoring-based hydrological drought index using Sentinel-1 SAR waterbody detection technique. Korean J Remote Sens 38(2):153–166
  • Klemas V (2015) Remote sensing of floods and flood-prone areas: an overview. J of Coastal Research 31(4):1005–1013Article
  • Lehner B, Döll P (2004) Development and validation of a global database of lakes, reservoirs and wetlands. J Hydrol 296(1-4):1–22Article
  • Martinis S, Kersten J, Twele A (2015) A fully automated TerraSAR-X based flood service. ISPRS J Photogramm Remote Sens 104:203–212Article
  • Meer P, Mintz D, Rosenfeld A, Kim DY (1991) Robust regression methods for computer vision: a review. Int J Comput Vis 6:59–70ArticlePDF
  • Mudashiru RB, Sabtu N, Abustan I, Balogun W (2021) Flood hazard mapping methods: a review. J Hydrol 603(A):126846Article
  • Perona P, Malik J (1990) Scale-space and edge detection using anisotropic diffusion. IEEE Trans Pattern Anal Mach Intell 12(7):629–639Article
  • Rasmussen CE (2000) The infinite Gaussian mixture model. In: Solla SA, Leen TK, Muller KR (eds) Advances in neural information processing systems, vol 12. MIT Press, Cambridge, MA, pp 554-560
  • Refice A, Capolongo D, Pasquariello G, D’Addabbo A, Bovenga F, Nutricato R (2014) SAR and InSAR for flood monitoring: examples with COSMO-SkyMed data. IEEE J Sel Top Appl Earth Obs Remote Sens 7(7):2711–2722Article
  • Wagner W, Bauer-Marschallinger B, Navacchi C, et al (2021) A Sentinel-1 backscatter datacube for global land monitoring applications. Remote Sens 13(22):4622Article
  • Yang L, Shami A (2020) On hyperparameter optimization of machine learning algorithms: theory and practice. Neurocomputing 415:295–316Article
Meta Data for Dataset
Essential
Field Sub-Category
Title of Dataset Sentinel-1 SAR GRD: C-band Synthetic Aperture Radar Ground Range Detected, log scaling
DOI https://doi.org/10.5281/zenodo.7254220
Category ImageryBaseMapsEarthCover
Temporal Coverage 2023.01.-2024.10.
Spatial Coverage Address Yeongcheon-si (South Korea)
WGS84 Coordinates [East] 129.0815523568195
[West] 128.99226026630947
[South] 36.06292869114351
[North] 36.114579720440545
Personnel Name European Space Agency (ESA)
Affiliation Copernicus Programme, European Space Agency
E-mail eosupport@esa.int
CC License CC-BY
Optional
Field Sub-Category
Summary of Dataset
Project The Development of Ground Operation System for Water Resources Satellite
Instrument Sentinel-1

Figure & Data

References

    Citations

    Citations to this article as recorded by  

      Figure
      • 0
      • 1
      • 2
      • 3
      • 4
      Waterbody Detection and Reservoir Water Level Prediction Using Bayesian Mixture Models with Sentinel-1 GRD Data
      Image Image Image Image Image
      Fig. 1. Map of the study area in Youngcheon reservoir using ESRI world imagery.
      Fig. 2. The Otsu threshold for binary classification in each polarization, along with clustering results using a K-means-based GMM algorithm. Unlike binary classification based solely on individual polarization histograms, probabilistic clustering in the two-dimensional real space reveals regions that are either overestimated or underestimated by the binary classification approach. GMM, Gaussian mixture model.
      Fig. 3. Water body detection results using Sentinel-1 VV channel image and BMM with corresponding Sentinel-2 level-2C false color (B8-B4-B3) images. For comparison, Sentinel-2 level-2C false color images (B8-B4-B3) captured on the same dates are shown. From top to bottom, the images correspond to the following dates: January 19, 2023, March 14, 2024, July 12, 2024, and September 10, 2024. BMM, Bayesian mixture model.
      Fig. 4. Regression analysis of water/land area ratio and WAMIS water level for Yeongcheon reservoir. A model evaluation on the test set produced an RMSE of 0.432 and an MAE of 0.358, while the overall dataset yielded an RMSE of 0.583 and an MAE of 0.465. Additionally, the R2 value was 0.981 for the test set and 0.967 for the entire dataset, indicating a strong correlation between the two variables. WAMIS, Water Resources Management Information System; RMSE, root mean square error; MAE, mean absolute error.
      Fig. 5. Comparison of estimated water levels and WAMIS observed water levels with residuals. WAMIS, Water Resources Management Information System; RMSE, root mean square error; MAE, mean absolute error.
      Waterbody Detection and Reservoir Water Level Prediction Using Bayesian Mixture Models with Sentinel-1 GRD Data
      Number Acquisition time (UTC) Orbit properties Relative orbit path
      1 2023-01-07 Ascending 54
      2 2023-01-19 Ascending 54
      3 2023-01-31 Ascending 54
      4 2023-02-12 Ascending 54
      5 2023-02-24 Ascending 54
      6 2023-03-08 Ascending 54
      7 2023-03-20 Ascending 54
      8 2023-04-01 Ascending 54
      9 2023-04-25 Ascending 54
      10 2023-05-19 Ascending 54
      11 2023-05-31 Ascending 54
      12 2023-06-12 Ascending 54
      13 2023-06-24 Ascending 54
      14 2023-07-18 Ascending 54
      15 2023-07-30 Ascending 54
      16 2023-07-30 Ascending 54
      17 2023-07-30 Ascending 54
      18 2023-07-30 Ascending 54
      19 2023-09-16 Ascending 54
      20 2023-10-10 Ascending 54
      21 2023-12-09 Ascending 54
      22 2024-03-02 Ascending 54
      23 2024-03-14 Ascending 54
      24 2024-03-26 Ascending 54
      25 2024-04-07 Ascending 54
      26 2024-04-19 Ascending 54
      27 2024-05-01 Ascending 54
      28 2024-05-25 Ascending 54
      29 2024-06-18 Ascending 54
      30 2024-06-30 Ascending 54
      31 2024-07-12 Ascending 54
      32 2024-07-24 Ascending 54
      33 2024-08-05 Ascending 54
      34 2024-08-17 Ascending 54
      35 2024-08-29 Ascending 54
      36 2024-09-10 Ascending 54
      37 2024-09-22 Ascending 54
      38 2024-10-04 Ascending 54
      39 2024-10-16 Ascending 54
      41 2024-10-28 Ascending 54
      Bayesian mixture model algorithm
      Initialize Sentinel-1 GRD, Xn = [Svv,Svh]T ∈ R2
      Initialize number of components, K = 3
      Initialize parameters for each component:
       - Means μ
       - Covariances Σ
       - Weights π using Dirichlet prior with parameter α
      for iteration = 1, max_iter do
       E-step: compute responsibilities γ
        for each data point Xn in X do
         for each component k in n_components do
          Compute γi,k = πk * N(xi μkk)
         Normalize γi over all components k
        end for
       M-step: update parameters based on responsibilities γ
        for each component k in n_components do
         Update weight πk using γ and α
         Update mean μk using weighted sum of xi
         Update covariance Σk using weighted covariance of xi
        end for
       Check for convergence:
        Compute log-likelihood of data under current parameters
        if change in log-likelihood < threshold then break
      end for
      Output:
       - Cluster labels for each data point based on highest responsibility γ
       - Final parameter values
      Fitting process Randomized search CV
      Outlier parameters RANSAC minimum samples, 0.574
      RANSAC residual threshold, 1.296
      Best model equation y = 338.947x+119.257
      RMSE 0.432a)
      0.583
      MAE 0.358a)
      0.465
      R2 0.981a)
      0.967
      Essential
      Field Sub-Category
      Title of Dataset Sentinel-1 SAR GRD: C-band Synthetic Aperture Radar Ground Range Detected, log scaling
      DOI https://doi.org/10.5281/zenodo.7254220
      Category ImageryBaseMapsEarthCover
      Temporal Coverage 2023.01.-2024.10.
      Spatial Coverage Address Yeongcheon-si (South Korea)
      WGS84 Coordinates [East] 129.0815523568195
      [West] 128.99226026630947
      [South] 36.06292869114351
      [North] 36.114579720440545
      Personnel Name European Space Agency (ESA)
      Affiliation Copernicus Programme, European Space Agency
      E-mail eosupport@esa.int
      CC License CC-BY
      Optional
      Field Sub-Category
      Summary of Dataset
      Project The Development of Ground Operation System for Water Resources Satellite
      Instrument Sentinel-1
      Table 1. List of Sentinel-1 GRD dual-polarization data (VV, VH)

      GRD, ground range detected; UTC, universal time coordinated.

      Table 2. Pseudocode of Bayesian mixture model clustering in Sentinel-1 GRD data

      GRD, ground range detected.

      Table 3. Model fitting and evaluation metrics for water level estimation at Yeongcheon reservoir

      RANSAC, random sample consensus; RMSE, root mean square error; MAE, mean absolute error.

      Test set.


      GEO DATA : GEO DATA
      TOP