Machine Learning for Automatic Extraction of Water Bodies Using Sentinel-2 Imagery

Loading...
Thumbnail Image
Date
2024
Journal Title
Journal ISSN
Volume Title
Publisher
National University "Zaporizhzhia Polytechnic", Zaporizhzhia
Abstract
ENG: Context. Given the aggravation of environmental and water problems, there is a need to improve automated methods for extracting and monitoring water bodies in urban ecosystems. The problem of efficient and automated extraction of water bodies is becoming relevant given the large amount of data obtained from satellite systems. The object of study is water bodies that are automatically extracted from Sentinel-2 optical satellite images using machine learning methods. Objective. The goal of the work is to improve the efficiency of the process of extracting the boundaries of water bodies on digital optical satellite images by using machine learning methods. Method. The paper proposes an automated information technology for delineating the boundaries of water bodies on Sentinel-2 digital optical satellite images. The process includes eight stages, starting with data download and using topographic maps to obtain basic information about the study area. Then, the process involved data pre-processing, which included calibrating the images, removing atmospheric noise, and enhancing contrast. Next, the EfficientNet-B0 architecture is applied to identify water features, facilitating optimal network width scaling, depth, and image resolution. ResNet blocks compress and expand channels. It allows for optimal connectivity of large-scale and multi-channel links across layers. After that, the Regional Proposal Network defines regions of interest (ROI), and ROI alignment ensures data homogeneity. The Fully connected layer helps in segmenting the regions, and the Fully connected network creates binary masks for accurate identification of water bodies. The final step of the method is to analyze spatial and temporal changes in the images to identify differences, changes, and trends that may indicate specific phenomena or events. This approach allows automating and accurately identifying water features on satellite images using machine learning. Results. The implementation of the proposed technology is development through Python software development. An assessment of the technology’s accuracy, conducted through a comparative analysis with existing methods, such as water indices and K-means, confirms a high level of accuracy in the period from 2017 to 2023 (up to 98%). The Kappa coefficient, which considers the degree of consistency between the actual and predicted classification, confirms the stability and reliability of our approach, reaching a value of 0.96. Conclusions. The experiments confirm the effectiveness of the proposed automated information technology and allow us to recommend it for use in studies of changes in coastal areas, decision-making in the field of coastal resource management, and land use. Prospects for further research may include new methods that seasonal changes and provide robustness in the selection and mapping of water surfaces.
UKR: Актуальність. Враховуючи загострення екологічних та водних проблем, виникає необхідність у вдосконаленні автоматизованих методів визначення та моніторингу водних об’єктів у міських екосистемах. З врахуванням великого обсягу даних, отриманих від супутникових систем, проблема ефективного та автоматизованого вилучення водних об’єктів стає актуальною. Об’єктом дослідження є водні об’єкти, які автоматично виділяються з оптичних космічних знімків Sentinel-2 за допомогою методів машинного навчання. Мета роботи – підвищення ефективності процесу виділення границь водних об’єктів на цифрових оптичних космічних знімках за допомогою використання методів машинного навчання. Метод. Запропоновано автоматизовану інформаційну технологію виділення границь водних об’єктів на цифрових оптичних супутникових знімках Sentinel-2. Процес включає вісім етапів, починаючи з завантаження даних та використання топографічних карт для отримання базової інформації про предметну область. Після цього відбувається попередня обробка даних, включаючи калібрування зображень, видалення атмосферного шуму та підвищення контрастності. Далі застосовується архітектура EfficientNet-B0 для ідентифікації водних об’єктів, сприяючи оптимальному масштабуванню ширини мережі, глибини та роздільної здатності зображення. Використані ResNet блоки для стиснення та розширення каналів, що дозволяє оптимальне з’єднання великомасштабних та багатоканальних зв’язків у шарах. Після цього Regional Proposal Network визначає області інтересу (ROI), а ROI alignment забезпечує однорідність даних. Застосування Fully connected layer допомагає в сегментації областей, а Fully connected network створює бінарні маски для точної ідентифікації водних об’єктів. Заключним етапом методу є аналіз просторових та часових змін на зображеннях для виявлення різниць, змін та тенденцій, що можуть свідчити про конкретні явища чи події. Такий підхід дозволяє автоматизувати та точно визначати водні об’єкти на супутникових знімках з використанням машинного навчання. Результати. Розроблено програмне забезпечення мовою Python, що реалізує запропонований підхід. Оцінка точності технології, проведена шляхом порівняльного аналізу з існуючими методами, такими як водні індекси та K-means, підтверджує високий рівень точності в період з 2017 по 2023 роки (досягає 98%). Коефіцієнт Каппа, який враховує ступінь узгодженості між реальною та передбачуваною класифікацією, підтверджує стабільність та достовірність нашого підходу, досягаючи значення 0.96. Висновки. Проведені експерименти підтверджують ефективність запропонованої автоматизованої інформаційної технології та дозволяють рекомендувати її для використання в дослідженнях змін на прибережних територіях, прийняття рішень у сфері управління прибережними ресурсами та земельним використанням. Перспективи подальших досліджень можуть включати створення нових методів, які враховують сезонні зміни та забезпечують робастність при виділенні та картографуванні водних поверхонь.
Description
Vol. Hnatushenko: ORCID 0000-0003-3140-3788
Keywords
extraction, water bodies, optical satellite images, water spectral indices, machine learning, Kappa coefficient, Pearson coefficient, confusion matrix, виділення, водні об’єкти, оптичні супутникові знімки, водні індекси, машинне навчання, коефіцієнт Каппа, коефіцієнт Пірсона, матриця помилок, КІТС
Citation
Kashtan V. Yu., Hnatushenko Vol. V. Machine Learning for Automatic Extraction of Water Bodies Using Sentinel-2 Imagery. Radio Electronics, Computer Science, Control. 2024. No. 1. P. 118–127. DOI: https://doi.org/10.15588/1607-3274-2024-1-11.