Аналіз алгоритмів кластеризації для обробки великих даних
Files
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
UKR: Магістерська робота виконана на 171 сторінках, містить 58 рисунків, 3 таблиць та 19 використаних джерел. У магістерській роботі було спроектовано та розроблено програмне забезпечення для порівняння алгоритмів кластеризації великих даних. Проєкт надає можливість дослідникам оцінювати ефективність різних підходів, таких як K-means, ієрархічна кластеризація та DBSCAN, у задачах з текстовими та числовими даними. Програма забезпечує набір ключових функцій, зокрема завантаження та обробку даних, візуалізацію результатів кластеризації та обчислення метрик якості. Як допоміжні функції програма надає можливість налаштовувати параметри алгоритмів, експортувати результати та будувати інтерактивні графіки для аналізу
ENG: The master's thesis is performed on 171 pages, contains 58 figures, 3 tables and 19 sources used. In the master’s thesis, software was designed and developed for comparing clustering algorithms for large datasets. The project enables researchers to evaluate the performance of various approaches, such as K-means, hierarchical clustering, and DBSCAN, in tasks involving textual and numerical data. The software provides a set of key features, including data uploading and preprocessing, visualization of clustering results, and computation of quality metrics. As auxiliary features, the program offers the ability to adjust algorithm parameters, export results, and generate interactive graphs for analysis