Дослідження технологій BigData для структуризації інформації з соцмереж і визначення трендів

Loading...
Thumbnail Image
Date
2020
Journal Title
Journal ISSN
Volume Title
Publisher
Дніпровський національний університет залізничного транспорту ім. акад. В. Лазаряна, Дніпро
Abstract
UK: Об‘єктом дослідження є сучасні засоби та підходи обробки BigData для аналізу текстових даних з соцмереж. Предметом дослідження є порівняння ефективності інструментів потокової та пакетної обробки даних BigData для задач обробки невеликих повідомлень. Метою дослідження в контексті даної роботи є визначення найбільш ефективних підходів обробки BigData шляхом порівняння найбільш використовуваних програмних засобів. Методи дослідження: виміри продуктивності засобів для вирішення поставленої задачі шляхом використання типових алгоритмів NLP. Пояснювальна записка складається зі вступу, 5 розділів, висновків, бібліографічного списку та 4 додатків. Галузь застосування є обширною, за наукової точки зору може бути використана для аналітики поведінки людей в соціальних мережах, з точки зору бізнесу має великий спектр використання, здебільного маркетинг. Вступ – описує суть, мету та актуальність роботи (3 сторінки). Перший розділ – розкриття проблеми, огляд можливих сфер використання (16 сторінок). Другий розділ – аналіз існуючих підходів та програмних засобів для вирішення поставленої задачі(16 сторінок). Третій розділ – побудова алгоритму для вирішення задачі (9 сторінок). Четвертому розділ – дослідження ефективності використання технлогії bigdata для структуризації інформації із соціальних мереж та пошук трендів (13 сторінок). П’ятий розділ – позгляд питань охорони та безпеки праці в надзвичайних ситуаціях (8 сторінок). Додатки – технічне завдання, робочий проект, 1 теза, 1 стаття.
EN: The object of research is modern tools and approaches for processing BigData for the analysis of text data from social networks. The subject of the study is to compare the efficiency of BigData streaming and batch data processing tools for small message processing tasks. The aim of the study in the context of this work is to determine the most effective approaches to processing BigData by comparing the most commonly used software. Research methods: measuring the productivity of tools to solve the problem by using typical NLP algorithms. The field of application is extensive, from a scientific point of view can be used to analyze the behavior of people in social networks, from a business point of view has a wide range of uses, mainly marketing. The explanatory note consists of an introduction, 5 chapters, conclusions, bibliography and 4 appendices. Introduction - describes the essence, purpose and relevance of the work (3 pages). The first section - disclosure of the problem, an overview of possible areas of use (16 pages). The second section is an analysis of existing approaches and software to solve the problem (16 pages). The third section is the construction of an algorithm for solving the problem (9 pages). The fourth section is a study of the effectiveness of using bigdata technology to structure information from social networks and search for trends (13 pages). The fifth section is an overview of occupational safety and health issues (8 pages). Appendices - terms of reference, working project, 1 thesis, 1 article.
Description
Keywords
соцмережі, аналіз текстових даних, обробка даних, алгоритми NLP, обробка BigData, social networks, text data analysis, data processing, algorithms NLP, processing BigData, ВКР
Citation
Жемела Г. А. Дослідження технологій BigData для структуризації інформації з соцмереж і визначення трендів : дипломна робота на здобуття кваліфікаційного ступеня магістра : спец. 121 – інженерія програмного забезпечення / наук. керівник В. О. Андрющенко ; Дніпров. нац. ун-т залізн. трансп. ім. акад. В. Лазаряна. Дніпро, 2020. 144 с.