Проблеми рефакторингу програмного коду із застосуванням штучного інтелекту
Loading...
Files
Date
2025
Journal Title
Journal ISSN
Volume Title
Publisher
Український державний університет науки і технологій, Дніпро
Abstract
UKR: Мета. Сучасний технологічний ландшафт характеризується стрімким розвитком програмного забезпечення, орієнтованого на різноманітні предметні галузі та платформи. Це зумовлює неперервне створення нових програмних продуктів, що складаються з величезної кількості рядків коду. Процес розробки якісного програмного забезпечення є багатоетапним і містить низку факторів, які впливають на кінцевий результат. Серед ключових аспектів виділяють компетентність розробників, ефективність проєктного менеджменту, доступність необхідних ресурсів та здатність адаптуватися до змінних вимог. Кожна платформа має свої специфічні особливості, які необхідно враховувати під час розробки, що додатково ускладнює процес створення універсальних та ефективних програмних рішень. Наше дослідження має на меті здійснити комплексний аналіз потенціалу та перспективних напрямів застосування великих мовних моделей у контексті рефакторингу програмного коду. Робота спрямована на розробку та вдосконалення методів, які сприятимуть підвищенню ефективності процесу рефакторингу за допомогою цих моделей. Методика. Для вирішення вищезазначених проблем запропоновано реалізувати комплекс методів, які можуть бути застосовані як окремо, так і в синергії, з метою оптимізації кінцевого результату. Ці методи, ретельно розроблені в контексті сучасних парадигм програмної інженерії, спрямовані на підвищення ефективності процесу рефакторингу, забезпечуючи при цьому збереження функціональності програмного забезпечення. Їх імплементація передбачає систематичний підхід до аналізу та модифікації кодової бази, враховуючи як технічні аспекти, так і потенційний вплив на загальну архітектуру системи. Результати. Проведено комплексний аналіз наявних мовних моделей та розроблено методи підвищення ефективності великих мовних моделей у контексті рефакторингу коду. Виявлено ключові фактори, що впливають на успішність застосування запропонованих методів, зокрема обсяг навчальних даних та обмеження контексту моделі. Наукова новизна. Розроблено підхід до підвищення ефективності великих мовних моделей у рефакторингу коду, що враховує специфіку різних проєктів та етапів розробки. Запропоновано інноваційні методи донавчання мовних моделей та оптимізації використання контексту, що розширюють можливості автоматизованого рефакторингу. Практична значимість. Результати дослідження дозволяють поліпшити ефективність рефакторингу коду із застосуванням великих мовних моделей.
ENG: Purpose. The modern technological landscape is characterized by the rapid development of software focused on various subject areas and platforms. This leads to the continuous creation of new software products consisting of a huge number of lines of code. The process of developing high-quality software is a multi-stage process that involves a number of factors that affect the final result. The key aspects include the competence of developers, the effectiveness of project management, the availability of necessary resources, and the ability to adapt to changing requirements. Each platform has its own specific features that must be taken into account during development, which further complicates the process of creating universal and effective software solutions. Our research aims to conduct a comprehensive analysis of the potential and promising areas of application of large language models in the context of program code refactoring. The work is aimed at developing and improving methods that will help to increase the efficiency of the refactoring process using these models. Methodology. To solve the above problems, it is proposed to implement a set of methods that can be used both separately and in synergy to optimize the final result. These methods, carefully developed in the context of modern software engineering paradigms, are aimed at increasing the efficiency of the refactoring process while ensuring that the software functionality is preserved. Their implementation involves a systematic approach to analyzing and modifying the code base, taking into account both technical aspects and the potential impact on the overall system architecture. Findings. A comprehensive analysis of existing language models has been conducted and methods for improving the efficiency of large language models in the context of code refactoring have been developed. The key factors that influence the success of the proposed methods, including the amount of training data and the limitations of the model context, are identified. Originality. An approach to improving the efficiency of large language models in code refactoring that takes into account the specifics of different projects and development stages is developed. Innovative methods for retraining language models and optimizing the use of context are proposed, which expand the capabilities of automated refactoring. Practical value. The results of the study allow to improve the efficiency of code refactoring using large language models.
ENG: Purpose. The modern technological landscape is characterized by the rapid development of software focused on various subject areas and platforms. This leads to the continuous creation of new software products consisting of a huge number of lines of code. The process of developing high-quality software is a multi-stage process that involves a number of factors that affect the final result. The key aspects include the competence of developers, the effectiveness of project management, the availability of necessary resources, and the ability to adapt to changing requirements. Each platform has its own specific features that must be taken into account during development, which further complicates the process of creating universal and effective software solutions. Our research aims to conduct a comprehensive analysis of the potential and promising areas of application of large language models in the context of program code refactoring. The work is aimed at developing and improving methods that will help to increase the efficiency of the refactoring process using these models. Methodology. To solve the above problems, it is proposed to implement a set of methods that can be used both separately and in synergy to optimize the final result. These methods, carefully developed in the context of modern software engineering paradigms, are aimed at increasing the efficiency of the refactoring process while ensuring that the software functionality is preserved. Their implementation involves a systematic approach to analyzing and modifying the code base, taking into account both technical aspects and the potential impact on the overall system architecture. Findings. A comprehensive analysis of existing language models has been conducted and methods for improving the efficiency of large language models in the context of code refactoring have been developed. The key factors that influence the success of the proposed methods, including the amount of training data and the limitations of the model context, are identified. Originality. An approach to improving the efficiency of large language models in code refactoring that takes into account the specifics of different projects and development stages is developed. Innovative methods for retraining language models and optimizing the use of context are proposed, which expand the capabilities of automated refactoring. Practical value. The results of the study allow to improve the efficiency of code refactoring using large language models.
Description
О. Сирота: ORCID 0000-0001-7391-2471; В. Горячкін: ORCID 0000-0002-8952-952X
Keywords
якість програмного коду, програмний код, рефакторинг, велика мовна модель, штучний інтелект, програмна інженерія, program code quality, program code, refactoring, large language model, artificial intelligence, software engineering, КІТ ДІІТ
Citation
Сирота О. А., Горячкін В. М. Проблеми рефакторингу програмного коду із застосуванням штучного інтелекту. Наука та прогрес транспорту. 2025. № 1. С. 77–84. DOI: 10.15802/stp2025/325888.