Контекстно залежна адаптація відповідей генеративних LLM
dc.contributor.author | Березюк, Микита Олександрович | uk_UA |
dc.contributor.author | Гуда, Антон Ігорович | uk_UA |
dc.date.accessioned | 2025-05-26T10:53:45Z | |
dc.date.available | 2025-05-26T10:53:45Z | |
dc.date.issued | 2025 | |
dc.description | А. Гуда: ORCID 0000-0003-1139-1580 | uk_UA |
dc.description.abstract | UKR: В умовах кризових ситуацій оперативність реагування набуває вирішального значення. Великі мовні моделі (LLM) здатні генерувати корисні рекомендації, однак їх стандартна поведінка часто не враховує специфічний контекст надзвичайних подій. У цій доповіді пропонується Adaptive Injectable Realignment Model (Adaptive IRM) як підхід для досягнення контекстно залежної генерації відповідей. Adaptive IRM – це невеликий нейронний модуль, який інтегрується у прямий прохід LLM та ін’єктує контекстні сигнали для корекції внутрішніх представлень моделі без зміни її основних ваг. Наша розробка орієнтована на кризовий контекст, з використанням N нейронів (у нашому випадку N = 4), які відповідають за стихійні лиха (землетрус, повінь, пожежу та ураган). Вихідні сигнали Adaptive IRM, які додаються на різних шарах трансформера, модифікує механізми уваги з метою підсилення інформації, релевантної конкретному контексту. У доповіді окреслено архітектуру IRM, описано запропоновані розширення, а також подано план використання датасету HumAID для навчання Adaptive IRM. Експериментальні результати поки відсутні; натомість, обговорено концепцію, мотивацію та перспективи впровадження запропонованої системи. | uk_UA |
dc.description.abstract | ENG: In crisis situations, the speed of response becomes critically important. Large Language Models (LLMs) are capable of generating useful recommendations; however, their default behavior often fails to account for the specific context of emergency events. This paper proposes the Adaptive Injectable Realignment Model (Adaptive IRM) as a method for achieving context-aware response generation. Adaptive IRM is a lightweight neural module that integrates into the LLM’s forward pass and injects contextual signals to adjust the model’s internal representations without modifying its original weights. Our approach is focused on disaster scenarios, using N neurons (in our case, N = 4) corresponding to natural hazards such as earthquakes, floods, fires, and hurricanes. The output signals from the Adaptive IRM, injected at various transformer layers, modulate attention mechanisms to emphasize information relevant to the given context. The paper outlines the IRM architecture, describes the proposed extensions, and presents a plan for using the HumAID dataset to train the Adaptive IRM. Experimental results are not yet available; instead, the concept, motivation, and implementation strategy of the proposed system are discussed. | en |
dc.identifier.citation | Березюк М. О., Гуда А. І. Контекстно залежна адаптація відповідей генеративних LLM. Інформаційні технології в металургії та машинобудуванні – ІТММ’2025 : тези доп. Міжнародної наук.-техн. конф. (м. Дніпро, 23-24 березня 2025 р.). Дніпро, 2025. C. 503–508. DOI: 10.34185/1991-7848.itmm.2025.01.089. | uk_UA |
dc.identifier.doi | 10.34185/1991-7848.itmm.2025.01.089 | |
dc.identifier.issn | 2708-0102 (Online) | |
dc.identifier.uri | https://journals.nmetau.edu.ua/index.php/itmm/article/view/2156 | en |
dc.identifier.uri | https://crust.ust.edu.ua/handle/123456789/20369 | en |
dc.language.iso | uk | |
dc.publisher | Український державний університет науки і технологій, ІВК «Системні технології», Дніпро | uk_UA |
dc.subject | контекстно залежна генерація | uk_UA |
dc.subject | великі мовні моделі | uk_UA |
dc.subject | адаптивне вирівнювання | uk_UA |
dc.subject | модуляція нейронів | uk_UA |
dc.subject | кризова інформатика | uk_UA |
dc.subject | датасет HumAID | uk_UA |
dc.subject | втручання на рівні шарів | uk_UA |
dc.subject | архітектури трансформера | uk_UA |
dc.subject | адаптація поведінки моделі | uk_UA |
dc.subject | context-aware generation | en |
dc.subject | large language models | en |
dc.subject | adaptive alignment | en |
dc.subject | neuron modulation | en |
dc.subject | crisis informatics | en |
dc.subject | HumAID dataset | en |
dc.subject | layerwise intervention | en |
dc.subject | transformer architectures | en |
dc.subject | model behavior adaptation | en |
dc.subject | КІТС | uk_UA |
dc.subject.classification | TECHNOLOGY::Information technology | en |
dc.title | Контекстно залежна адаптація відповідей генеративних LLM | uk_UA |
dc.title.alternative | Context-Aware Adaptation of Generative LLM Responses | en |
dc.type | Thesis | en |