Контекстно залежна адаптація відповідей генеративних LLM
Loading...
Date
2025
Journal Title
Journal ISSN
Volume Title
Publisher
Український державний університет науки і технологій, ІВК «Системні технології», Дніпро
Abstract
UKR: В умовах кризових ситуацій оперативність реагування набуває вирішального значення. Великі мовні моделі (LLM) здатні генерувати корисні рекомендації, однак їх стандартна поведінка часто не враховує специфічний контекст надзвичайних подій. У цій доповіді пропонується Adaptive Injectable Realignment Model (Adaptive IRM) як підхід для досягнення контекстно залежної генерації відповідей. Adaptive IRM – це невеликий нейронний модуль, який інтегрується у прямий прохід LLM та ін’єктує контекстні сигнали для корекції внутрішніх представлень моделі без зміни її основних ваг. Наша розробка орієнтована на кризовий контекст, з використанням N нейронів (у нашому випадку N = 4), які відповідають за стихійні лиха (землетрус, повінь, пожежу та ураган). Вихідні сигнали Adaptive IRM, які додаються на різних шарах трансформера, модифікує механізми уваги з метою підсилення інформації, релевантної конкретному контексту. У доповіді окреслено архітектуру IRM, описано запропоновані розширення, а також подано план використання датасету HumAID для навчання Adaptive IRM. Експериментальні результати поки відсутні; натомість, обговорено концепцію, мотивацію та перспективи впровадження запропонованої системи.
ENG: In crisis situations, the speed of response becomes critically important. Large Language Models (LLMs) are capable of generating useful recommendations; however, their default behavior often fails to account for the specific context of emergency events. This paper proposes the Adaptive Injectable Realignment Model (Adaptive IRM) as a method for achieving context-aware response generation. Adaptive IRM is a lightweight neural module that integrates into the LLM’s forward pass and injects contextual signals to adjust the model’s internal representations without modifying its original weights. Our approach is focused on disaster scenarios, using N neurons (in our case, N = 4) corresponding to natural hazards such as earthquakes, floods, fires, and hurricanes. The output signals from the Adaptive IRM, injected at various transformer layers, modulate attention mechanisms to emphasize information relevant to the given context. The paper outlines the IRM architecture, describes the proposed extensions, and presents a plan for using the HumAID dataset to train the Adaptive IRM. Experimental results are not yet available; instead, the concept, motivation, and implementation strategy of the proposed system are discussed.
ENG: In crisis situations, the speed of response becomes critically important. Large Language Models (LLMs) are capable of generating useful recommendations; however, their default behavior often fails to account for the specific context of emergency events. This paper proposes the Adaptive Injectable Realignment Model (Adaptive IRM) as a method for achieving context-aware response generation. Adaptive IRM is a lightweight neural module that integrates into the LLM’s forward pass and injects contextual signals to adjust the model’s internal representations without modifying its original weights. Our approach is focused on disaster scenarios, using N neurons (in our case, N = 4) corresponding to natural hazards such as earthquakes, floods, fires, and hurricanes. The output signals from the Adaptive IRM, injected at various transformer layers, modulate attention mechanisms to emphasize information relevant to the given context. The paper outlines the IRM architecture, describes the proposed extensions, and presents a plan for using the HumAID dataset to train the Adaptive IRM. Experimental results are not yet available; instead, the concept, motivation, and implementation strategy of the proposed system are discussed.
Description
А. Гуда: ORCID 0000-0003-1139-1580
Keywords
контекстно залежна генерація, великі мовні моделі, адаптивне вирівнювання, модуляція нейронів, кризова інформатика, датасет HumAID, втручання на рівні шарів, архітектури трансформера, адаптація поведінки моделі, context-aware generation, large language models, adaptive alignment, neuron modulation, crisis informatics, HumAID dataset, layerwise intervention, transformer architectures, model behavior adaptation, КІТС
Citation
Березюк М. О., Гуда А. І. Контекстно залежна адаптація відповідей генеративних LLM. Інформаційні технології в металургії та машинобудуванні – ІТММ’2025 : тези доп. Міжнародної наук.-техн. конф. (м. Дніпро, 23-24 березня 2025 р.). Дніпро, 2025. C. 503–508. DOI: 10.34185/1991-7848.itmm.2025.01.089.