Контекстно залежна адаптація відповідей генеративних LLM

Березюк, Микита Олександрович; Гуда, Антон Ігорович

Контекстно залежна адаптація відповідей генеративних LLM

Files

Berezuk.pdf (253.14 KB)

Date

2025

Authors

Березюк, Микита Олександрович

Гуда, Антон Ігорович

Publisher

Український державний університет науки і технологій, ІВК «Системні технології», Дніпро

Abstract

UKR: В умовах кризових ситуацій оперативність реагування набуває вирішального значення. Великі мовні моделі (LLM) здатні генерувати корисні рекомендації, однак їх стандартна поведінка часто не враховує специфічний контекст надзвичайних подій. У цій доповіді пропонується Adaptive Injectable Realignment Model (Adaptive IRM) як підхід для досягнення контекстно залежної генерації відповідей. Adaptive IRM – це невеликий нейронний модуль, який інтегрується у прямий прохід LLM та ін’єктує контекстні сигнали для корекції внутрішніх представлень моделі без зміни її основних ваг. Наша розробка орієнтована на кризовий контекст, з використанням N нейронів (у нашому випадку N = 4), які відповідають за стихійні лиха (землетрус, повінь, пожежу та ураган). Вихідні сигнали Adaptive IRM, які додаються на різних шарах трансформера, модифікує механізми уваги з метою підсилення інформації, релевантної конкретному контексту. У доповіді окреслено архітектуру IRM, описано запропоновані розширення, а також подано план використання датасету HumAID для навчання Adaptive IRM. Експериментальні результати поки відсутні; натомість, обговорено концепцію, мотивацію та перспективи впровадження запропонованої системи.
ENG: In crisis situations, the speed of response becomes critically important. Large Language Models (LLMs) are capable of generating useful recommendations; however, their default behavior often fails to account for the specific context of emergency events. This paper proposes the Adaptive Injectable Realignment Model (Adaptive IRM) as a method for achieving context-aware response generation. Adaptive IRM is a lightweight neural module that integrates into the LLM’s forward pass and injects contextual signals to adjust the model’s internal representations without modifying its original weights. Our approach is focused on disaster scenarios, using N neurons (in our case, N = 4) corresponding to natural hazards such as earthquakes, floods, fires, and hurricanes. The output signals from the Adaptive IRM, injected at various transformer layers, modulate attention mechanisms to emphasize information relevant to the given context. The paper outlines the IRM architecture, describes the proposed extensions, and presents a plan for using the HumAID dataset to train the Adaptive IRM. Experimental results are not yet available; instead, the concept, motivation, and implementation strategy of the proposed system are discussed.

Description

А. Гуда: ORCID 0000-0003-1139-1580

Keywords

контекстно залежна генерація, великі мовні моделі, адаптивне вирівнювання, модуляція нейронів, кризова інформатика, датасет HumAID, втручання на рівні шарів, архітектури трансформера, адаптація поведінки моделі, context-aware generation, large language models, adaptive alignment, neuron modulation, crisis informatics, HumAID dataset, layerwise intervention, transformer architectures, model behavior adaptation, КІТС

Citation

Березюк М. О., Гуда А. І. Контекстно залежна адаптація відповідей генеративних LLM. Інформаційні технології в металургії та машинобудуванні – ІТММ’2025 : тези доп. Міжнародної наук.-техн. конф. (м. Дніпро, 23-24 березня 2025 р.). Дніпро, 2025. C. 503–508. DOI: 10.34185/1991-7848.itmm.2025.01.089.

URI

https://journals.nmetau.edu.ua/index.php/itmm/article/view/2156
https://crust.ust.edu.ua/handle/123456789/20369

Collections

Міжнародна науково-технічна конференція «Інформаційні технології в металургії та машинобудуванні. ІТММ'25»
Інші праці КІТС (ДМетІ)

Full item page