Контекстно залежна адаптація відповідей генеративних LLM

dc.contributor.authorБерезюк, Микита Олександровичuk_UA
dc.contributor.authorГуда, Антон Ігоровичuk_UA
dc.date.accessioned2025-05-26T10:53:45Z
dc.date.available2025-05-26T10:53:45Z
dc.date.issued2025
dc.descriptionА. Гуда: ORCID 0000-0003-1139-1580uk_UA
dc.description.abstractUKR: В умовах кризових ситуацій оперативність реагування набуває вирішального значення. Великі мовні моделі (LLM) здатні генерувати корисні рекомендації, однак їх стандартна поведінка часто не враховує специфічний контекст надзвичайних подій. У цій доповіді пропонується Adaptive Injectable Realignment Model (Adaptive IRM) як підхід для досягнення контекстно залежної генерації відповідей. Adaptive IRM – це невеликий нейронний модуль, який інтегрується у прямий прохід LLM та ін’єктує контекстні сигнали для корекції внутрішніх представлень моделі без зміни її основних ваг. Наша розробка орієнтована на кризовий контекст, з використанням N нейронів (у нашому випадку N = 4), які відповідають за стихійні лиха (землетрус, повінь, пожежу та ураган). Вихідні сигнали Adaptive IRM, які додаються на різних шарах трансформера, модифікує механізми уваги з метою підсилення інформації, релевантної конкретному контексту. У доповіді окреслено архітектуру IRM, описано запропоновані розширення, а також подано план використання датасету HumAID для навчання Adaptive IRM. Експериментальні результати поки відсутні; натомість, обговорено концепцію, мотивацію та перспективи впровадження запропонованої системи.uk_UA
dc.description.abstractENG: In crisis situations, the speed of response becomes critically important. Large Language Models (LLMs) are capable of generating useful recommendations; however, their default behavior often fails to account for the specific context of emergency events. This paper proposes the Adaptive Injectable Realignment Model (Adaptive IRM) as a method for achieving context-aware response generation. Adaptive IRM is a lightweight neural module that integrates into the LLM’s forward pass and injects contextual signals to adjust the model’s internal representations without modifying its original weights. Our approach is focused on disaster scenarios, using N neurons (in our case, N = 4) corresponding to natural hazards such as earthquakes, floods, fires, and hurricanes. The output signals from the Adaptive IRM, injected at various transformer layers, modulate attention mechanisms to emphasize information relevant to the given context. The paper outlines the IRM architecture, describes the proposed extensions, and presents a plan for using the HumAID dataset to train the Adaptive IRM. Experimental results are not yet available; instead, the concept, motivation, and implementation strategy of the proposed system are discussed.en
dc.identifier.citationБерезюк М. О., Гуда А. І. Контекстно залежна адаптація відповідей генеративних LLM. Інформаційні технології в металургії та машинобудуванні – ІТММ’2025 : тези доп. Міжнародної наук.-техн. конф. (м. Дніпро, 23-24 березня 2025 р.). Дніпро, 2025. C. 503–508. DOI: 10.34185/1991-7848.itmm.2025.01.089.uk_UA
dc.identifier.doi10.34185/1991-7848.itmm.2025.01.089
dc.identifier.issn2708-0102 (Online)
dc.identifier.urihttps://journals.nmetau.edu.ua/index.php/itmm/article/view/2156en
dc.identifier.urihttps://crust.ust.edu.ua/handle/123456789/20369en
dc.language.isouk
dc.publisherУкраїнський державний університет науки і технологій, ІВК «Системні технології», Дніпроuk_UA
dc.subjectконтекстно залежна генераціяuk_UA
dc.subjectвеликі мовні моделіuk_UA
dc.subjectадаптивне вирівнюванняuk_UA
dc.subjectмодуляція нейронівuk_UA
dc.subjectкризова інформатикаuk_UA
dc.subjectдатасет HumAIDuk_UA
dc.subjectвтручання на рівні шарівuk_UA
dc.subjectархітектури трансформераuk_UA
dc.subjectадаптація поведінки моделіuk_UA
dc.subjectcontext-aware generationen
dc.subjectlarge language modelsen
dc.subjectadaptive alignmenten
dc.subjectneuron modulationen
dc.subjectcrisis informaticsen
dc.subjectHumAID dataseten
dc.subjectlayerwise interventionen
dc.subjecttransformer architecturesen
dc.subjectmodel behavior adaptationen
dc.subjectКІТСuk_UA
dc.subject.classificationTECHNOLOGY::Information technologyen
dc.titleКонтекстно залежна адаптація відповідей генеративних LLMuk_UA
dc.title.alternativeContext-Aware Adaptation of Generative LLM Responsesen
dc.typeThesisen
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Berezuk.pdf
Size:
253.14 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
159 B
Format:
Item-specific license agreed upon to submission
Description: