Моделі та методи обробки мовних складових в системах комп'ютерного зору

dc.contributor.authorГрищук Артем Іванович
dc.date.accessioned2026-01-21T15:24:11Z
dc.date.issued2025
dc.description.abstractМета магістерської роботи - розробка, дослідження та реалізація моделей і методів обробки мовних складових для систем комп’ютерного зору, які забезпечують формування мультимодального представлення ознак об’єкту мовлення. Об’єкт дослідження - процеси обробки мовних сигналів у системах комп’ютерного зору, які реалізують взаємозв’язок між аудіо- та візуальними модальностями. Предмет дослідження - моделі, методи та алгоритми обробки мовних складових, що використовуються для формування, аналізу та синтезу візуальних образів на основі глибоких нейронних мереж. Результати дослідження В роботі розроблено методологію мультимодальної генерації зображення обличчя за голосом, яка базується на глибоких нейронних мережах та принципах кросмодального навчання. Висновок Розроблено архітектурне рішення на основі фреймворку Vec2Face, яке дозволяє здійснювати генерацію обличчя мовця за голосом з високим рівнем схожості. Отримано результати щодо узгодження латентних ознак різних модальностей у єдиному навчальному середовищі, що підвищує точність ідентифікації.
dc.identifier.urihttps://repo.nung.edu.ua/handle/123456789/11495
dc.subjectОБРОБКА МОВЛЕННЯ
dc.subjectКОМП’ЮТЕРНИЙ ЗІР
dc.subjectГЛИБОКЕ НАВЧАННЯ
dc.subjectНЕЙРОННІ МЕРЕЖІ
dc.subjectМУЛЬТИМОДАЛЬНА ГЕНЕРАЦІЯ
dc.subjectІДЕНТИФІКАЦІЯ МОВЦЯ
dc.subjectСИНТЕЗ ОБЛИЧЧЯ ЗА ГОЛОСОМ
dc.subjectКРОСМОДАЛЬНЕ НАВЧАННЯ
dc.subjectФРЕЙМВОРК.
dc.titleМоделі та методи обробки мовних складових в системах комп'ютерного зору
dc.typeThesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
2025_Магiстерська_IПм_24_1_Грищук.pdf
Size:
6.53 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: