Моделі та методи обробки мовних складових в системах комп'ютерного зору
| dc.contributor.author | Грищук Артем Іванович | |
| dc.date.accessioned | 2026-01-21T15:24:11Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Мета магістерської роботи - розробка, дослідження та реалізація моделей і методів обробки мовних складових для систем комп’ютерного зору, які забезпечують формування мультимодального представлення ознак об’єкту мовлення. Об’єкт дослідження - процеси обробки мовних сигналів у системах комп’ютерного зору, які реалізують взаємозв’язок між аудіо- та візуальними модальностями. Предмет дослідження - моделі, методи та алгоритми обробки мовних складових, що використовуються для формування, аналізу та синтезу візуальних образів на основі глибоких нейронних мереж. Результати дослідження В роботі розроблено методологію мультимодальної генерації зображення обличчя за голосом, яка базується на глибоких нейронних мережах та принципах кросмодального навчання. Висновок Розроблено архітектурне рішення на основі фреймворку Vec2Face, яке дозволяє здійснювати генерацію обличчя мовця за голосом з високим рівнем схожості. Отримано результати щодо узгодження латентних ознак різних модальностей у єдиному навчальному середовищі, що підвищує точність ідентифікації. | |
| dc.identifier.uri | https://repo.nung.edu.ua/handle/123456789/11495 | |
| dc.subject | ОБРОБКА МОВЛЕННЯ | |
| dc.subject | КОМП’ЮТЕРНИЙ ЗІР | |
| dc.subject | ГЛИБОКЕ НАВЧАННЯ | |
| dc.subject | НЕЙРОННІ МЕРЕЖІ | |
| dc.subject | МУЛЬТИМОДАЛЬНА ГЕНЕРАЦІЯ | |
| dc.subject | ІДЕНТИФІКАЦІЯ МОВЦЯ | |
| dc.subject | СИНТЕЗ ОБЛИЧЧЯ ЗА ГОЛОСОМ | |
| dc.subject | КРОСМОДАЛЬНЕ НАВЧАННЯ | |
| dc.subject | ФРЕЙМВОРК. | |
| dc.title | Моделі та методи обробки мовних складових в системах комп'ютерного зору | |
| dc.type | Thesis |
