Короткий опис(реферат):
У роботі розглядаються сучасні підходи до задачі розділення аудіосигналів із
використанням дифузійних генеративних моделей. Описано математичні основи дифузійного процесу, включно з прямим та зворотним проходами, а також два класи моделей, що використовують дифузійний процес: дифузійні ймовірнісні моделі усунення шуму і моделі, засновані на оціночних функціях. Представлено детальний огляд останніх робіт, які застосовують дифузійні моделі для розділення мовлення та музики, включно з гібридними підходами, що поєднують дискримінативні та генеративні архітектури. Обговорено
переваги дифузійних моделей, такі як можливість використання неанотованих даних,
покращена перцептивна якість та здатність працювати з неповними або зашумленими даними. Робота узагальнює поточний стан досліджень та вказує на перспективність подальшого вивчення дифузійних моделей для задач розділення джерел у складних акустичних умовах.
Суть розробки, основні результати:
Монастирський М. Дифузійні моделі в розділенні аудіосигналів / М. Монастирський // Міждисциплінарні виміри інновацій: від теорії до практики соціально-економічного розвитку: колективна монографія / За редакцією М. Швардак, О. Попович, В. Іванова, О. Дудаш. Мукачево: Мукачівський державний університет, Спілка науковців України. 2025. - С. 294-306