Analysis of the mel scale features using electrography and speech signals by parameterized KNN and XGBOOST

dc.contributor.authorSkuratovskyi, Ruslan
dc.contributor.authorBazarna, Anna
dc.date.accessioned2026-04-27T06:18:32Z
dc.date.issued2021
dc.description.abstractLanguage recognition is a multilevel pattern recognition task. Here, acoustic signals are analyzed and structured as a hierarchy of structural elements, words, phrases and sentences. Each level of such a hierarchy can provide time constants: possible word sequences or known pronunciation types that reduce recognition errors to a lower level. The analysis of the dynamics of voice and speech is suitable for improving the quality of human perception and the formation of human speech by a machine. It is within the capabilities of artificial intelligence. Emotion results can be widely applied in e-learning platforms, automotive systems, medicine, etc. Розпізнавання мови – це багаторівнева задача розпізнавання образів. Тут акустичні сигнали аналізуються і структуруються в ієрархію структурних елементів, слів, фраз і пропозицій. Кожен рівень такої ієрархії може передбачати деякі тимчасові константи: можливі послідовності слів або відомі види вимови, які дозволяють зменшити кількість помилок розпізнавання на більш низькому рівні. Аналіз голосу і динаміки мови доцільний для підвищення якості сприйняття людиною і формування людської мови машиною і знаходиться в межах можливостей штучного інтелекту. Результати визначення емоцій можуть широко застосовуватися в платформах електронного навчання, автомобільних бортових системах, медицині і т. д.
dc.identifier.citationSkuratovskyi, R. Analysis of the mel scale features using electrography and speech signals by parameterized KNN and XGBOOST / R. Skuratovskyi, A. Bazarna // Інформаційні технології та суспільство. - 2021. - Вип. 2. - С. 58-74.
dc.identifier.orcidhttps://orcid.org/0000-0002-5692-6123
dc.identifier.urihttps://ir.maup.com.ua/handle/123456789/1310
dc.language.isoen
dc.subjectmachine learning
dc.subjectмашинне навчання
dc.subjectspeech recognition
dc.subjectрозпізнавання мови
dc.subjectdecision tree
dc.subjectдерево рішень
dc.titleAnalysis of the mel scale features using electrography and speech signals by parameterized KNN and XGBOOST
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Nauk_inftech_6.pdf
Розмір:
1.17 MB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
1.71 KB
Формат:
Item-specific license agreed to upon submission
Опис:

Колекції