Қазақ тілін тану жүйесін өз бетінше оқыту
Қаралымдар: 232 / PDF жүктеулері: 195
DOI:
https://doi.org/10.32523/2616-7182/bulmathenu.2023/4.2Кілт сөздер:
автоматты түрде сөйлеуді тану, қазақ тілі, Wav2Vec 2.0, Wav2Vec2-XLSR, алдын ала дайындалған трансформер үлгілері, сөйлеуді бейнелеу үлгілеріАңдатпа
Жақында ауқымды көптілді мәтіндік және ауызша деректерге үйретілген нейрондық модельдердегі жетістіктер ресурсы аз тілдердің жағдайын жақсартудың перспективалы әлеуетін көрсетті. Бұл зерттеу сөзді танудың жетілдірілген үлгілерін, атап айтқанда Wav2Vec2.0 және Wav2Vec2-XLSR, қазақ тіліне қолданылатын эксперименттерді жүргізуге бағытталған. Бұл зерттеудің негізгі мақсаты – осы үлгілердің ауызша қазақша мазмұнды транскрипциялаудағы тиімділігін бағалау. Сонымен қатар, зерттеу бастапқы оқыту үшін басқа тілдердегі деректерді пайдалану мүмкіндігін зерттеуге және үлгіні мақсатты тілдегі деректермен нақтылау оның өнімділігін жақсартуға болатынын бағалауға бағытталған. Осылайша, бұл зерттеу ресурс шектеулі тілдер контекстінде алдын ала дайындалған көптілді модельдерді пайдаланудың өміршеңдігі туралы құнды ақпаратты ұсынады. Жақсы бапталған wav2vec2.0-XLSR моделі kazcorpus деректер жинағының сынақ жинағымен салыстырғанда 1,9 таңба қатесінің көрсеткісін (CER) және 8,9 сөз қатесінің көрсеткісін (WER) бере отырып, өте жақсы жұмыс жасады. Бұл талдаудың нәтижелері қазақ тіліне бейімделген сенімді және тиімді сөзді автоматты түрде тану (ASR) жүйелерін құруға ықпал ете алады. Бұл әзірлемелер сөйлеуден мәтінге, дауыстық көмекшілер мен дауыстық байланыстарды қоса алғанда, бірқатар қолданбаларға пайдалы болады.