Состоялся научный семинар, посвящённый разработке новых методов машинного перевода
В стенах ИФМК прошёл организованный научно-исследовательскими лабораториями «Лингвистика и искусственный интеллект» и «Мультидисциплинарные исследования текста» научный семинар, посвящённый разработке новых методов машинного перевода
В стенах ИФМК 3 сентября 2024 года прошёл организованный научно-исследовательскими лабораториями «Лингвистика и искусственный интеллект» и «Мультидисциплинарные исследования текста» научный семинар, посвящённый разработке новых методов машинного перевода. С докладом «Разработка нейросетевых моделей и методов для низкоресурсного машинного перевода» выступила научный сотрудник «Университета Иннополис» Хусаинова Альбина Маратовна.
В начале своего выступления Альбина Маратовна отметила, что разработка методов нейросетевого машинного перевода обретает актуальность в связи с растущим спросом на переводческие услуги и необходимостью оптимизации ресурсов.
Затем докладчица перешла к апробации выбранных ей методов, использующих моноязычные данные, применив их на корпусе татарских текстов. Это позволило ей продемонстрировать эффективность предложенных подходов и их потенциал для дальнейшего развития на материале других языков мира. Особое внимание было уделено иерархической модели машинного перевода, которая позволяет улучшить качество перевода за счёт использования дополнительных уровней анализа.
Также была представлена методика сэмплирования диспропорциональных данных для многоязычного нейросетевого машинного перевода с привлечением данных других родственных языков тюркской (казахский, турецкий) и индоевропейской (немецкий, польский) групп. Этот подход позволяет учитывать особенности каждого языка и обеспечивать более точный перевод.
В завершение доклада Альбина Маратовна рассмотрела задачу составления двуязычного русско-английского словаря устойчивых выражений (подопытный кролик // guinea pig), и показала, как можно использовать методы машинного обучения для её решения.
Доклад вызвал большой интерес у аудитории, о чём говорит ряд заданных докладчику вопросов как технического, так и лингвистического характера. Участников семинара интересовали проблемы использования специализированных токенов, минимально возможного объёма текстового материала для обучения искусственного интеллекта, а также практического применения представленных методов и перспектив дальнейших исследований в области именно низкоресурсного перевода.
Источник информации: Галеев Тимур Ильдарович
Последние новости:
Медиа-класс укучылары институтка килде
11.10.2024
Дежурство в общежитиях КФУ
09.10.2024
Л.И. Мингазова приняла участие в 11-м Международном симпозиуме по детской и юношеской литературе
09.10.2024
Бесплатные курсы татарского языка
08.10.2024
Дорогие абитуриенты и уважаемые родители!
08.10.2024