Состоялся научный семинар о квантитативном исследовании морфосинтаксических параметров
В Институте филологии и межкультурной коммуникации прошёл научный семинар «Квантитативное исследование морфосинтаксических параметров и отношений на материале больших языковых корпусов»
10 апреля 2025 года в Институте филологии и межкультурной коммуникации прошёл научный семинар «Квантитативное исследование морфосинтаксических параметров и отношений на материале больших языковых корпусов», организованный научно-исследовательской лабораторией «Лингвистика и искусственный интеллект» (руководитель – д.ф.-м.н., проф. В.Д. Соловьёв).
Докладчиком выступил Эдуард Станиславович Клышинский из Национального исследовательского университета «Высшая школа экономики». Он представил исследование, посвящённое автоматизации извлечения словарей глагольной сочетаемости и глагольного управления русского языка из большого корпуса неразмеченных текстов.
В рамках диссертационного исследования на степень доктора наук было проведен анализ распределения слов двенадцати языков по видам грамматической неоднозначности. Было показано, что русскому языку в большей мере присуща однозначность слов по части речи. С точки зрения синтаксиса исследовался материал из коллекции корпусов Universal Dependencies, включающей данные из 65 языков. Также был предложен новый метод оценки синтаксического ветвления и проведено ранжирование языков по присущей им строгости данного параметра. На основе собранных данных в качестве языка дальнейшего исследования был выбран русский язык.
В ходе дискуссии обсуждались различные вопросы, связанные с спецификой использования терминов «валентность» и «актантная структура» глагола, грамматическим статусом послелогов и их применимостью для русского языка. Также сравнивались различные языковые ресурсы, такие как RuWordNet, DeepPower, СинТагРус, AOT.ru, их преимущества и пока ещё скрытый потенциал.
В конце семинара участники семинара обсудили один из выводов исследования, подчёркивающий уникальность морфосинтаксической системы русского языка, позволившей получить выборку с высокой степенью однозначности слов по части речи, иными словами – наиболее результативно снимать омонимию автоматизированными методами.
Источник информации: НИЛ «Лингвистика и искусственный интеллект»
Последние новости:
Раис Татарстана открыл научно-образовательный центр "Белем" в ИФМК КФУ
13.08.2025
Ушел из жизни заслуженный профессор Казанского университета Геннадий Николаев
09.08.2025
Студентка ИФМК КФУ на Всероссийском интенсиве «Точка будущего»
08.08.2025
Встречи Радифа Замалетдинова со стобалльниками дали результат
07.08.2025
Сердца Летнего университета
05.08.2025