Состоялся научный семинар о квантитативном исследовании морфосинтаксических параметров | ИФМК КФУ

Адрес для получения консультаций по приему:
г. Казань, ул. Татарстан д.2, кабинет 213

Телефон для получения консультаций по приему для абитуриентов:
8 (993) 410-05-44

Состоялся научный семинар о квантитативном исследовании морфосинтаксических параметров

В Институте филологии и межкультурной коммуникации прошёл научный семинар «Квантитативное исследование морфосинтаксических параметров и отношений на материале больших языковых корпусов»

10 апреля 2025 года в Институте филологии и межкультурной коммуникации прошёл научный семинар «Квантитативное исследование морфосинтаксических параметров и отношений на материале больших языковых корпусов», организованный научно-исследовательской лабораторией «Лингвистика и искусственный интеллект» (руководитель – д.ф.-м.н., проф. В.Д. Соловьёв).

Докладчиком выступил Эдуард Станиславович Клышинский из Национального исследовательского университета «Высшая школа экономики». Он представил исследование, посвящённое автоматизации извлечения словарей глагольной сочетаемости и глагольного управления русского языка из большого корпуса неразмеченных текстов.

В рамках диссертационного исследования на степень доктора наук было проведен анализ распределения слов двенадцати языков по видам грамматической неоднозначности. Было показано, что русскому языку в большей мере присуща однозначность слов по части речи. С точки зрения синтаксиса исследовался материал из коллекции корпусов Universal Dependencies, включающей данные из 65 языков. Также был предложен новый метод оценки синтаксического ветвления и проведено ранжирование языков по присущей им строгости данного параметра. На основе собранных данных в качестве языка дальнейшего исследования был выбран русский язык.

В ходе дискуссии обсуждались различные вопросы, связанные с спецификой использования терминов «валентность» и «актантная структура» глагола, грамматическим статусом послелогов и их применимостью для русского языка. Также сравнивались различные языковые ресурсы, такие как RuWordNet, DeepPower, СинТагРус, AOT.ru, их преимущества и пока ещё скрытый потенциал.

В конце семинара участники семинара обсудили один из выводов исследования, подчёркивающий уникальность морфосинтаксической системы русского языка, позволившей получить выборку с высокой степенью однозначности слов по части речи, иными словами – наиболее результативно снимать омонимию автоматизированными методами.

 

 

Источник информации: НИЛ «Лингвистика и искусственный интеллект»