Состоялся научный семинар о квантитативном исследовании морфосинтаксических параметров
В Институте филологии и межкультурной коммуникации прошёл научный семинар «Квантитативное исследование морфосинтаксических параметров и отношений на материале больших языковых корпусов»
10 апреля 2025 года в Институте филологии и межкультурной коммуникации прошёл научный семинар «Квантитативное исследование морфосинтаксических параметров и отношений на материале больших языковых корпусов», организованный научно-исследовательской лабораторией «Лингвистика и искусственный интеллект» (руководитель – д.ф.-м.н., проф. В.Д. Соловьёв).
Докладчиком выступил Эдуард Станиславович Клышинский из Национального исследовательского университета «Высшая школа экономики». Он представил исследование, посвящённое автоматизации извлечения словарей глагольной сочетаемости и глагольного управления русского языка из большого корпуса неразмеченных текстов.
В рамках диссертационного исследования на степень доктора наук было проведен анализ распределения слов двенадцати языков по видам грамматической неоднозначности. Было показано, что русскому языку в большей мере присуща однозначность слов по части речи. С точки зрения синтаксиса исследовался материал из коллекции корпусов Universal Dependencies, включающей данные из 65 языков. Также был предложен новый метод оценки синтаксического ветвления и проведено ранжирование языков по присущей им строгости данного параметра. На основе собранных данных в качестве языка дальнейшего исследования был выбран русский язык.
В ходе дискуссии обсуждались различные вопросы, связанные с спецификой использования терминов «валентность» и «актантная структура» глагола, грамматическим статусом послелогов и их применимостью для русского языка. Также сравнивались различные языковые ресурсы, такие как RuWordNet, DeepPower, СинТагРус, AOT.ru, их преимущества и пока ещё скрытый потенциал.
В конце семинара участники семинара обсудили один из выводов исследования, подчёркивающий уникальность морфосинтаксической системы русского языка, позволившей получить выборку с высокой степенью однозначности слов по части речи, иными словами – наиболее результативно снимать омонимию автоматизированными методами.
Источник информации: НИЛ «Лингвистика и искусственный интеллект»
Последние новости:
От теории к практике: студентка ИФМК КФУ стала призером Всероссийского конкурса
11.06.2026
Евразийские коммуникации: Татарстан и медиадиалог на ПМЭФ-2026
10.06.2026
«Пушкин – радуга по всей земле»: иностранные студенты и аспиранты приняли участие в торжественном мероприятии, посвящённом Дню русского языка
09.06.2026
Профориентация без границ: преподаватель ИФМК КФУ о работе с китайскими школьниками и педагогами
09.06.2026
Стань флагманом образования – выбери свой трек на 2026 год
09.06.2026
