Состоялся научный семинар о квантитативном исследовании морфосинтаксических параметров
В Институте филологии и межкультурной коммуникации прошёл научный семинар «Квантитативное исследование морфосинтаксических параметров и отношений на материале больших языковых корпусов»
10 апреля 2025 года в Институте филологии и межкультурной коммуникации прошёл научный семинар «Квантитативное исследование морфосинтаксических параметров и отношений на материале больших языковых корпусов», организованный научно-исследовательской лабораторией «Лингвистика и искусственный интеллект» (руководитель – д.ф.-м.н., проф. В.Д. Соловьёв).
Докладчиком выступил Эдуард Станиславович Клышинский из Национального исследовательского университета «Высшая школа экономики». Он представил исследование, посвящённое автоматизации извлечения словарей глагольной сочетаемости и глагольного управления русского языка из большого корпуса неразмеченных текстов.
В рамках диссертационного исследования на степень доктора наук было проведен анализ распределения слов двенадцати языков по видам грамматической неоднозначности. Было показано, что русскому языку в большей мере присуща однозначность слов по части речи. С точки зрения синтаксиса исследовался материал из коллекции корпусов Universal Dependencies, включающей данные из 65 языков. Также был предложен новый метод оценки синтаксического ветвления и проведено ранжирование языков по присущей им строгости данного параметра. На основе собранных данных в качестве языка дальнейшего исследования был выбран русский язык.
В ходе дискуссии обсуждались различные вопросы, связанные с спецификой использования терминов «валентность» и «актантная структура» глагола, грамматическим статусом послелогов и их применимостью для русского языка. Также сравнивались различные языковые ресурсы, такие как RuWordNet, DeepPower, СинТагРус, AOT.ru, их преимущества и пока ещё скрытый потенциал.
В конце семинара участники семинара обсудили один из выводов исследования, подчёркивающий уникальность морфосинтаксической системы русского языка, позволившей получить выборку с высокой степенью однозначности слов по части речи, иными словами – наиболее результативно снимать омонимию автоматизированными методами.
Источник информации: НИЛ «Лингвистика и искусственный интеллект»
Последние новости:
Чествование выпускников-активистов на расширенном заседании Студенческого совета ИФМК
29.06.2025
Выпускной китайских стажёров кафедры ТиППИЯ ИФМК
27.06.2025
Россия в фотообъективе наших студентов
27.06.2025
Студенты ИФМК КФУ стали призерами фотоконкурса "Образ России в объективе"
27.06.2025
Визит МФЦ в ИФМК с целью содействия иностранным студентам
27.06.2025