
Тюменские ученые создали метод поиска в текстах слов на тему ИТ
Специалисты Школы компьютерных наук Тюменского государственного университета (ТюмГУ) разработали методику извлечения слов ИТ-предметной области из русскоязычных текстов с использованием предварительно обученных языковых моделей, сообщили в пресс-службе вуза. Работа проводилась в соответствии с задачами нацпроекта «Молодежь и дети».
В качестве текстов ученые использовали отчетные документы 300 студентов по проектным, практическим дисциплинам и выпускным квалификационным работам. На их основе проводились сравнение качества и анализ ошибок выбранных моделей. В текстах были представлены названия языков программирования, фреймворков и библиотек и другие термины. Кроме того, речь шла об инструментах для непрерывной разработки программного обеспечения, названиях алгоритмов и структурах данных.
«Систематизация этой информации очень важна для решения широкого спектра задач. В частности, анализ цифрового следа может служить основой для рекомендаций по улучшению учебных планов и курсов, анализа востребованности навыков и знаний, мониторинга успеваемости», — сообщила заведующая кафедрой программного обеспечения ТюмГУ Марина Воробьева.
В ходе исследования специалисты сравнивали разные языковые модели. Наиболее высокие показатели продемонстрировала модель mBART — 93,55%.
«Полученные результаты свидетельствуют о применимости рассматриваемых моделей для решения задач с учетом специфики предъявляемых требований», — пояснила аспирант, старший преподаватель кафедры программного обеспечения ТюмГУ Антонина Мельникова.
Нацпроект «Молодежь и дети» направлен на создание возможностей для развития талантов и самореализации молодых людей. В центре нацпроекта — строительство и ремонт школ, повышение квалификации педагогов, создание новых методик преподавания и комфортных условий для обучения. Нацпроект также предусматривает развитие сети кампусов мирового уровня и поддержку вузов по программе «Приоритет 2030». Обновленные нацпроекты реализуются по решению Президента РФ Владимира Путина с 2025 года.
Подпишитесь на новости национального проекта