Научный журнал Байкальского государственного университета
System Analysis &
Mathematical Modeling
Издается с 2019 года
Menu

Информация о статье

Название статьи:

Разработка программы «Помощник лингвиста»

Авторы:
Мосоркин Ф.Э., аспирант, кафедра математических методов и цифровых технологий, Байкальский государственный университет, г. Иркутск, Российская Федерация, mosorkin@bk.ru
Для цитирования:
Мосоркин Ф.Э. Разработка программы «Помощник лингвиста» / Ф.Э. Мосоркин. — DOI 10.17150/2713-1734.2025.7(3).419-427. — EDN ETGMWD // System Analysis & Mathematical Modeling. — 2025. — Т. 7, № 3. — С. 419–427.
В рубрике:
ТЕХНИЧЕСКИЕ НАУКИ
Год: 2025 Том: 7 Номер журнала: 3
Страницы: 419-427
Тип статьи: Научная статья
УДК: 81.33
DOI: 10.17150/2713-1734.2025.7(3).419-427
Аннотация:
В данной статье представлено разработанное программного обеспечение «Помощник лингвиста», которое сравнивает два списка слов по ряду моделей и метрик. Реализовано в виде десктопного приложения, разработанного на языке программирования Python на базе библиотеки PyQt5. Актуальность работы обусловлена тем, что на данный момент лингвистические исследования требуют значительное количество времени и сил из-за большого количества данных для анализа. Для автоматизации рутинных задач лингвистов было решено разработать программу «Помощник лингвиста». В работе описаны основные требования к программе (в виде UML-диаграмм), инструменты разработки. В приложении используется метод парных мер, сортировка матрицы парных мер. Исходя из этого формируется матрица парных мер. Также применяются методы преобразования А.Д. Долгопольского (консонантные классы), метрики сходств слов, такие как Рэтклифф-Обершелп, наибольшая общая подстрока (LCS) и расстояние Левенштейна. В программе еще можно составить график случайных величин и их средних значений, сделать график средних величин словаря, сформировать словарь соответствий между словами двух списков. Имеется экспорт сформированных матриц в виде Excel-файла, экспорт результатов в Word. При ситуации, когда требуется сравнить слова по всем метрикам сравнения (однако основным будет выбранная из выпадающего списка), был реализован вывод комплексного словаря, который выводит по 10 самых схожих слов. С помощью реализованного функционала программы можно выявлять скрытые лексические связи между лингвистическими множествами (списками слов), получать интересные результаты при работе с топонимами.
Ключевые слова: лингвистика, разработка ПО, парные метрики, консонантные классы, метрика Рэтклиффа-Обершелпа, расстояние Левенштейна, программное обеспечение
Информация о статье: Дата поступления: 21 апреля 2025 г.; дата принятия к публикации: 27 сентября 2025 г.; дата онлайн-размещения: 23 октября 2025 г.
Список цитируемой литературы:
  • Боровский А.В. Изучение связи между русским и бурятским языками методом матрицы мер близости между консонантными классами слов / А.В. Боровский, В.В. Братищенко, Е.Е. Раковская. - DOI 10.17150/2713-1734.2023.5(1).19-33. - EDN CEMRYO // System Analysis and Mathematical Modeling. - 2023. - Т. 5, № 1. - С. 19-33.
  • Ratcliff J.W. Pattern matching: The Gestalt approach / J.W. Ratcliff, D.E. Metzener // Dr Dobbs Journal. - 1988. - Vol. 13, no. 7. - P. 46.
  • Gusfield D. Algorithms on Strong, Trees, and Sequences. Computer Science and Computational Biology / D. Gusfield. - Cambridge University Press, 1997. - 553 p.
  • Левенштейн В.И. Двоичные коды, способные исправлять удаления, вставки и обратные операции / В.И. Левенштейн // Советская физика : доклады. - 1966. - Т. 10, № 8. - С. 707-710.
  • Лещенко А.В. Практическое применение алгоритмов нечеткого поиска / А.В. Лещенко. - DOI 10.17212/2307-6879-2018-3-4-59-69. - EDN GKRNZC // Сборник научных трудов Новосибирского государственного технического университета. - 2018. - № 3-4 (93). - C. 59-69.