Научный журнал Байкальского государственного университета
System Analysis &
Mathematical Modeling
Издается с 2019 года
Menu

Информация о статье

Название статьи:

Количественное определение заимствований в языке

Авторы:
Боровский А.В., доктор физико-математических наук, профессор, кафедра математических методов и цифровых технологий, https://orcid.org/0000-0003-2119-1072, SPIN-код: 7243-8706, AuthorID РИНЦ: 22229, Байкальский государственный университет, г. Иркутск, Российская Федерация, borovskii@mail.ru,

Раковская Е.Е., аспирант, кафедра математических методов и цифровых технологий, https://orcid.org/0000-0002-2493-8699, SPIN-код: 1945-0473, AuthorID РИНЦ: 1097855, Байкальский государственный университет, г. Иркутск, Российская Федерация, rakovskaya19@mail.ru,

Мосоркин Ф.Э., аспирант, кафедра математических методов и цифровых технологий, Байкальский государственный университет, г. Иркутск, Российская Федерация, mosorkin@bk.ru
Для цитирования:
Боровский А.В. Количественное определение заимствований в языке / А.В. Боровский, Е.Е. Раковская, Ф.Э. Мосоркин. — DOI 10.17150/2713-1734.2025.7(3).333-345. — EDN KZPABO // System Analysis & Mathematical Modeling. — 2025. — Т. 7, № 3. — С. 333–345.
В рубрике:
МАТЕМАТИЧЕСКИЕ НАУКИ
Год: 2025 Том: 7 Номер журнала: 3
Страницы: 333-345
Тип статьи: Научная статья
УДК: 81.32
DOI: 10.17150/2713-1734.2025.7(3).333-345
Аннотация:
Статья посвящена разработке математических методов определения заимствований в языке. Процесс заимствования моделировался с применением искусственно созданных заимствований - созданием списков слов с замещением отдельных слов одного списка словами из другого списка. Степень замещения варьировалась от 0 до 100 %. Для количественного определения заимствований была разработана специальная методика, включающая генерацию списков слов, расчет метрик сходства для каждой пары слов списков, построение матриц парных мер, расчет статистических величин для матриц парных мер - средних мер всех элементов матрицы, средних от максимальных мер по строкам и столбцам, их дисперсий. Применяемые метрики сходства слов: метрика Рэтклиффа-Обершелпа, longest common substring (LCS), расстояние Левенштейна. Результаты расчетов приведены в табличной и графической форме. Зависимости средних максимальных мер сходства по строкам ⟨ρ⟩1 от степени замещения x линейны, характеристическими величинами для этих зависимостей являются средние от максимальных по строкам матриц парных мер списков слов русского языка без замещения. Для определения сходства списков слов со степенью замещения от 0 до 100 %, моделирующих заимствования в языке, целесообразно применять средние от максимальных мер по строкам матриц парных мер.
Ключевые слова: заимствования в языке, моделирование заимствований в языке, метрики сходства слов, метрика Рэтклиффа-Обершелпа, метрика longest common substring (LCS), расстояние Левенштейна, матрица парных мер сходства, средние меры сходства
Информация о статье: Дата поступления: 5 мая 2025; дата принятия к публикации: 27 сентября 2025 г.; дата онлайн-размещения: 23 октября 2025 г.
Список цитируемой литературы:
  • Using lexical language models to detect borrowings in monolingual wordlists / J.E. Miller, T. Tresoldi, R. Zariquiey [et al.] // PLOS One. - 2020. - Vol. 15, no. 12. - P. e0242709.
  • Ильина Л.А. Лексическое заимствование: переход иноязычий или внутриязыковое создание? / Л.А. Ильина, О.В. Сычева. - EDN SGUHLH // Гуманитарные науки в Сибири. - 1998. - №. 4. - С. 91-96.
  • Egorov I.M. Phylogeny of the Turkic languages inferred from basic vocabulary: Limitations of the lexicostatistical methods in an intensive contact situation / I.M. Egorov, A.V. Dybo, A.S. Kassian. - DOI 10.1093/jole/lzac006. - EDN TQFGMR // Journal of Language Evolution. - 2022. - Vol. 7, no. 1. - P. 16-39.
  • Арапов М. В. Математические методы в исторической лингвистике / М.В. Арапов, М.М. Херц. - Москва : Наука, 1974. - 166 с.
  • List J.M. Automated methods for the investigation of language contact, with a focus on lexical borrowing / J.M. List // Language and Linguistics Compass. - 2019. - Vol. 13, no. 10. - P. e12355.
  • Miller J.E. Detecting lexical borrowings from dominant languages in multilingual wordlists / J.E. Miller, J.M. List // arXiv preprint arXiv:2302.00189. - 2023. - URL: https://arxiv.org/pdf/2302.00189.
  • Gomaa W.H. A survey of text similarity approaches / W.H. Gomaa, A.A. Fahmy // International Journal of Computer Applications. - 2013. - Vol. 68, no. 13. - URL: https://research.ijcaonline.org/volume68/number13/pxc3887118.pdf.
  • Hall P.A.V. Approximate string matching / P.A.V. Hall, G.R. Dowling // ACM computing surveys (CSUR). - 1980. - Vol. 12, no. 4. - P. 381-402.
  • Krause E.F. Taxicab geometry / E.F. Krause // Mathematics Teacher. - 1973. - Vol. 66, no. 8. - P. 695-706.
  • Боровский А.В. Изучение связи между русским и бурятским языками методом матрицы мер близости между консонантными классами слов / А.В. Боровский, В.В. Братищенко, Е.Е. Раковская. - DOI 10.17150/2713-1734.2023.5(1).19-33. - EDN CEMRYO // System Analysis and Mathematical Modeling. - 2023. - Т. 5, № 1. - С. 19-33.
  • Ляшевская О.Н. Новый частотный словарь русской лексики / О.Н. Ляшевская, С.А. Шаров. - Москва : Азбуковник, 2009. - 1087 c. - URL: http://dict.ruslang.ru/freq.php.