Научный журнал Байкальского государственного университета
System Analysis &
Mathematical Modeling
Издается с 2019 года
Menu

Информация о статье

Название статьи:

Лексикостатистика взаимосвязи русского и бурятского языков

Авторы:
Боровский А.В., доктор физико-математических наук, профессор кафедры математических методов и цифровых технологий, https://orcid.org/0000-0003-2119-1072, SPIN-код: 7243-8706, AuthorID РИНЦ: 22229, Байкальский государственный университет, г. Иркутск, Российская Федерация, andrei-borovskii@mail.ru,

Братищенко В.В., кандидат физико-математических наук, доцент, кафедра математических методов и цифровых технологий, https://orcid.org/0000-0002-7755-4170, SPIN-код: 4131-7181, AuthorID РИНЦ: 280037, Байкальский государственный университет, г. Иркутск, Российская Федерация, vbrat56@mail.ru,

Раковская Е.Е., аспирант, кафедра математических методов и цифровых технологий, https://orcid.org/0000-0002-2493-8699, SPIN-код: 1945-0473, AuthorID РИНЦ: 1097855, Байкальский государственный университет, г. Иркутск, Российская Федерация, rakovskaya19@mail.ru
В рубрике:
МАТЕМАТИЧЕСКИЕ НАУКИ
Год: 2023 Том: 5 Номер журнала: 3
Страницы: 303-318
Тип статьи: Научная статья
УДК: 81.32
DOI: 10.17150/2713-1734.2023.5(3).303-318
Аннотация:
Представлены результаты статистического анализа данных матрицы мер близости слов, составленных из консонантных классов на основе частотного русско-бурятского словаря с применением меры сходства Рэтклиффа-Обершелпа. Рассчитано число полных совпадений слов по всему полю матрицы методом независимых вероятностей появления букв и классов в словах, и методом расчета вероятностей с применением цепей Маркова. Наилучший результат получен для расчета вероятностей в предположении марковской зависимости классов. Исследовано влияние ранга матрицы мер близости слов на степень совпадения списков. Средние меры сходства мало изменяются при уменьшении ранга матрицы до величины r = 64. Дальнейшее уменьшение ранга матрицы является нецелесообразным. Определены количественные характеристики языков - вероятности появления консонантных классов для слов словаря, вероятности слов разной длины в русском и бурятском языках. Для проверки нулевой гипотезы (наблюдаемые сходства метрик случайны) использован перестановочный тест, после проведения которого сделан вывод о неслучайном характере совпадения слов в русском и бурятском языках и о наличии заимствований в языках.
Ключевые слова: лексикостатистика русского и бурятского языков, математическая и историческая лингвистика, консонантные классы, матрица мер сходства слов русского и бурятского языков, марковские цепи в лексикостатистике
Список цитируемой литературы:
  • Мартьянов В.И. Адаптация логико-эвристических методов для некоторых задач филогенетического анализа / В.И. Мартьянов, М.Л. Скуматов. - EDN OEFVVT // Современные технологии. Системный анализ. Моделирование. - 2011. - № 2. - С. 27-31.
  • Боровский А.В. Изучение корреляции между топонимами Иркутской области и словами санскрита / А.В. Боровский, Е.Е. Раковская, И.А. Картеева. - DOI 10.17150/2500-2759.2022.32(3).610-622. - EDN SUWJUC // Известия Байкальского государственного университета. - 2022. - Т. 32, № 3. - С. 610-622.
  • Боровский А.В. Изучение связи между русским и бурятским языками методом матрицы мер близости между консонантными классами слов / А.В. Боровский, В.В. Братищенко, Е.Е. Раковская. - DOI 10.17150/2713-1734.2023.5(1).19-33 // System Analysis&Mathematical Modeling. - 2023. - Т. 5, № 1. - С. 19-33.
  • Levenshtein V.I. Binary codes capable of correcting deletions, insertions, and reversals / V.I. Levenshtein // Soviet physics doklady. - 1966. - Vol. 10, No. 8. - P. 707-710.
  • Ratcliff J.W. Pattern-matching-the Gestalt Approach / J.W. Ratcliff, D.E. Metzener // Dr. Dobb`s Journal. - 1988. - Vol. 13, № 7. - P. 46.
  • Cohen W.W. A Comparison of String Distance Metrics for NameMatching Tasks / W.W. Cohen, P. Ravikumar, S.F. Fienberg // II Web. - 2003. - Vol. 3. - P. 73-78.
  • Долгопольский А.Б. Гипотеза древнейшего родства языковых семей Северной Евразии с вероятностной точки зрения / А.Б. Долгопольский // Вопросы языкознания. - 1964. - № 2. - С. 64-69.
  • Peter T. Analyzing genetic connections between languages by matching consonant classes / T. Peter, P. Ilia, G.M. Murray // Вопросы языкового родства. - 2010. - No. 5. - P. 117-126.
  • Circumpolar peoples and their languages: lexical and genomic data suggest ancient Chukotko-Kamchatkan -Nivkh and Yukaghir-Samoyedic connections / G. Starostin, N.E. Altınışık, M. Zhivlov [et al] // bioRxiv. - 2021. - Available at: https://www.biorxiv.org/content/10.1101/2021.02.27.433193v1.
  • Ляшевская О.Н. Новый частотный словарь русской лексики / О.Н. Ляшевская, С.А. Шаров. - Москва : Словари.ру, 2012. - 1087 c.