Глоттохронология индоевропейских языков

Автор Виктор Меркатор, 28 июня 2024, 11:37

« назад - далее »

Виктор Меркатор

Предлагаю на обсуждение репринт статьи
Двухмерная дендрограмма 84 индоевропейских языков

https://www.researchgate.net/publication/381608086_Dvuhmernaa_dendrogramma_84_indoevropejskih_azykov_2D_dendrogram_of_84_Indo-European_languages

Наиболее удивительным является наличие в череде лингвистических событий по разделению языков 2 отметок во времени с концентрацией на них 5 и 4 событий.
Первое 4400 лет назад - одновременное отделение от праиндоевропйского языка кельтских, греческих, иранских, индоарийских и германских языков. По времени появление бронзового оружия?
Второе около 400-500 года НЭ. Великое переселение народов, с последующим ускорением образования новых языков (точка перелома на графике).

forest

Интересно а армянский когда отделился от индоевропейского , и стал отдельным языком .

Виктор Меркатор


Hellerick

Не совсем уверен, стоит ли это отдельного упоминания, но конвергенция с одним языком часто означает дивергенцию с другим.
"Раннее отделение" английского языка от германских на самом деле может объясняться не столько переселением в Британию, сколько последующим нормандским завоеванием, сместившим язык по направлению от германских к романским и "удревнившим" отрыв английского языка от его корней.
Я уж не знаю, насколько нормандское завоевание сказалось на списке Сводеша -- там лексика должна быть побазовее.

bvs

Цитата: Hellerick от 03 июля 2024, 17:01Не совсем уверен, стоит ли это отдельного упоминания, но конвергенция с одним языком часто означает дивергенцию с другим.
"Раннее отделение" английского языка от германских на самом деле может объясняться не столько переселением в Британию, сколько последующим нормандским завоеванием, сместившим язык по направлению от германских к романским и "удревнившим" отрыв английского языка от его корней.
Я уж не знаю, насколько нормандское завоевание сказалось на списке Сводеша -- там лексика должна быть побазовее.
У Старостина кстати заимствования в глоттохронологии не учитываются (т.е. соответствующие слова игнорируются при подсчете совпадений). Скандинавских заимствований в английском Сводеше будет побольше, чем романизмов.

Utgarda Loki

Цитата: Виктор Меркатор от 28 июня 2024, 11:37Первое 4400 лет назад - одновременное отделение от праиндоевропйского языка кельтских, греческих, иранских, индоарийских и германских языков.
А остальные (италийцы, славяне, балты, армяне, албанцы) продолжили говорить на протоиндоевропейском? А как насчёт вымерших языков и языковых групп? Потом, по современным представлениям индоиранские сначала отделились от протоиндоевропейского, а потом, спустя неопределённое время, разошлись на иранские и индоарийские. А у вас как-то по-другому это обозначено.

Виктор Меркатор

#6
Цитата: Utgarda Loki от 03 июля 2024, 19:02
Цитата: Виктор Меркатор от 28 июня 2024, 11:37Первое 4400 лет назад - одновременное отделение от праиндоевропйского языка кельтских, греческих, иранских, индоарийских и германских языков.
А остальные (италийцы, славяне, балты, армяне, албанцы) продолжили говорить на протоиндоевропейском? А как насчёт вымерших языков и языковых групп? Потом, по современным представлениям индоиранские сначала отделились от протоиндоевропейского, а потом, спустя неопределённое время, разошлись на иранские и индоарийские. А у вас как-то по-другому это обозначено.
Именно что по другому. В работе 1992 года Даййен и др. исселдовали ТОЛЬКО живые языки. И что интересно, также индоиранские языки не отмечены, только индоарийские и иранские. Не было бы это фикцией, или короткое существование индоиранцев на сказалось на современных языках, не оставило следов. Эти 2 группы сильно конвергировали, больше чем кельты и балты - чисто расстояние сказывается отселения, которое ввиду хорошей сохранности македонского близко к месту его нынешнего проживания носителей.
Домыслов ведь нет, формальная обработка по модели, чего бы не хотелось домыслить почитавши историю.
Что вышло то вышло. Самое разительное - одновременность отселения 5 групп. По истории размазано, но откуда знать, писали по первому упоминанию позднейших историков, когда народ уже проявил себя.
Вероятность случайного совпадения этих 5 событий 1/17, это что примерно на рулетке поставить на 2 числа и с первого раза выиграть. 
Если основным событием и считать отселение 5 групп 4400 лет назад, то италики отселились за 500 лет до этого, может что неладное почуяли пои самые пассионарные оказались. А прото- балтославянеалбанцы остались на месте или переместившись сохранили язык. Или самые устоячивые оказались или пассионарности не хватили. А может именно они всех прочих разогнали (эпоха бронзы, нового смертельного оружия) чтоб самим вольготнее жилось.
Я не историк и не археолог, фантазийных версий могу предложить много. Все что в статье из языковых фактов и модели.
А модель примитивная - не надо выискивать заимствования, модель сама определяет какая и в какое время произошла конвергенция (идею убирать заимствования предложил еще Сводеш), не надо привлекать зависимость скорости распада от времени (Сводеш предполагал ее постоянной!).
Здесь постоянность скорости фиксируется линейностью по 2 точкам - фиксировано Великое переселение и документирована история греков - разница в ~ 3 раза и в сводешах и в годах, отсюда постоянство скорости распада.
3-кратное изменение времени по Сводешу дает примерно 1,7-кратное изменение по Старостину, это заметно по приближению к нашим временам самых древних событий, так и историки приближают по найденным материальным свидетельствам. А свидетельства нематериальные - хранились тысячелетиями в языках.
Данные Дайен ругают, но у них неоспоримое преимущество - они собирались "просто так" и системно, а не под готовую в голове теорию и/или дерево. Никак не могли авторы матрицы 84х84 подгонять данные неизвестно под что, чтобы сконцентировать на отрезке в 150 лет 5 важнейших событий в истории мира.
Традиционный метод размазывает эти 5 событий на 1200 лет ввиду погрешности (неучитываемых конвергенций), и не факт, что 150 лет не скукожатся до 5 лет при более точном исследовании явления, поскольку погрешность метода никак не лучше 50 лет, что определяется конечностью списка Сводеша.
Всякая модель живет пока не появляется лучшая.
Механика Ньютона - ОТО Эйнштейна.
Системы мира Птолемея - Коперника.     

Виктор Меркатор

#7
Цитата: Hellerick от 03 июля 2024, 17:01Не совсем уверен, стоит ли это отдельного упоминания, но конвергенция с одним языком часто означает дивергенцию с другим.
"Раннее отделение" английского языка от германских на самом деле может объясняться не столько переселением в Британию, сколько последующим нормандским завоеванием, сместившим язык по направлению от германских к романским и "удревнившим" отрыв английского языка от его корней.
Я уж не знаю, насколько нормандское завоевание сказалось на списке Сводеша -- там лексика должна быть побазовее.
Модель всегда остается моделью. Мы в быту живем с моделью что свет и звук распространяются мгновенно, хотя из школы знаем что это не так, но оно не мешает нажимать на газ когда зеленый светофор и разговаривать в комнате.
Да полюбому как англы саксы юты отселились в Британию, язык стал изменяться, т.б. что и они разговаривали на разных но схожих языках. 7 королевств же было. Даже если был 1 язык на разделение до уровня диалектов нужно лет 200, а до разных языков 400. Т.е. к моменту норманского завоевания они от континентальных германцев примерно на язык и отселились. А норманы хоть и разговаривали по французски, скандинавами оставались.
В сводешах и расчете по традиционной методике к истинному времени прибавляется (необоснованно) половина конвергенции, что при калибровке побуждает исследователя при знании точной даты события уменьшать скорость распада (Старостин уменьшил сводешевские 0,14 до 0,05-0,10, чтобы согласовать датировки).
В среднем масштаб при линейности шкалы меняется в ~1,22 раза, по Старостину поскольку корень квадратный требуется изменение скорости в 1,22^2=1,5 раза. Пазл сложился.
А корень квадратный - это внесение в модель еще одной переменной (показатель степени 0,5). Наверняка более точное рассмотрение и точные датировки дали бы иное значение - 0,4 или 0,6. Любой новый параметр в модели улучшает аппроксимацию, но смысл имеет лингвистическая интерпретация нового параметра.
Были попытки изменить список Сводеша до 35 слов,  у Дайен традиционно 200 слов. Главное ведь единообразие, что и красит исследование Дайен с товарищами.
Самое же главное - 84 языка, и каждый язык определяется не по тому который с ним в паре, а по всем прочим в составе системы. Простое правило матстатистики - увеличение выборки в 100 раз (84 языка) повышает точность в 10 раз. Отдельные погрешности начинают частично взаимно компенсироваться, выруливает среднее.

Виктор Меркатор

Цитата: bvs от 03 июля 2024, 17:50У Старостина кстати заимствования в глоттохронологии не учитываются (т.е. соответствующие слова игнорируются при подсчете совпадений). Скандинавских заимствований в английском Сводеше будет побольше, чем романизмов.
По статье английский дивергенция от центрального (из современных это с равным правом датский/немецкий) 22,1 Св, конвергенция 8,0 Св.
Отсюда время отделения 22,1*71=1570 лет назад. Если списки сравнивались в 1990 году, 1990-1570=420 год. Примерно в это время у римлян появились проблемы на родине и родина отозвала легионы назад. Танцплощадка освободилась.
Конвергенция - примерно 8% заимствований, 16 слов в 200-словном списке или 8 в 100-словном.
Где-то в работе встречал похожие цифры, вот что первый гугл дал
https://pikabu.ru/story/naskolko_ofrantsuzhen_angliyskiy_yazyik_8034461
Правда 100 слов не список Сводеша, а 100 самых частотных, но они близки и тенденция сохраняется

Цитата: Как мы видим, на сотню слов всего четыре заимствования из французского и пять (при условии, что мы следуем решению авторов словаря считать they и them отдельно) из древнескандинавского. Конечно, в следующих по частотности сотнях слов количество заимствований будет нарастать, но результат довольно показателен.

5+4=9. Ошибка с расчетом по статье на 1 слово.



Utgarda Loki

Цитата: Виктор Меркатор от 04 июля 2024, 06:06И что интересно, также индоиранские языки не отмечены, только индоарийские и иранские. Не было бы это фикцией, или короткое существование индоиранцев на сказалось на современных языках, не оставило следов. Эти 2 группы сильно конвергировали, больше чем кельты и балты - чисто расстояние сказывается отселения, которое ввиду хорошей сохранности македонского близко к месту его нынешнего проживания носителей.
Ничего не понял в этом кусочке. :(

Цитата: Виктор Меркатор от 04 июля 2024, 06:06Домыслов ведь нет, формальная обработка по модели, чего бы не хотелось домыслить почитавши историю.
Что вышло то вышло.
Знаете, математика, всё же, обычно — модель каких-то явлений или процессов в реальной жизни. А не просто формальность. Если мы считаем неизвестно что — то и дело вылазят то полтора землекопа, то вообще "теория" тысячелетней истории Фоменко-Носовского. Поэтому не "оглядываться" на историю нельзя. Глоттохронология меня лично бесит тем, что ситает, на самом деле, неизвестно что. Исходя из недоказанного предположения, положенного в основу. А если оно не подтвердится? Получится, что сотни учёных десятки человеко-лет занимались попытками решить игру "пятнашки", в условиях, когда фишки были сложены нерешаемым образом.

Виктор Меркатор

#10
Цитата: Utgarda Loki от 04 июля 2024, 09:07Знаете, математика, всё же, обычно — модель каких-то явлений или процессов в реальной жизни. А не просто формальность. Если мы считаем неизвестно что — то и дело вылазят то полтора землекопа, то вообще "теория" тысячелетней истории Фоменко-Носовского. Поэтому не "оглядываться" на историю нельзя. Глоттохронология меня лично бесит тем, что ситает, на самом деле, неизвестно что. Исходя из недоказанного предположения, положенного в основу. А если оно не подтвердится? Получится, что сотни учёных десятки человеко-лет занимались попытками решить игру "пятнашки", в условиях, когда фишки были сложены нерешаемым образом.

Частично правы, мат модель есть модель. Модель мира Птолемея с центром мира Земля была неверной, но позволяла рассчитывать на много лет вперед положения планет. И механика Ньютона пока ограничивалсь наблюдениями на Земле и в пределах Солнечной системы также многое объясняла.Пока не появились необъясненные доли секунды в положении Меркурия, на что потребовалась теория Эйнштейна.

Лиз считал по Сводешу скорость распада языков, сравнивая древние тексты с современными, получил убедительные результаты постоянства скорости и приличной точности.

По данной модели - выпали время Великого переселения и распада ИЕ общности. Чисто по анализу современных языков. Как туринская плащаница - обследовали недавно, а датируют далеко задолго. И при случайности 18 событий выпадение одновременности 5 событий происходит с вероятностью 1/17. Но история человечества одна, а не 17 выбирай любую.
А что иногда расчет дает 1,5 землекопа, тут все нормально. Посчитайте сколько их надо для рытья канавы, и если вышло 1,5 и пригласили одного, то он 20 раз вспотеет пока управится. А пригласите 2, будут покуривать временами. На моделях основановсе - расчет самолетов, которые иногда бьются, тестирование ЕГЭ которое при все критике и возможной отмене таки отсеивает откровенную бестолочь, а способный челоек всегда наберет 75 баллов даже столкнувшись с тестом впервые в жизни, без репетиторской натаски. Мир вероятностен, предопределенности нет.
Выбираем ту модель из множества, которая лучше объясняет факты, не содержит излишнего (бритва Оккама), содержит потенциал модификации а не является тупиковой, и по Попперу может быть всегда опровергнута.

Димон

Цитата: Utgarda Loki от 04 июля 2024, 09:07то и дело вылазят то полтора землекопа
А что не так, вас же не смущают дробные лошадиные силы  ;D

Utgarda Loki

Цитата: Димон от 04 июля 2024, 19:28
Цитата: Utgarda Loki от 04 июля 2024, 09:07то и дело вылазят то полтора землекопа
А что не так, вас же не смущают дробные лошадиные силы  ;D
Лошадиные силы — нет (к силе живых лошадок эта условно названная единица всё равно отношения не имеет). Лошади — да. Ясное дело, что лошади (живые) должны входить в множество натуральных чисел, и если в рассчётах в задаче получилось 2,25 лошади, то ответом задачи будут 3 лошади (ну, или 2 лошади — смотря какие у задачи условия).

Виктор Меркатор

Цитата: Utgarda Loki от 05 июля 2024, 07:30
Цитата: Димон от 04 июля 2024, 19:28
Цитата: Utgarda Loki от 04 июля 2024, 09:07то и дело вылазят то полтора землекопа
А что не так, вас же не смущают дробные лошадиные силы  ;D
Лошадиные силы — нет (к силе живых лошадок эта условно названная единица всё равно отношения не имеет). Лошади — да. Ясное дело, что лошади (живые) должны входить в множество натуральных чисел, и если в рассчётах в задаче получилось 2,25 лошади, то ответом задачи будут 3 лошади (ну, или 2 лошади — смотря какие у задачи условия).
Насколько в теме, некогда в школе изучали правила работы с приближенными числами. А также устному счету. Все ушло, а это ведь основа мировоззрения. Нельзя жить с понятием что все точно считается, и любая формула верна по определению.   

Виктор Меркатор

Здесь обсуждение заглохло, спасибо за ценные побуждающие к рефлексированию посты. Обсуждение идет также на
 
https://lingvoforum.net/index.php/topic,87121.325.html

Обсуждение помогает понять глоттохронологию тем, кто только приобщается к теме. Абсолютных истин понятно не бывает, все относительно.

Utgarda Loki

Цитата: Виктор Меркатор от 07 июля 2024, 09:55Здесь обсуждение заглохло, спасибо за ценные побуждающие к рефлексированию посты. Обсуждение идет также на
 
https://lingvoforum.net/index.php/topic,87121.325.html
Спасибо за приглашение, но мы там всем форумом забанены (ну, или почти всем). ::)

Виктор Меркатор

Цитата: Utgarda Loki от 07 июля 2024, 15:02
Цитата: Виктор Меркатор от 07 июля 2024, 09:55Здесь обсуждение заглохло, спасибо за ценные побуждающие к рефлексированию посты. Обсуждение идет также на
 
https://lingvoforum.net/index.php/topic,87121.325.html
Спасибо за приглашение, но мы там всем форумом забанены (ну, или почти всем). ::)
Сочувствую.

Utgarda Loki

Цитата: Виктор Меркатор от 07 июля 2024, 15:24Сочувствую.
Да многие и сами ушли, без бана, когда там политика появилась прямо на стартовой странице. Поскольку она там до сих пор висит, что ж поделаешь.

Виктор Меркатор

Цитата: Utgarda Loki от 07 июля 2024, 15:45
Цитата: Виктор Меркатор от 07 июля 2024, 15:24Сочувствую.
Да многие и сами ушли, без бана, когда там политика появилась прямо на стартовой странице. Поскольку она там до сих пор висит, что ж поделаешь.
Есть такое дело. Но в теме этого нет. Висит на многих сайтах, с которыми я лет 20 как сотрудничал в иные времена. Для них это ритуал, выбора тоже не много. Но люди в основном остались вменяемые.

Виктор Меркатор

#19
Выше обсуждался вопрос об индоиранской группе. Как вышло по обработке данных Дайен и пр. по модели, индоиранской группы не существует, поскольку по расчету иранцы и индоарийцы отделились одновременно от протоИЕ, сохранившихся почти в целости и сохранности после ухода италийцев и армян, дело темное, и анатолийцы не в счет - Дайен исследовал только живые языки, оттого глубина 4900 лет, а не 6-7 тысяч.
Но работа продолжена, на днях будет выложен репринт с дальнейшей обработкой данных.
Выясняется, что при обработке неполных данных "выскакивает" виртуальная индоиранская группа - виртуальная в том смысле что она возникает и немедленно распадается (чего нет при обработке полных данных). Тем самым иранская и индоарийская группы падают в ранге до подгругрупп. Или же индоиранская получает ранг надгруппы (подсемьи). Дело вкуса.
И аналогично - при обработке неполных данных мелькает поддерживаемая некоторыми исследователями армяно-греческая обшность, не просматриваемаяы в полных данных.
Объяснение всем этим феноменам есть - если чего нет, место пустым не остается. Не приходит на родительское собрание мама - приходит бабушка и т.п.
Отсюда важность привлечения для построения дерев всех наличных данных. Привнести в матрицу Дайена еще несколько десятков языков - дендрограмма изменится. Но изменится в сторону уточнения, а не коренной ломки.
Главное же то, что еще раз подтверждается аддитивность основных извлекаемых показателей - дивергенции и конвергенции - они скаладываются и вычитаются, что далеко не следует из факта их существования.
Скажем, в школе ставят оценки - они заведомо не аддитивны, 3 и 5 не равны двум четверкам, а 2 и 4 не равны двум тройкам.
Как не аддитивны баллы ЕГЭ - оттого преступна некорректна сама система приема в вузы по сумме 3 баллов ЕГЭ. Другое дело, что иной понятной всем и каждому нет.
Так вот, аддитивность дивергенции и конвергенции напрочь уничтожает самое идею изменчивости скорости распада языков во времени. Это мировая константа, записанная в генах.
Никого же не удивляет, что при всех расхождениях и схождениях языков на живых текстах соблюдается закон Ципфа, что позволяет выучив 1000 самых распространенных слов, общаться, и даже читать. Распределение слов по частоте везде одно и то же, с минимальными отклонениями. Тоже где-то в глубинах психики это рапспределение записано и стихийно реализуется. разговаривающий или пишущий не по закону Ципфа человек будет выделяться. Малейшее изменение распределения делает человека выдающимся писателем с  ярким стилем письма. Как и анализ текстов написанных пациентами психушки (были такие исследования, и я руку приложил) немедленно выявляет их особенность. Везде и всегда рулит среднее.
 

Utgarda Loki

Цитата: Виктор Меркатор от Сегодня в 06:09Везде и всегда рулит среднее.
Вы вот, вроде, учёный, а такое впечатление, что о нормальном распределении и дисперсии не слыхали.

Leo

Цитата: Виктор Меркатор от Сегодня в 06:09Выше обсуждался вопрос об индоиранской группе. Как вышло по обработке данных Дайен и пр. по модели, индоиранской группы не существует, поскольку по расчету иранцы и индоарийцы отделились одновременно от протоИЕ, сохранившихся почти в целости и сохранности
а что эта теория говорит о дардско-нуристанской группе?

Виктор Меркатор

Цитата: Leo от Сегодня в 10:19
Цитата: Виктор Меркатор от Сегодня в 06:09Выше обсуждался вопрос об индоиранской группе. Как вышло по обработке данных Дайен и пр. по модели, индоиранской группы не существует, поскольку по расчету иранцы и индоарийцы отделились одновременно от протоИЕ, сохранившихся почти в целости и сохранности
а что эта теория говорит о дардско-нуристанской группе?
Среди 84 языков ни один из нуристанских языков ввиду малочисленности (всего от 3 до 30 тысяч носителей языка) не представлен, оттого нечего сказать.
Представлена не теория, а метод построения дендрограмм с датировками времен разделения языков и оценкой загрязнения заимствованиями.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
ALT+S — отправить
ALT+P — предварительный просмотр