Этот пост был моим планом для презентации на конференции «Основы полезности и риска». Я опирался на свои предыдущие посты, в которых излагались основы экономики эргодичности и анализировалось, что экономика эргодичности говорит о предпочтениях в отношении риска. Это несколько отличалось от изложения (меня легко сбить с толку, и я пропустил пару разделов). Учитывая, что книга предназначена для технической аудитории, есть несколько моментов, которые могут ускользнуть от внимания непрофессионала.
–
Эта презентация началась с записи в блоге. Около пяти лет назад, когда я был погружен в корпоративный мир, я написал пару постов об идее под названием «экономика эргодичности». Случайный физик Оле Питерс возмущал людей в Twitter тем, что экономисты делают это неправильно, что теория ожидаемой полезности фатально ошибочна, что вам не нужно вводить психологию, чтобы объяснить человеческие решения в условиях риска, и что все аномалии в поведенческой экономике могут быть согласованы с его новой теорией.
Многие возражали против более сильных утверждений, но я подумал, что, написав пару постов, я сам смогу лучше понять идею. Поэтому я проигнорировал гиперболу и попытался честно изложить основную идею. Поскольку у меня был некоторый опыт в эволюционной биологии, я также попытался взглянуть на это с эволюционной точки зрения.
В духе тех оригинальных постов я постараюсь, чтобы сегодняшняя презентация не превратилась в упражнение в критике самых нелепых утверждений. Есть пара опубликованных критических статей по экономике эргодичности, одна из которых написана Джейсоном Доктором и др. (2020) в журнале Nature Physics, а другая, более свежая, Мэтью Фордом и Джоном Кеем (2023) в журнале Econ Journal Watch, в которых хорошо рассматриваются утверждения об экономике и теории ожидаемой полезности. Вместо этого я собираюсь дать краткое описание экономики эргодичности, прежде чем изложить некоторые психологические и эволюционные наблюдения.
Итак, позвольте мне начать с классического примера, который используется для иллюстрации того, что такое экономика эргодичности. Возможно, вы уже сталкивались с этим раньше.
Предположим, вам предлагается серия из 100 ставок на подбрасывание монеты. Вы выигрываете 50% своего состояния, выпав орлом. Вы теряете 40% своего состояния, выпав решкой. Принимаете ли вы ставку?
Ожидаемая сумма ставки составляет 5% от вашего состояния за каждый ход. Продолжайте играть в течение многих раундов, и ваше ожидаемое состояние будет очень большим.
Однако, каков наиболее вероятный исход при многократном повторении этой ставки?
Этот график является результатом моделирования, в котором 10 000 человек, каждый из которых имеет 100 долларов, испытали на себе 100 переворотов. Черная линия показывает средний уровень благосостояния населения. Красные линии — это траектории первых 20 человек, участвовавших в симуляции.
Установочный код # Загрузите библиотеку необходимых пакетов(ggplot2), библиотеку весов(scales) #используйте библиотеку процентной шкалы позже(dplyr) #используйте функцию фильтрации позже, код для функции ставок # Создайте функцию для выполнения ставок. ставки в <- функция(р, п, т, старт=100, прибыль, убыток, эргодическая=ложь, поглощая=ложь){ #P-это вероятность приобрести #N-это сколько человек в моделировании #Т-количество бросков монеты, моделируется для каждого человека #запускать это количество долларов у каждого человека начинается с #, если эргодическая=ложь, прибылей и убытков являются множителями #если эргодическая=правда, выгоды и потери в долларовом #если поглощать=истина, ноль богатство завершает серию сальто для этого человека параметры &ЛТ;- как. данных. рама(с(п, н, т, пуск, прибыль, убыток, эргодический, поглощая)) rownames(параметры) в <- C (С"П", "Н", "Т", "старт", "выигрыш", "проигрыш", "эргодическая", "поглощая") colnames(параметры) &ЛТ;- "значение" сим - &ЛТ;- матрицы(данные = НС, номер строки = Т, номер колонки = N), если(эргодическая==ложь){ для (J в 1:п) { х &л;- старт для (Я в 1:т) { итогового &ЛТ;- rbinom(П=1, размер=1, возм=Р) оператору ifelse(результат==0, х &л;- х*потеря, х &л;- х*прибавка) сим[я,J] &ЛТ;- х } } } если(эргодическая==истина){ для (J в 1:н) { х &л;- старт для (Я в 1:т) { итогового &ЛТ;- rbinom(П=1, размер=1, возм=Р) оператору ifelse(результат==0, х &л;- х-потери, х &л;- х+прибавка) сим[я,J] &ЛТ;- X, если(поглощая==true) {, если(Х&Л;0){ Сима[и:Т,J] &ЛТ;- 0 сломать } } } } } сим - &ЛТ;- rbind(рэп(старт Н), сим) #размещении стартовой суммой в первой строке сим - &ЛТ;- cbind(seq на(0,Т), сим) #количество каждого периода сим - &ЛТ;- данных. рамка(сим) colnames(Сим) в <- C (с"период", paste0("П", 1:n)) с сим - &ЛТ;- списка(параметр params=параметры, Сим - = - Сим) сим -} код, чтобы запустить моделирование # имитировать 10 000 человек, которые принимают серии 1000 50:50 ставок, чтобы выиграть $50 или потерять $40 с богатым $100. комплект. семя(20240705) nonErgodic &ЛТ;- ставка(Р=0,5, Н=10000, т=1000, ку=1. 5, потеря=0. 6, эргодическая=ложь) код по сюжету # функция для построения индивидуального пути и средней богатства в течение определенного количества периодов. plotWealth <- функция(sim, t = 100, people = NULL) { Базовый график <- ggplot(sim$sim[1:(t+1),], aes(x = период)) + лаборатории(y = "Богатство ($)") # Добавьте строки для отдельных путей, если указано, что (!равно. null(люди)) { для (i в 1:люди) _BOS_ Базовая таблица <- Базовая таблица + геолиния(aes(y = !!sim$sim[c(1:(t+1)), i+1]), color = "красный") } } # Добавить строку для среднего достатка Базовая таблица <- Базовая таблица + гео_линия(aes(y = rowMeans(sim$sim[1:(t+1), 2:(sim$params[2,]+1)])), color = "черный", ширина линии = 1) Базовый график } # Сгенерировать график с индивидуальными траекториями и неэргодическим графиком среднего благосостояния <- График благосостояния (sim = неэргодический, t = 100, people = 20) Рисунок неэргодического графика 1: График первых 20 человек относительно среднего благосостояния
Внезапное падение среднего благосостояния к концу последовательности является интересной особенностью, которая На данный момент я не буду обращать на это внимания. Но посмотрите на красные линии. По истечении 100 периодов все они находятся ниже среднего уровня благосостояния, и только у одного из 20 агентов уровень благосостояния в конце достаточен для того, чтобы вы могли различить линию на оси x.
Давайте теперь воспользуемся логарифмической шкалой, чтобы увидеть закономерность более четко.
Код для построения логарифма # Выведите как средний результат, так и первые двадцать человек на одном и том же графике. Логнонергодический график <- график богатства(sim=неэргодический, t=100, people=20)+ scale_y_log10(перерывы = c(0. 0001, 0. 1, 100, 100000), метки = c("0. 0001", "0. 1","100", "100000")) Диаграмма логнонергодического графика 2: График соотношения среднего достатка первых 20 человек (логарифмическая шкала)
Все 20 из этих людей находятся ниже среднего достатка. Только один из них продвинулся по сравнению с тем, с чего они начинали.
Код для создания функции для генерации сводной статистики # Создайте функцию для генерации сводной статистики. summaryStats <- функция(sim, t = 100) _BOS_ # Извлекает данные о богатстве за указанный период времени wealth_data <- в виде матрицы(sim$sim[(t + 1), 2:(sim$params[2, ] + 1)]) # Рассчитать среднее значение благосостояния mean_wealth <- среднее значение(wealth_data) # Рассчитать среднее значение благосостояния median_wealth <- медиана(wealth_data) # Число и процент тех, кто потерял более 99% своего состояния num_lost_99 <- сумма(wealth_data < (sim$params[4, ]/100)) perc_lost_99 <- (num_lost_99/sim$params[2, ]) * 100 # Число и процент тех, кто разбогател num_gain <- сумма(wealth_data > sim$params[4, ]) perc_gain <- (num_gain/sim$params[2, ]) * 100 # Число тех, кто увеличил свое состояние более чем в 100 раз. num_increased_100 <- сумма(wealth_data > (sim$params[4, ] * 100)) # Богатство и доля богатства самого богатого человека. max_wealth <- максимальный(wealth_data) процент_максимального благосостояния <- max_wealth/сумма(wealth_data) * 100 # Объединить всю статистику во фрейм данных stats <- data. frame( среднее значение = mean_wealth, среднее значение = median_wealth, num_lost_99 = num_lost_99, perc_lost_99 = perc_lost_99, num_gain = num_gain, perc_gain = perc_gain, num_increased_100 = num_increased_100, max_wealth = максимальное благосостояние, процентная доля максимального благосостояния = perc_max_wealth_share ) return(статистика) } Неэргодические показатели <- Сводные показатели(неэргодические, 100)
Эти 20 человек представляют более широкую часть населения. Из 10 000 агентов, участвовавших в этой симуляции, 86% потеряли деньги. Средний уровень благосостояния составил 22 303 доллара, а средний показатель — 0,52 доллара.
Что за интуиция стоит за этим?
Черная линия отражает ожидаемый выигрыш в размере 5% за подбрасывание.
Что касается красных линий, то в долгосрочной перспективе игрок, как правило, получает половину орла и половину решки. По мере того как число переворотов становится бесконечным, соотношение выпадения орла и решки “почти наверняка” приближается к 0,5. Это означает, что каждый человек, как правило, в половине случаев получает увеличение на 50% (или в 1,5 раза больше первоначального богатства), а в половине случаев — уменьшение на 40% (60% от первоначального богатства). Средний рост благосостояния отдельного человека за определенный период времени составляет примерно 5%, или снижение благосостояния примерно на 5% за каждый период. Богатство каждого человека будет уменьшаться с такой скоростью. Черная полоса удерживается немногими счастливчиками.
Система, в которой среднее значение по времени сходится к среднему значению по ансамблю (среднему значению по нашей популяции), известна как эргодическая система. Последовательность азартных игр, которую я вам только что показал, неэргодична, поскольку среднее значение по времени и среднее значение по ансамблю расходятся. (Я не буду вдаваться в подробности споров о том, связана ли эта проблема вообще с эргодичностью. )
Это приводит к следующему утверждению: поскольку мы не можем индивидуально оценить среднее значение по совокупности, среднее значение по совокупности — это не то, что люди учитывают при принятии решений. Вместо этого люди максимизируют средние по времени темпы роста благосостояния. Для этой ставки, поскольку средний темп роста по времени отрицательный, агент по экономике эргодичности отклонил бы ставку.
Сравните это с подходом ожидаемой полезности, при котором полезность каждого результата взвешивается по его вероятности и суммируется для получения ожидаемой полезности. Теория ожидаемой полезности была бы совместима как с принятием, так и с отклонением ставки в зависимости от конкретной функции полезности.
Однако существует случайное соответствие между экономикой эргодичности и теорией ожидаемой полезности. Если у человека есть логарифмическая полезность, то есть он максимизирует взвешенный по вероятности логарифм возможных результатов, то он максимизирует средний по времени темп роста.
Одна из важных особенностей ставок, которую я только что показал, заключается в том, что результаты являются мультипликативными. Выигрыш при одном броске приводит к увеличению ставки при следующей ставке. Размер ставки зависит от состояния игрока.
Что, если вместо этого я предложу вам следующую ставку?
У вас есть 100 долларов, и вам предлагается сыграть в азартную игру, включающую серию из 100 подбрасываний монет. При каждом подбрасывании орел увеличивает ваше состояние на 50 долларов. Решка уменьшает его на 40 долларов. Вы принимаете ставку?
Вы можете увидеть изменения по сравнению с первоначальной ставкой, с суммами в долларах, а не в процентах. Для игрока с состоянием в 100 долларов первый бросок практически идентичен, но последующие ставки будут суммироваться в зависимости от этого результата и всегда будут включать один и тот же сдвиг на 50 долларов вверх или 40 долларов вниз.
Эта вторая серия бросков является эргодической. Ожидаемая стоимость каждого броска составляет 5 долларов (). Средний по времени темп роста также составляет 5 долларов.
Давайте смоделируем, как мы делали для мультипликативных ставок, когда 10 000 человек начинали со 100 долларов и подбрасывали монету 100 раз. На этом графике показан средний уровень благосостояния населения, а также пути первых 20 из 10 000 человек (выделены красным цветом).
Код для моделирования эргодической среды # Смоделируйте 10 000 человек, которые принимают серию из 1000 ставок 50:50, чтобы выиграть 50 долларов или проиграть 40 долларов. от начального состояния в 100 долларов. set. seed(20240705) эргодическая ставка(p=0,5, n=10000, t=100, выигрыш=50, проигрыш=40, эргодическая ОЦЕНКА=ИСТИНА, поглощение=ЛОЖЬ) Код для построения эргодической симуляции # Построить среднее значение результат и первые двадцать человек на одном участке. Эргодическая диаграмма < - График благосостояния(sim=эргодический, t=100, people=20) Рисунок эргодической диаграммы 3: Среднее благосостояние населения и путь первых 20 человек Код для генерации сводной эргодической статистики # Генерировать сводную статистику для населения и самого богатого человека после 100 и 1000 переворотов} Итоговая эргодическая диаграмма 100 <- Сводные данные(sim=эргодический, t=100)
Индивидуальные траектории роста группируются по обе стороны от среднего значения по популяции. После 100 переворотов средний доход составляет 602 доллара, а медиана — 600 долларов. 87% населения разбогатели. Такое соответствие между средним и медианным уровнем благосостояния и относительно равномерное распределение богатства характерны для эргодической системы.
Код для вычисления числа с нулевым уровнем благосостояния # Определите, сколько людей (в числе первых людей из n) испытывали нулевое или меньшее богатство во время моделирования. numZero <- функция(sim, t, подмножество=0){ #данные подмножества <- если(подмножество==0 | подмножество>sim$параметры[2,]){ sim$параметры[1:t,2:(sim$параметры[2,]+1)] } else { sim$sim[1:t,2:(подмножество+1)] } # количество людей, у которых уровень благосостояния был нулевым или меньше numZero <- длина(данные) - сумма(sapply(данные, функция(x) все(x>0))) numZero } numZeroTwenty100 <- нулевое значение(sim= эргодическое, t=100, подмножество=20) numZeroTwenty1000 <- нулевое значение(sim=эргодическое, t=1000, подмножество=20) numZero100 <- нулевое значение(sim=эргодическое, t=100) numZero1000 <- Нулевое значение(sim=эргодическое, t=1000)
Теперь о складке, которую мы можем видеть на построенном рисунке. Из первых 20 человек, показанных на графике, состояние 11(!) за эти 100 периодов стало отрицательным. Мы наблюдаем то же явление среди более широких слоев населения: за первые 100 периодов 5433 человека упали ниже нуля.
В той мере, в какой нулевое богатство разрушительно, когда оно происходит, это серьезное событие. Если игрок принимает на себя только последствия своей окончательной позиции, ставка вряд ли приведет к проигрышу, но все же представляет ненулевую угрозу катастрофы.
Что бы здесь сделал тот, кто стремится к максимизации ожидаемой полезности? Для человека с логарифмической полезностью любая вероятность проигрыша во время бросков приведет к тому, что он откажется от азартной игры. Логарифм, равный нулю, равен отрицательной бесконечности, что перевешивает все другие возможные исходы, независимо от их величины или вероятности.
Те, кто стремится к максимальному росту ставок, приняли бы ставку, если бы не боялись разориться. Средний по времени прирост в размере 5 долларов за бросок привлек бы их внимание. Если бы опасались краха и это было бы следствием, то они также могли бы отказаться.
Это подводит нас к основным гипотезам в области эргодичности экономика.
Во-первых, люди стремятся максимизировать средние по времени темпы роста своего благосостояния.
Во-вторых, оптимальные действия для максимизации средних по времени темпов роста варьируются в зависимости от мультипликативной и аддитивной сред. В мультипликативных средах у людей есть утилита ведения журнала. В аддитивных средах они не подвержены риску.
Кроме того, я нахожу эти цифры довольно забавными: 2500 периодов с вероятностью потери 5%, что приводит к ожидаемой стоимости, примерно в раз превышающей первоначальное состояние, даже при страховом сценарии. Оптимизаторы ожидаемого значения, даже если бы они использовали каждый атом во Вселенной, к концу остались бы с долей атома.
Питерс и Адаму (2022) аналогичным образом высказывают желание максимизировать темпы роста, поскольку происхождение кооперативного поведения. Здесь зеленые траектории — это эгоистичные агенты, синяя линия — кооператоры. В некотором смысле, это просто переосмысленная проблема страхования.
Один из наиболее интересных примеров касается временных предпочтений. Адаму и др. (2021) используют максимизацию темпов роста в качестве объяснения экспоненциального дисконтирования, гиперболического дисконтирования и изменения предпочтений в зависимости от конкретной динамики благосостояния.
Я не буду рассматривать все сценарии, но на этом рисунке показана ситуация, когда агент в аддитивном мире имеет выбор между меньшей выплатой раньше и большей выплатой позже. Этот агент стремится максимизировать темпы роста своего благосостояния. С точки зрения более высокой последующей выплаты, он обеспечивает более высокие темпы роста, которые равны наклону линии, продленной до вершины этой выплаты. К третьему кадру, когда агент переходит к более низкой и быстрой выплате, более высокие темпы роста теперь обусловлены более ранней выплатой. Они изменили свои предпочтения.
Именно при знакомстве с подобными идеями предположение о том, что экономика эргодичности “свободна от психологии”, кажется немного нелепым. Агент, должно быть, близорук, если не может предвидеть предстоящего изменения своих предпочтений или осознать упущенную большую возможность с другой стороны этого меньшего по размеру более раннего платежа.
Но вместо того, чтобы лезть в эту кроличью нору, я хочу представить экспериментальный результат. В 2019 году был опубликован рабочий документ, в котором изучалось, повлияет ли переход от аддитивной к мультипликативной среде на предпочтения в отношении рисков. Одна из моих записей в блоге была посвящена этому рабочему документу. В конечном итоге статья была опубликована в 2021 году в журнале PLOS Computational Biology (Meder et al. , 2021).
Этот первый эксперимент был подвергнут многочисленной критике, в том числе и со стороны меня, поэтому Skjold et al. (2024) разработали новый эксперимент. Предварительный вариант с описанием результатов этого эксперимента был опубликован в конце мая. В ходе этого нового эксперимента были учтены некоторые критические замечания, и результат оказался интересным. Участники эксперимента были рандомизированы в аддитивную или мультипликативную среду, где им было предложено сделать серию ставок. После того, как они сделали ставки в одной среде, их перевели в другую.
В начале аддитивной и мультипликативной сессии участники обучались на наборе фрактальных изображений, каждое из которых оказывало определенное влияние на их способности: умножение на некоторую дробь в мультипликативной сессии или сложение или вычитание некоторой суммы в аддитивной сессии. Затем участники были протестированы на то, усвоили ли они порядок расположения фракталов, при этом из анализа была исключена подгруппа участников с низким уровнем обучения. На этом рисунке показана процедура обучения, которая, по сути, включает в себя ознакомление с фракталом, а затем обновление их знаний.
Использование фракталов вместо чисел является одним из факторов, которые могут повлиять на результаты: мы внесли неопределенность в последующие решения. Это была одна из моих критических замечаний к первоначальному эксперименту, но я явно был не очень убедителен. В любом случае, давайте пока оставим это без внимания. Затем участники приступили к решению задачи, где им нужно было выбрать между азартными играми, каждая из которых представлена двумя фрактальными изображениями. На протяжении последовательности из 160 решений им будут показаны азартные игры, они сделают свой выбор, им будет показан исход азартной игры, а затем они увидят, как этот результат повлияет на их благосостояние.
Вы можете посмотреть видео с обучением и решением задачи ниже. (Я не показывал это видео в презентации. )
Участники были поощрены тем, что им было выплачено определенное количество баллов по сравнению с постоянным числом участников в 10 человек. Еще один пример того, “почему мы так усложняем экспериментальные стимулы”, и еще одно недоразумение, связанное с результатами эксперимента. Поощряя за пропорциональный доступ к пулу, они ввели ограничение на прибыль и ограничение на выигрыши. Но, опять же, сегодня я не буду обращать на это внимания. Итак, к результату. Исследовательская группа смоделировала участников как обладающих изоупругой функцией полезности (достаточно сильное предположение) с параметром, рассчитанным с помощью байесовского когнитивного моделирования.
Какую ценность мы бы оценили в этом эксперименте? Теория ожидаемой полезности умалчивает о точном значении. Однако экономический подход, основанный на эргодичности, дает нам прогноз. Во-первых, будет равно единице в мультипликативном условии, поскольку логарифмическая полезность максимизирует скорость роста. Во-вторых, будет равно нулю в аддитивном условии. Скорость роста максимизируется в аддитивной среде за счет поведения, не связанного с риском.
На этой диаграмме показан результат. Тонкие линии обозначают отдельных участников. Толстые линии обозначают совокупность. Для аддитивного сценария участники были близки к нейтральному уровню риска: совокупная оценка составила 0,1. Для мультипликативного сценария, несмотря на более широкое распределение значений, центральная оценка была равна единице.
Несмотря на элементы этого эксперимента, которые я бы сделал по-другому — я лишь намекнул на пару — это отличный результат.
Если гипотеза экономики эргодичности верна, то стоит задуматься о том, что это означает с психологической точки зрения.
При моделировании функции полезности исследователи использовали значение в качестве экспериментального богатства участника на момент принятия им решения. Это первоначальное пожертвование, плюс или минус результаты предыдущих ставок. не включает внешнее богатство.
Но если это использование является точной характеристикой процесса принятия решений агентами, то оно предполагает некоторую форму узких рамок или степень близорукости. Агенты максимизируют скорость роста в рамках эксперимента, а не в целом. Нам нужно немного рассказать о психологии, чтобы объяснить это. (Это явление часто встречается в лабораторных экспериментах, связанных с принятием рискованных решений. )
Аналогичным образом, этот эксперимент является частью более широкой среды, обладающей мультипликативными или аддитивными характеристиками. Участники эксперимента могут получать свои взносы за участие в эксперименте и инвестировать их. Максимизация скорости роста в аддитивном состоянии путем максимизации ожидаемого значения может не привести к максимизации общей скорости роста, если мир за пределами эксперимента является мультипликативным.
Теперь, пройдя довольно длинный и извилистый путь, я хочу обратиться к нескольким эволюционным наблюдениям об экономике эргодичности. Существует обширная литература по эволюции предпочтений, не говоря уже о самой литературе по эволюционной биологии, которая имеет отношение к анализу максимизации темпов роста. Поскольку концепции уже существуют, я собираюсь опереться на них и использовать в своих собственных целях.
Первый эволюционный аспект касается того, что происходит, когда мы смотрим на гены глазами. И чтобы помочь мне в этом, позвольте мне привести цитату из статьи по физике природы, в которой Оле Питерс (2019) резюмирует свою работу:
[Я] максимизирую математическое ожидание — среднее значение по совокупности всех возможных исходов теории ожидаемой полезности азартных игр неявно предполагается, что индивиды могут эффективно взаимодействовать с собственными копиями в параллельных вселенных (другими членами ансамбля). Математическое ожидание неэргодической наблюдаемой величины физически соответствует объединению и совместному использованию данных многими объектами. Это может отражать то, что происходит в специально созданном большом коллективе, но не отражает ситуацию с отдельным лицом, принимающим решения. Игнорируя тот факт, что Питерс неверно характеризует теорию ожидаемой полезности, можно сказать, что эта идея взаимодействия с копиями самих себя — это то, что происходит на уровне генов. Благодаря наличию множества копий гена у разных индивидуумов, ген может испытывать усредненное значение по совокупности. Следующая модель игрушки и имитационное моделирование иллюстрируют это.
Предположим, что два типа агентов живут в неэргодическом мире.
Один тип возбудителей стремится максимизировать среднюю по времени скорость роста своего потомства. Это стремление к максимизации средней по времени скорости роста является функцией его генотипа и передается его потомкам. Другой тип агентов стремится максимально увеличить ожидаемое количество потомства. Аналогично, предпочтения этого агента определяются генетически.
В среде, в которой живут эти агенты, у них есть выбор стратегии. Одна из стратегий заключается в том, чтобы иметь единственного бесполого отпрыска, прежде чем он умрет. Другая стратегия заключается в том, что ставка 50:50 на то, что у вас будет 0,6 или 1,5 отпрысков. Неполное потомство звучит странно, но при большом количестве агентов вы можете считать это средним числом потомков. Моделирование работает в основном так же, если я делаю число потомков вероятностным в соответствии с этими числами. Вы можете видеть, что я эффективно воспроизвел классическую экономическую ставку на эргодичность.
Одной из последних особенностей этой среды будет то, что каждый человек испытывает свои собственные трудности. Вы можете подумать, что в этой среде существует особый риск. Это важное допущение, к которому я еще вернусь.
При таком раскладе ставку всегда принимает тот тип, который максимизирует ожидаемое количество потомства. Тот, кто максимизирует рост в среднем по времени, всегда отвергает ее. Кто будет доминировать в популяции?
Средняя по времени скорость роста популяции максимизаторов остается постоянной. У каждого бесполого родителя по одному потомству.
это уникальный населения принимающей типа для моделирования из 100 поколений, начиная с 10000 населения.
код для эволюционное моделирование набора. семя(20240705) # создать функцию, чтобы круглый вероятностно — важно при небольшом количестве задействованных probabilistic_round &ЛТ;- функция(х) { если (управление если(1) в < х - Пол(X)) { потолка(х) } еще { пола(х) } } # функция для моделирования эволюции букмекерской evolutionBet &ЛТ;- функция(р, п, т, прибыль, убыток) { #P-это вероятность получить #регион-сколько людей в моделировании #t-число условных поколений параметры &ЛТ;- данных. рама(значения = с(п, н, т, прибыль, убыток)) rownames(параметры) в <- C (С"П", "Н", "Т", "прибыль", "убыток") сим - &ЛТ;- числовой(Т + 1) сим[1] &ЛТ;- Н # запускать населения Для (я в 1:т) { для (J в 1:тура(N)) { итогового &ЛТ;- rbinom(1, 1, п) п <- Н + (оператору ifelse(результат == 1, прибыль, убыток) - 1) } п <- probabilistic_round(Н) сим[я + 1] &ЛТ;- N, если (П == 0) перерыва } сим - &ЛТ;- данных. рамка(период = 0:т, н = сим) списка(параметр params = параметры, Сим = сим) } эволюции &ЛТ;- evolutionBet(Р=0,5, Н=10000, т=100, коэффициент усиления=1. 5, потеря=0. 6) #более 100 периодов может занять очень много времени, моделирование произойдет заметное замедление как роста населения кода для эволюционного Сюжет # Сюжет прироста населения за эволюционный сценарий (рис. 8). basePlotEvo &ЛТ;- ggplot(эволюция$Сима[с(1:101),], АЕС(х=период)) expectationPlotEvo &ЛТ;- basePlotEvo + geom_line(AES с(г=н), цвет = 1, ширина линии=1) + лаборатории(г = "население") expectationPlotEvo рисунок не 4: население приема видах
вы можете видеть, что у них темпы роста населения почти на 5%.
<п>почему они не испытывают упадка мы видели в предыдущих моделирований эту ставку? Потому что их копии получают полный набор результатов.
Итак, перед нами игрушечная модель, которая показывает, что максимизация среднего по времени темпа роста может оказаться неоптимальной стратегией в мультипликативной среде. Постоянная популяция максимизаторов среднего по времени темпа роста вытесняется растущей популяцией максимизаторов ожидаемого значения.
Такое поведение может проявляться и там, где его ранее не было. В моделировании, которое я вам только что показал, для начала было задействовано 10 000 агентов с поведением, максимизирующим ожидаемую ценность. Что, если бы у нас была популяция оптимизаторов средних по времени темпов роста, и появился бы один оптимизатор ожидаемой ценности?
Я смоделировал 10 000 случаев развития мутации у одного индивидуума. На этом графике показана популяция первых десяти мутантов. У пяти из них мутация появляется и исчезает. Что касается остальных пяти, то они разрастаются в значительную популяцию. Для эффективного улучшения результатов требуется всего несколько агентов с этой мутацией.
Код для эволюционного моделирования # запустите 9 симуляций с 1 приемлемым типом для запуска set. seed(20240705) мутаций <- 10000 для (i в 1:мутации) { assign(paste0("evolution_", i), evolutionBet(p=0,5, n=1, t=100, выигрыш=1,5, потеря=0,6)) } # Создайте фрейм данных для каждой симуляции и сохраните в списке data_frames <- list() для (i в 1:мутации) _BOS_ # Динамически извлеките переменную и выберите первые 101 строку из $sim current_data <- получаем(paste0("evolution_", i))$sim[1:101, ] # Добавляем столбец для 'i', который будет использоваться в качестве цвета при отображении текущих данных$i <- i # Добавляем в список data_frames[[i]] <- текущие данные } # Объединить все фреймы данных в один combined_data <- do. call(rbind, data_frames) Код для подсчета распространения мутации # Подсчитывает количество симуляций, в которых распространилась мутация (где n > 1 при i = 100) mutation_count >- сумма(комбинированные данные[комбинированные данные$period == 100,]$n > 1, na. rm = TRUE) Код для эволюционного построить график с мутацией # Построить первые 10 строк графика мутаций >- ggplot(комбинированные данные[комбинированные данные$i >= 1 &комбинированные данные$i <= 10,], aes(x=период, y=n, цвет=коэффициент(i))) + geom_line() + лаборатории(y = "Популяция") + #удалить тему легенды(legend. position = "нет") График мутаций На рисунке 5: Популяция принимающих типов с мутацией
Если мы увеличим масштаб до первых 35 периодов, вы сможете увидеть динамику для тех, где произошла мутация. не распространяется.
Код для эволюционного графика с мутациями (первые 30 периодов) # Построим график мутаций только для первых 35 периодов — ggplot(комбинированные данные[комбинированные данные$i >= 1 &комбинированные данные$i <= 10,], aes(x=период, y=n, цвет=коэффициент(i))) + geom_line() + лаборатории(y = "Население") + xlim(0,30) + ylim(0,35) + #удалить тему легенды(legend. position = "нет") График мутаций на 30 рисунке 6: Популяция принимающих типов с мутацией (первые 30 периодов для первых 10 агентов)
Это немного более радужная картина, чем предыдущая. встречается во всех 10 000 симуляциях, где мутация не распространялась в 70% случаев. Эти иллюстрации показывают, что оптимизация роста в среднем по времени, возможно, и не является оптимальной стратегией, но она основывается на одном важном предположении: риск индивидуален. Диверсификация позволяет гену соответствовать среднему показателю по совокупности. Что, если такая диверсификация невозможна?
В таком случае мы, по сути, возвращаемся к тому миру, который я показывал вам в начале. Вы можете считать, что каждая линия представляет отдельного человека и его детей, причем все их дети привязаны к одной и той же ставке. Почти во всех случаях это приводит к снижению частоты. Немногие необычайно удачливые люди могут преуспеть во многихшансы на выигрыш невелики, но это редкий шанс.
Далее, вспомним о снижении к концу 100 периодов. Это произошло потому, что небольшое число генетических линий составляет большую часть популяции — фактически, одна линия из первоначальных 10 000 составляет 53% популяции в конце 100 периодов — и они не могут диверсифицировать свой риск. Несколько неудачных бросков монеты — и они исчезли.
В результате за достаточно долгий промежуток времени все оказываются в проигрыше. Немногих счастливчиков больше нет. Вот та же самая симуляция, выполненная в течение 1000 итераций, за эволюционное время, как в линейном, так и в логарифмическом масштабе.
Код для эволюционного графика длительностью более 1000 периодов, неэРгодичеСкий график <- Размер графика (sim=неэргодический, t=1000, people=20), неэРгодичеСкий график Рисунок 7: Совокупность принимающих типов длительностью более 1000 периодов, код для эволюционного графика длительностью более 1000 периодов (логарифмическая шкала), логнонергодический график <- неэРгодичеСкая диаграмма+ scale_y_log10(разрывы = c(0. 0001, 0. 1, 100, 100000), метки = c("0. 0001", "0. 1", "100", "100000")) Рисунок логнонергодической диаграммы 8: Совокупность принимаемых типов за 1000 периодов (логарифмическая шкала)
в результате при совокупном риске оптимальной стратегией может быть максимизация средних по времени темпов роста.
Чтобы рассмотреть это более подробно, я собираюсь обратиться к другому примеру, который имеет богатую историю в литературе по биологии. Конкретный пример, который я собираюсь привести, немного карикатурен и взят из книги Эндрю Ло «Адаптивные рынки». Это, в свою очередь, опирается на более техническую статью Томаса Бреннана и Ло (Thomas Brennan and Lo, 2011), опубликованную в Quarterly Journal of Finance, в которой объясняется эволюция сопоставления вероятностей. Вы можете найти другие более ранние примеры в литературе, например, у Купера и Каплана (Cooper and Kaplan, 1982) в журнале теоретической биологии.
Этот пример касается животного по имени триббл. Для развлечения я загрузил более ранний вариант этой презентации в чат и попросил его проиллюстрировать ее. Большая часть того, что он создал, была непригодна для использования, но я сохранил пару изображений, для которых, по моему мнению, он хорошо поработал.
Трибблы живут в регионе, состоящем из долин и плоскогорий. Триблы размножаются один раз в жизни (производят трех бесполых отпрысков) и должны выбрать, где им размножаться — в долине или на плато. Однако это рискованное решение, поскольку долины страдают от наводнений, а плато — от засухи.
Вероятность появления солнца в каждом поколении составляет 75%. В таком случае трибблы, родившиеся на плато, погибают. Остальные 25% времени идут дожди, что приводит к наводнениям в долинах и гибели размножающихся там племен.
Какова же тогда стратегия размножения, направленная на максимизацию роста?
Давайте определим долю племенных особей, которые размножаются в долине. Если мы максимально увеличим ожидаемое количество потомства, племена будут размножаться в долине в 100% случаев. То есть, это приведет к ожидаемому появлению потомства.
Однако, в долгосрочной перспективе, если все трибблы сделают этот выбор, трибблы будут уничтожены. В долгосрочной перспективе трибблы будут испытывать засухи в 75% случаев и наводнения в 25% случаев. Выражаясь языком экономики эргодичности, средний по времени темп роста равен нулю.
Чтобы найти значение, которое максимизирует темп роста, мы берем логарифм G и вычисляем производную. Решение состоит в том, чтобы размножаться в долине в 75% случаев и на плато в 25% случаев.
Соответствие вероятностей в этом мире максимизирует средние по времени темпы роста.
Этот результат будет таким же, если мы подойдем к нему с точки зрения утилиты ведения журнала. Если мы максимизируем логарифмическую полезность в зависимости от количества потомков, мы получаем то же значение.
Здесь мы имеем дело с миром, где оптимальным решением является максимизация средней по времени скорости роста. В данном случае это достигается путем сопоставления вероятностей.
В этом сценарии есть одна особенность, которая может показаться странной. Сопоставление вероятностей увеличивает скорость роста вида. Но какие особи отправляются на плато, где в 75% случаев их будут поджаривать? Если это альтруистический акт на благо вида? Почему бы им не отправиться в прохладную долину, где у них, как у индивидуумов, больше шансов выжить?
Ответ дал Графен (Grafen, 1999). Предположим, у нас большая популяция. Если агент направляется в долину, ожидаемая доля популяции, включающая его потомство (), будет составлять:
Если они останутся жариться на плато, их потомство будет составлять аналогичную долю меньшей оставшейся популяции:
Пригодность — это относительный показатель. При равновесии каждый вариант обеспечивает одинаковую пригодность.
Я создал два гипотетических мира, один из которых позволяет максимизировать ожидаемую ценность, несмотря на то, что он находится в мультипликативном мире, и еще один случай, когда оптимальной стратегией является максимизация средних по времени темпов роста. В обоих случаях оптимальная стратегия основывается на мнении гена. Вариативность зависит от вероятностной структуры окружающей среды. Едва ли я первый, кто это предлагает. Я опираюсь на богатую историю исследований эволюции геометрической максимизации темпов роста в биологической литературе. Это, в свою очередь, было использовано экономистами, такими как Робсон и Самуэльсон (2011), при анализе эволюции предпочтений.
Но мне нравится думать, что это упражнение по экономике эргодичности предоставляет прекрасную возможность связать несколько направлений вместе, чтобы представить другую перспективу.
Что дальше? Я создавал набор симуляций, исследующих смешанные среды. Что, если вероятностная структура среды представляет собой сочетание мультипликативных и аддитивных ставок? Можно представить, что аддитивная фаза эксперимента, описанного мной ранее, включает в себя несколько аддитивных азартных игр в мультипликативном мире. Что, если среда переключается между аддитивными и мультипликативными ставками?Простого решения этой проблемы в замкнутом виде не существует. Если у вас есть сочетание аддитивных и мультипликативных ставок или даже непостоянный мультипликативный темп роста, создать “эргодическую наблюдаемую” будет непросто. В настоящее время это лучше всего исследовать с помощью моделирования.
Адаму А. , Берман Ю. , Маврояннис Д. и Питерс О. (2021). Микроосновы дисконтирования. Анализ принятия решений, 18 (4), 257-272. https://doi. org/10. 1287/deca. 2021. 0436 Бреннан Т. Дж. и Ло А. В. (2011). Происхождение поведения. Ежеквартальный финансовый журнал, 01 (01), 55-108. https://doi. org/10. 1142/S201013921100002X Купер У. С. и Каплан Р. Х. (1982). Адаптивное “подбрасывание монетки”: теоретико-правовое исследование естественного отбора в отношении случайных индивидуальных вариаций. Журнал теоретической биологии, 94 (1), 135-151. https://doi. org/10. 1016/0022-5193 (82)90336-8 Доктор Дж. Н. , Ваккер П. П. и Ванг Т. В. (2020). Взгляды экономистов на проблему эргодичности. Nature Physics, 16 (12), 1168-1168. https://doi. org/10. 1038/s41567-020-01106-x Форд М. С. и Кей Дж. А. (2023). Ограничения оптимальных для роста подходов к принятию решений в условиях неопределенности. Журнал Econ Journal Watch, 20 (2), 314-334. https://econjwatch. org/articles/the-limitations-of-growth-optimal-approaches-to-decision-making Графен, А. (1999). Формальный дарвинизм, индивидуальная аналогия, максимально приближающая агента, и защита интересов. Труды Лондонского королевского общества. Серия В: Биологические науки, 266 (1421), 799-803. https://doi. org/10. 1098/rspb. 1999. 0708 Медер, Д. , Рабе, Ф. , Морвилл, Т. , Мэдсен, К. Х. , Кудал, М. Т. , … Халм, О. Дж. (2021). Анализ эргодичности показывает, как люди принимают оптимальные по времени решения. PLoS Computational Biology, 17 (9), e1009217. https://doi. org/10. 1371/journal. pcbi. 1009217 Питерс О. (2019). Проблема эргодичности в экономике. Физика природы, 15 (12), 1216-1221. https://doi. org/10. 1038/s41567-019-0732-0 Питерс О. (2023). Страхование как проблема эргодичности. Annals of Actuarial Science, 17 (2), 215-218. https://doi. org/10. 1017/S1748499523000131 Питерс О. и Адаму А. (2022). Эргодическое решение головоломки сотрудничества. Философские труды Королевского общества A: Математические, физические и инженерные науки, 380 (2227), 20200425. https://doi. org/10. 1098/rsta. 2020. 0425 Робсон А. Дж. и Самуэльсон Л. (2011). Эволюционные основы предпочтений* (Дж. Бенхабиб, А. Бисин и М. О. Джексон, ред. ; Том 1, стр. 221-310). Северная Голландия. https://doi. org/10. 1016/B978-0-444-53187-2. 00007-3 Скьолд Б. , Стейнкамп С. , Коннотон К. , Халм О. Дж. и Питерс О. (2024). Преобразования эргодичности предсказывают принятие человеком решений в условиях риска. https://doi. org/10. 31219/osf. io/c96yd