Ценность информации и устойчивость убеждений

В данной речи (2017 г.) философ Аманда Аскелл утверждает, что мы часто недооцениваем ценность новой информации или знаний, думая о том, как улучшить мир вокруг нас. Это приводит к тому, что действия, благодаря которым мы получаем информацию (например, исследования) зачастую являются более ценными, чем может показаться на первый взгляд.

Ниже приведён текст выступления с незначительными изменениями.

Я начну разговор с нескольких спойлеров. В основном, я не скажу ничего удивительного. Первое утверждение, с которым вы, надеюсь, согласитесь, — мы отдаём предпочтение действиям с лучшей доказательной базой, выделяющимся на фоне остальных. Позже я объясню это подробнее. Второе — при наличии меньшего количества доказательств в пользу данного действия падает ваш уровень доверия к его эффективности, что я называю «слабой устойчивостью».

Это то, что в некоторой степени было исследовано теорией принятия решений, что также является верным при равном количестве аргументов «за» и «против»: например, если есть 50% вероятности, что я получу 100$, то существует 50%-ая «слабая устойчивость» и 50%-ая «сильная устойчивость».

Я также скажу, что если у вас слабый уровень доверия в каком-либо вопросе, то информация по данной теме более ценна, чем если бы мы рассмотрели аналогичную ситуацию, но с высоким уровнем доверия. И, следовательно, я утверждаю, что в большинстве случаев нам следует предпочесть действия с меньшей доказательной базой при схожести значений по остальным критериям. Надеюсь, это покажется вам как контринтуитивным, так и заслуживающим внимания.

Итак, первое, о чём нужно сказать, — распространённое мнение, что расчёт математического ожидания^[1] является достойным способом оценки эффективности отдельно взятого мероприятия. Например, мы представим, что существует болезнь “А”, недавно открытая и с интересным названием, и другая болезнь “Б” с не менее интересным названием (Рисунок 1).

В принципе идея заключается в следующем: эти два заболевания практически невозможно отличить, поскольку они обладают одинаковыми симптомами, вызывают одинаковое сокращение ожидаемой продолжительности жизни и др. Основное отличие – они по-разному реагируют на различные методы лечения, поэтому любой доктор, встречающий пациента с одним из этих заболеваний, оказывается в довольно затруднительном положении.

Итак, врач может выписать лекарство “А” стоимостью 100$. Если у пациента болезнь “А”, данное средство может продлить жизнь больного на 10 лет. Однако если пациент страдает от болезни “Б”, то лекарство “А” не окажет ни малейшего эффекта, и больной умрёт. Аналогичная ситуация и с лекарством “Б”, которое вылечит пациента с болезнью “Б”, продлив ему жизнь на 10 лет, и будет бесполезным в борьбе с болезнью “А”. В целом, каждый доллар, потраченный на данные лекарства “А” и “Б” продлевает жизнь на 0.05 года при условии, что речь идёт о болезни “А” или “Б” соответственно.

Вдруг появляется лекарство “В” в такую же цену, излечивающее от обеих болезней. Ценность этого лекарства выше, чем если бы мы говорили о средстве “А” или “Б”, что приводит нас к выводу назначить “В”.

Представим, что проводились многочисленные и тщательные испытания препаратов “А” и “Б”, что показало высокую эффективность данных средств и надёжность оценок. Препарат “В” появился на рынке недавно, касательно него проводилось лишь одно исследование, показавшее увеличение жизни пациентов на много лет. Предполагается, что в исследовании принимали участие пациенты с болезнями “А” и “Б”.

Теперь вы относитесь к препарату “В” более осторожно и думаете: “Скорее всего, большинство лекарств, которое мы случайно выберем, окажут нейтральный или отрицательный эффект”. Это консервативная точка зрения. Если вы знаете только об одном испытании, в котором средство массово продлевает чью-то жизнь, то ваше прежнее решение о выборе лекарства “В” потеряет несколько пунктов.

Мысль, что нам следует придерживаться действий с большей доказательной базой, не рассматривается теорией полезности^[2], однако раскрывается в статье GiveWell, написанной несколько лет назад.

«Кажется, что ожидаемые результаты, которые наверняка могут получиться, не изменятся от недостатка информации или от слабо обоснованных оценок. Если я вижу, что могу сейчас спасти ребенка, испортив при этом свой костюм в 1,000$, то я не побегу продавать костюм и отсылать вырученные деньги на медицинские исследования, хотя данная сумма пожертвования и могла бы спасти не одну, а, скажем, две жизни и, следовательно, это было бы более эффективным вложением».

Идея состоит в том, что не стоит полностью доверять расчётам математического ожидания и эффективности, поскольку иногда они могут приводить к таким безумным ситуациям, как это было указано выше. Я хочу сказать, что есть два типа утверждений, которыми можно руководствоваться в подобных ситуациях. Первое утверждение, с которым, я надеюсь, вы согласитесь — факты имеют значение. То, сколько у нас аргументов «за», и то, насколько они значимы, влияет на то, совершим ли мы просчитанное действие или то, которое интуитивно намеревались совершить в начале.

Второе утверждение исходит из первого, а именно: при прочих равных обстоятельствах мы должны выбирать действия, аргументированные бóльшим количеством фактов. Таким образом, при равных ожидаемых затратах нам следует предпочесть действия с большей доказательной поддержкой.

В случае с препаратами “А”, “Б” и “В” мы, возможно, скажем, что они примерно схожи. Наличие многочисленных исследований по лекарствам “А” и “Б” обеспечивает преимущество данных средств перед препаратом “В”, эффективность которого была доказана лишь одним исследованием.

Я собираюсь рассмотреть оба этих утверждения и выяснить, могут ли расчёты мат.ожидания способствовать обоснованию данных высказываний. Как я уже говорила в начале, первое утверждение обосновано и имеет бóльшую поддержку, в то же время оно может опровергнуть второе. Хорошо. Я хотела бы вернуться к понятию устойчивости и к тому, как мы определяем, следует ли выбрать условное лекарство так, чтобы оно принесло желаемый эффект.

Возьмём, к примеру, новую монету. У нас нет информации, насколько «предвзята» эта монета. У неё может чаще выпадать орёл или решка или же она может быть идеальна выполнена. У нас пока нет данных для подтверждения одной из этих гипотез. То есть мы не имеем ни малейшего понятия о смещении монеты и на вопрос «Какова вероятность, что в следующий раз выпадет орёл?» мы, скорее всего, ответим, что это 50%, поскольку у нас нет причин подозревать смещение в ту или иную сторону.

Теперь давайте рассмотрим случай с хорошо проверенной монетой, на тестирование которой, вероятно, ушло множество скучных дней, в результате чего получилась длинная последовательность из результатов испытаний.

В первом случае, как было сказано, мы ответим, что вероятность равняется 0.5 или 50%. Во втором случае с протестированной монетой, где в 50% случаях выпадает орёл, а в 50% – решка, наш ответ “50%” будет обоснован.

Разница в этих случаях отражена в уровнях устойчивости доверия к данным. Что такое устойчивость в этом смысле — это устойчивость к убеждениям (кредоустойчивость), уровень доверия, зависящий от новых доказательств. Чем выше уровень доверия, тем выше устойчивость. Я не думаю, что мои взгляды поменяются даже с появлением опровергающих аргументов, даже если последние достаточно убедительны и имеют отношение к данному вопросу. Если же у меня низкий уровень доверия к чему-либо, следовательно, речь идёт о низкой устойчивости и низкой стабильности. С появлением других доказательств ситуация может поменяться. В случае с непроверенной монетой у меня нет данных о её поведении, поэтому устойчивость в 50% довольно низкая.

Стоит отметить, что уровни устойчивости могут отражать либо имеющийся набор доказательств, либо ваше предыдущее отношение по данному вопросу. Так, например, подавляющее большинство монет более-менее сбалансированы. Если вы видите, что я беру монету из стопки честных монет, то у вас будет доказательство, что монета честная. Однако если вы живёте в мире, где попадаются несбалансированные монеты, то ваша уверенность не была бы такой сильной. Итак, есть две вещи, формирующие устойчивость.

В обоих случаях с монетой ваше доверие к тому, что монета приземлится на какую-то сторону, одинаково: 0.5. Ваше 50%-ое доверие к проверенной монете устойчиво, потому что вы сделали миллион испытаний этой монеты. В то время как ваше доверие к непроверенной монете довольно неустойчиво. Как мы видим здесь, его уровень может легко измениться в ответ на новые доказательства.

Возьмём третий случай. Вы начинаете тестировать новую монету, совершая ряд подкидываний, в результате чего выявляется последовательность, указанная на рисунке 3. В таком случае мы можем предположить смещение в сторону орла и ваше доверие к этому повышается с каждым броском. Поскольку раньше у вас было меньше доказательств, уровень доверия был ниже, но сейчас налицо изменения в нём. Количество доказательств прямо пропорционально уровню устойчивости.

Такого изменившегося уровня доверия не было бы, если бы вы уже имели последовательность результатов испытаний, поскольку ваше мнение было бы в этом случае надёжно обоснованным. Если после миллиона бросков вы видите, что решка выпадала последние 5 раз, то ваше мнение касательно результата следующего броска всё равно не изменится.

Я считаю, что кредоустойчивость может привести к весьма интересным последствиям. Многие люди, похоже, не хотели бы наверняка оценивать вероятность эффективного исхода какого-либо действия. Я думаю, что действительно хорошее объяснение этому заключается в следующем: при небольшом количестве доказательств мы не ожидаем от самих себя высокого уровня доверия.

В большинстве случаев мы думаем, что существует определённая вероятность, что мы будем придерживаться того же мнения, несмотря на новые доказательства. Мы просто не хотели бы признавать, что наши взгляды окажутся ложными или неточными вследствие изменения доказательной базы. Иногда люди думают, что вы неуверены и у вас нет точных оценок, говоря: “Это действие эффективно до степени N.” Я уверена, что понятие устойчивости может быть хорошим способом объяснить это и сказать этим людям: “Нет. На самом деле, у вас есть точные оценки. Вы просто не хотите подтверждать их.”

Ценность информации, таким образом, является своего рода темой этого разговора. Возвращаясь к нашему случаю с лекарственными препаратами, отмечу, что идея аналогична примеру с эффективностью действий.

В исходном случае у нас были ожидаемые оценки 0.05, 0.05 и 0.06 лет жизни на 1$ для трёх препаратов “А”, Б и “В” соответственно. Конечно, мы можем получить новую ценную информацию, в данном случае это касается болезней “А” и “Б”. Итак, более точная диагностика, болен ли пациент “А” или “Б”, стоит 60$. Опираясь на её результаты, мы теперь можем прописать более подходящий препарат для лечения: лекарство “А” против болезни “А”, “Б” против “Б”, что стоит дополнительно по 100$.

Таким образом, стоимость диагностики с последующим назначением препарата значительно выше стоимости изначальных вариантов. Для назначения вам подходящего препарата “А”, “Б” или “В” следует провести дополнительную диагностику, это, конечно, понятно.

Хорошо, это была информация по данному вопросу, оказавшаяся ценной для нас. Но что если я занимаюсь искоренением глобальной нищеты, для чего мне нужно найти или изобрести подходящие способы разрешения этой задачи. Допустим, я нахожу проблемы в Индии, затем определяю, существуют ли хорошие способы решить их. Это и называется нахождением релевантной информации по заданной проблематике.

Очевидно, что другим способом получения информации является ознакомление с подходящими видами вмешательств (Рисунок 5). Например, мы можем рассмотреть работу препарата “В” и оценить его эффективность.

Предположим, что испытания препарата “В”, которые совершенно точно убедят вас в степени его эффективности, обойдутся в этом прекрасном идеальном мирке в 5.000$. Каким-то образом вы узнали, что результаты могут оказаться либо незначительными, либо очень впечатляющими. Итак, ваши ожидания — 50% вероятности, что данное лекарство может продлить жизнь на 2 года в обоих случаях (пусть это будет скептическое мнение), против 50% вероятности сильного воздействия (обе болезни побеждаются и жизнь продлевается на 10 лет). В итоге, испытание не удалось.

Хорошо. Вы решили выписать лекарство “В”, не учитывая малое количество доказательств в его пользу. Конечно, вас не должно существовать в любой современной медицинской системе 🙂 Вы действуете, опираясь на существующее ожидаемое значение из таблицы. Тогда появляется вопрос, насколько ценно это испытание, особенно если вы уже выписали этот препарат. Если ваши убеждения в его низкой эффективности стремятся к 1, например, если вы вдруг обнаружили, что лекарство гораздо менее эффективно, чем это ожидалось, то вы поменяете своё мнение и выпишите препарат “А” или “Б”.

Эффект в пересчёте на одного пациента разнится от двух до пяти лет в данном случае. В то же время, если вы не проводите испытания, то вы не тратите на него ресурсы, но в итоге получите лишь 2 дополнительных года жизни на 100$ для каждого пациента, если препарат “В” покажет слабое действие. Однако если данное средство окажется высокоэффективным, то жизнь будет продлена на 10 лет, как если бы вы случайно прописали известное подходящее средство.

Итак, проведение испытания прибавляет 1,5 года к ожидаемой продолжительности жизни при последующем лечении, что является лучшей альтернативой простому назначению препарата “В” двум тысячам или более пациентов. Если пациентов 2000 или больше, то инвестиции в данное испытание являются более оправданными, чем назначение уже известных лекарств. Это означает, что в данном случае ценность информации уменьшает ценность вмешательства.

Ценность инвестиций в исследования средств “А” или “Б” почти ничтожна, поскольку ожидания насчёт их эффекта уже весьма устойчивы. Итак, получаем в результате то, что ожидается согласно теории полезности или расчётам мат.ожидания: при прочих равных обстоятельствах нам следует больше инвестировать в действия с меньшей доказательной базой, чем в уже существующие и известные варианты.

Это означает, что если значения ожидаемых результатов схожи, нам следует предпочесть (в большинстве случаев) действия с меньшим количеством подкрепляющих аргументов. Далее я буду использовать термин, обозначающий «неинформативную ценность». Суть состоит в том, что в подобных случаях ценность каких-то определённых параметров может быть одинаковой, а информативная — различаться; как раз там, где ваш уровень доверия менее устойчив, определяя ожидаемое значение, в этом случае информативная ценность будет выше.

Итак, это подводит нас к части под названием «что всё это значит, и что мне надо делать». Надеюсь, что я убедила вас, что несмотря на интуитивные предположения, нам следует предпочитать инвестиции в проекты с меньшей доказательной базой, в пользу чего существуют определённые аргументы.

Когда мы рассматриваем информативную ценность, то, в принципе, у нас есть три варианта. Раньше я называла их «Смотри, хватай и отступай», но после пересмотрела то, как они звучат для других и остановилась на «Узнай, используй или пропусти» (Рисунок 7).

Итак, мы можем выбрать первый вариант «Узнать» (проведение исследования, спонсирование сбора данных и др.), что в первую очередь будет означать инвестирование в информативную ценность. Мы можем «Использовать», что подразумевает инвестирование для повышения конкретного критерия или же можем пропустить данные варианты и либо инвестировать в другие области, либо вообще подождать с инвестициями, отложить их.

Основное различие между данными вариантами заключается в причине действия. Возьмём трёх человек. Алина жертвует 100$ благотворительной организации, занятой в области экзистенциальных рисков, чтобы защитить будущее человечества, так что она выбирает второй вариант «Используй». Она просто занимается улучшением конкретного критерия.

Борис жертвует 100$ той же организации с целью понять, насколько они способны улучшить мир. Сейчас он скорее «узнаёт», чтобы потом «использовать». Он может думать про себя: «Посмотрим-ка, насколько это стоит того». Если полученная информация окажется ценной, то это окупит затраты.

Вадим жертвует 100$ благотворительной организации В, и у нас теперь больше возможностей выявить необходимые направления для работы. Вадим сейчас «использует», инвестируя в конкретные критерии для уменьшения экзистенциального риска. Мы, в свою очередь, можем выявить лучшие направления работы для дальнейших действий в них, опираясь на имеющуюся информацию. Таким образом, он «использует», чтобы «узнавать», чтобы вновь «использовать».

В каких случаях затраты на «изучение» оправданы? Когда наблюдаются три вещи. Во-первых, когда существует большая неопределённость в отношении эффективности данного вмешательства, мы говорим, что действие ожидается быть эффективным, но эти ожидания слабоустойчивы. Во-вторых, когда мы уверены насчёт предполагаемой ценности, эта ценность поможет нам окупить некоторые затраты. И в-третьих, когда стоимость информации сравнительно низкая, то затраты на её получение также малы, и промедление также не повлечёт за собой значительных потерь (вы ведь не будете судорожно искать информацию при приближающемся к вам поезде, поскольку гораздо ценнее будет отложить поиски и убраться с путей).

Вопрос, который у меня возникает, это «Будет ли получение информации полезным для эффективных альтруистов?» Возможно, лучшей формой будет «Является ли информация отдельным направлением для деятельности эффективных альтруистов?»

Существует большая неопределённость внутри и между различными направлениями и областями деятельности, особенно если мы будем рассматривать долгосрочные косвенные последствия. Мы ничего не знаем о подобных возможных эффектах после наших вмешательств. Мы видим это с точки зрения прогресса, совершённого отделом исследований ЭА. Я думаю, что это свидетельствует о существовании большой неопределённости.

Существует также и значительная выгода от уровня уверенности в данном случае. Мы собираемся использовать данную информацию в долгосрочной перспективе. Эффективный альтруизм не подразумевает под собой краткосрочные вмешательства. Таким образом, в проектах, над которыми работают несколько поколений, ценность информации будет выше, поскольку люди будут исследовать вопрос дальше и при помощи всей обнаруженной информации находить оптимальные варианты вмешательств.

В некотором смысле затраты на получение информации довольно малы, поскольку движение, о котором идёт речь, появилось сравнительно недавно и пока это представляется несложной задачей. Есть пара оговорок: возможно, вы похожи на условного Вадима (см. пример выше). Возможно, вы очень обеспокоены значительными нарушениями климата или возможной ядерной войной. В таком случае вы можете подумать, что необходимо непосредственное вмешательство в данных областях.

Итак, какое значение имеет вариант «Узнай» для ЭА (при условии, что вы согласны признать работу с информацией отдельным направлением деятельности)? Я думаю, что мы могли бы инвестировать намного больше времени и ресурсов в мероприятия, которые, вероятно, будут эффективными, поскольку предоставят нам больше доказательств для той или иной точки зрения. Я считаю, что нам следовало бы проводить больше исследований, но в то же время понимаю, что это может показаться несколько эгоистичным. Скорее всего, это лучше всего подойдёт к тем случаям, когда крупные спонсоры нуждаются в диверсификации своих пожертвований вследствие вероятности, что ценность информации снизится.

С психологической точки зрения, я, конечно, думаю, что нам следует быть более устойчивыми к переменам и неудачам. Когда люди задумываются о том, что могут быть заняты в областях, которые окажутся неэффективными, то сталкиваются с психологической преградой. Иногда вы можете подумать: «Так-так, я лишь исследую это, чтобы понять, насколько всё плохо или хорошо, и если всё плохо, то я всего лишь поменяю поле деятельности. Или же если это не окажется настолько хорошим, насколько это представлялось мне раньше, то я тоже займусь чем-нибудь другим». На самом деле, это наиболее удачный способ мышления.

Одной из крайних точек зрения, которой вы могли бы придерживаться, является следующая: «Нам следует начать инвестировать время и ресурсы в мероприятия с высокой ожидаемой ценностью, но с малой или отсутствующей доказательной базой». Есть и более скромное предложение, с которым я могу согласиться: «Скорее всего, нам следует начать учитывать ценность информации и оценки направлений деятельности и мероприятий, чем принимать их за второстепенные характеристики конкретного критерия». В некоторых случаях информативная ценность может уменьшить ценность отдельного критерия. В такой ситуации её никак нельзя воспринимать как нечто косвенное для расчётов мат.ожидания, а следует рассматривать как главную движущую силу в определении ценности.

Другими словами, фактические данные имеют большое значение при расчётах мат.ожидания, опирающихся на ценностное значение информации. Если конкретная ожидаемая ценность мероприятий одинакова, это будет скорее способствовать осуществлению мероприятия с меньшей доказательной базой, чем с большей. А серьёзное отношение к информативной ценности изменит то, как эффективные альтруисты инвестируют свои ресурсы, то есть время и деньги.

Вопрос: У одного человека возник вопрос, что означает иметь доверие к уровню доверия. Допустим, есть вероятность в 80%, что на 50% это сработает и т.д. Вопрос состоит в том, стремится ли данная цепочка к нулю.

Аманда Аскелл: Дело не в том, что у вас есть некоторая степень доверия к другой степени доверия, но ваш уровень доверия к доверию может оставаться таким же или изменяться в ответ на новые обстоятельства. Здесь много связанных понятий. Есть такие вещи как уровень вашего доверия к точности вашего доверия. Это не то же самое, что «у меня есть доверие, что мой уровень доверия 0.8». Это другая вещь, моё доверие в том, что мой уровень доверия может измениться с 0.5 на 0.7 или 0.2 в ответ на результаты какого-либо испытания, вот о каком доверии я говорю.

Вопрос: Как вы считаете, можно ли попасть в т.н. «кроличью нору» из-за размножающихся доверий, ссылающихся друг на друга?

Аманда Аскелл: Думаю, что моё мнение на скучном философском жаргоне звучит так, что доверие диспозиционально. Я полагаю, что у вас есть доверие к бесконечно многим предположениям. Если я спрошу вас о каком-либо из них, то вы мне всё-таки дадите ответ. В итоге, получается довольно скучный ответ, который на самом деле мог бы звучать так: «Да, кроличья нора действительно существует, но я просто пытаюсь отойти от неё, излагая вам странную историю о довериях».

Вопрос: Немного отойду от темы. Не уверен, что достаточно разбираюсь в данном вопросе, но всё же попробую. Вопрос такой: является ли информация о степени устойчивости результатом, вызванным всеми вашими довериями по теме вопроса? Если нет, то существует ли более скромный способ выявления дополнительной информации об уровне устойчивости?

Аманда Аскелл: Хорошо, давайте проанализируем. Итак, есть ваше доверие к рассматриваемой гипотезе. Давайте представим, что я просто спрашиваю об уровне вашего доверия и сообщаю, что такое-то мероприятие имеет ценность N для каждого рассматриваемого случая. Эти данные не отражают степень устойчивости вашего доверия, поскольку, как вы считаете, она будет корректироваться в ответ на новую информацию. Если вы будете учитывать то, как всё реагирует в ответ на новые обстоятельства по теме вашей гипотезы, то да, это будет включать в себя уровень устойчивости. Итак, всё зависит от вашей, так сказать, системы координат.

Математическое ожидание — среднее значение случайной величины (распределение вероятностей случайной величины) при стремлении количества выборок или количества измерений её к бесконечности. (Википедия) ↩︎
По всей видимости, имеется в виду теория ожидаемой полезности — альтернатива математическому ожиданию, формула, которая может использоваться рациональным игроком при принятии решений в экономической науке, теории игр, теории принятия решений. (Википедия) ↩︎