Вы читаете полную книгу Думай «почему?». Причина и следствие как ключ к мышлению Джудиа Перл онлайн (текущая страница 225)

Последние комментарии

Отрицательный рейтинг

Классная книжка, честно. Александр Мазин мастерски ведет сюжет, главный герой растет на моих глаз...

Ты меня заворожил

Книга оказалась классной, хороший детектив, порадовало, как автор выписывает психологию персонаже...

Мы вынуждены сообщить вам, что завтра нас и нашу семью убьют. Истории из Руанды

Сразу честно скажу, впечатлительным к этой книге лучше не подходить. Помню, как закрыла первую гл...

Территория

Роман начинает раскачиваться медленно, но стоит пройти пару глав, и я уже сидела как приклеенная....

Ордо Ксенос

прикольно, когда то давно играл, пожалуй тоже попробую почитать

Падший

Осилил третью книгу Падший и понял, что она заметно слабее своих предшественниц. Корнев почему-то...

Ордо Ксенос

Зло прорастает в поступках, а не в сухих сведениях… С этой мыслью я и взял в руки свою первую кни...

Оглянись в темноте. Книга 2

Книга для своего жанра реально интересная, захватывает

Будешь моей, Должница

Прямое попадание в мое сердечко. у меня есть слабость к этим богатым мальчикам, которые вдруг ока...

Возвышение Хоруса

За Императора!

РазноеДумай «почему?». Причина и следствие как ключ к мышлениюстр 225

Светлый фон

Я никогда не был согласен с представлением Холланда об отсутствующих данных в табл. 12 как о «фундаментальной проблеме», возможно, потому, что я редко представлял проблемы причинности в виде таблицы. Но если подойти к делу фундаментально, становится понятно, что его подход чреват огромными заблуждениями, что мы вскоре увидим. Обратите внимание, что, помимо декоративных заголовков последних трех столбцов, табл. 12 полностью лишена каузальной информации о ED, EX и S, например о том, влияет образование на заработную плату или наоборот. Хуже того, она не позволяет нам представлять такую информацию, даже когда она доступна. Но статистикам, которые видят фундаментальную проблему в отсутствии данных, такая таблица, кажется, открывает безграничные возможности. Действительно, если смотреть на S₀, S₁ и S₂ не как на потенциальные результаты, а как на обычные переменные, у нас есть десятки методов интерполяции для заполнения пробелов или, как сказали бы статистики, условного расчета недостающих данных некоторым оптимальным образом.

ED, EX S S S S

Таблица 12. Вымышленные данные для примера с потенциальными результатами

Один из распространенных подходов — сопоставление. Мы ищем пары людей, которые хорошо совпадают по всем переменным, кроме интересующей нас, а затем заполняем их строки, чтобы они соответствовали друг другу. Явный пример здесь — случай Берта и Кэролайн, которые идеально совпадают по стажу. Мы предполагаем, что, если бы у Берта была магистерская степень, он получал бы столько же, сколько Кэролайн (97,0 тысяч долларов), а если бы у Кэролайн была только степень бакалавра, она получал бы, как Берт (92,5 тысяч долларов). Обратите внимание, что сопоставление подразумевает ту же идею, что и ограничение по какому-то фактору (или расслоение): мы выбираем для группы, которые разделяют наблюдаемую характеристику, и используем сравнение, чтобы сделать вывод о характеристиках, которые у них, похоже, не совпадают.

Зарплату Элис трудно оценить таким образом, потому что в данных, которые я привел, для нее нет совпадения. Тем не менее статистики разработали весьма тонкие методы, чтобы сделать условный расчет на основе приблизительных совпадений, и Рубин был одним из пионеров этого подхода. К сожалению, даже самые одаренные его представители не могут превратить данные в потенциальные результаты — даже приблизительно. Ниже я покажу, что правильный ответ принципиально зависит от того, влияет образование на опыт или наоборот, о чем в таблице нет никакой информации.

Второй возможный метод — это линейная регрессия (не путать со структурными уравнениями). В этом подходе мы делаем вид, что данные пришли из какого-то неизвестного случайного источника, и используем стандартные статистические методы, чтобы найти линию (или в данном случае плоскость), которая наилучшим образом соответствует данным. Результатом такого подхода выступает уравнение, которое выглядит следующим образом: