Качество данных не ограничено

dailyblitz.de 1 неделя назад

Качество данных не ограничено

Питер Чир из Academy Securities

Дважды блаженный;
Он благословляет того, кто дает, и того, кто берет.

Пожалуйста, простите шекспировскую снисходительность, но я в Ватерлоо, в Веллингтоне, недалеко от шекспировского фестиваля в Стратфорде на Эйвоне.

Но, наконец, буквально все говорят о давней теме в T-Reports - нам нужны высококачественные данные для принятия правильных решений.

Я потерял счет количеству раз, когда я писал или произносил слова «мусор в мусоре», но это реальная проблема с последствиями в реальном мире.

Мы не смогли много говорить о рабочих местах во вторник в интервью Bloomberg TV, но мы действительно поговорили о балансирующем акте тарифов против национального производства для национальной безопасности и о важности удара по Ирану для отношений США с нашими союзниками.

Хотя сегодня мы не будем концентрироваться на этом, решения суда о законности существующих тарифов могут повлиять на рынки.

Наша группа геополитической разведки подготовила доклад о том, что США перемещают две атомные подводные лодки, что напугало рынки, но является еще одним примером некоторых шагов, которые, хотя и потенциально опасны, необходимы для восстановления сдерживания и построения мира через силу.

3 июля «Альтернативная реальность»

Представьте, что 3 июля у нас был июньский заголовок NFP о 14 000 рабочих мест вместо 147 000.

Давайте представим себе, что число Мэй составило 19 тысяч, а не то, о чем сообщалось в то время.
Это легко, если вы попытаетесь, так как ADP был -23k и 29k соответственно (почему рынки и ФРС постоянно игнорируют ADP за пределами меня, но это аргумент для другого дня).

Если бы у нас были эти данные о рабочих местах, был бы этот FOMC другим?

Может быть, мы не получили бы сокращения, но почему, черт возьми, нет? У нас было 2 инакомыслия. С этим No Silver Lining Jobs Data, было бы много давления, чтобы сократить. Уровень безработицы, который не был плохим, в значительной степени стабилен, потому что с апреля уровень участия в рабочей силе снизился на 0,4%.

Конечно, мой полет из Лондона был бы более приятным, так как данные были бы еще хуже, чем мои и без того пессимистические взгляды, и казначейские облигации могли бы продолжить свою сильную работу. Не только наше мнение пострадало от данных, которые сейчас выглядят очень неправильно. В июльской печати, если память служит, только у 1 экономиста была оценка, которая была выше. Теперь, оглядываясь назад, кажется, что каждая оценка была выше фактического числа (хотя в среднем ближе к первоначальному отпечатку).

Реальное влияние неточных данных проблематично (и давайте будем честными, поскольку все, что мы знаем, данные этого месяца будут пересмотрены выше в следующем месяце, что не меняет аргумент о том, что Garbage In, Garbage Out должен быть решен).

Это не только данные о работе

Мы часто приводим обоснованные аргументы (некоторые говорят, что это риторика) в отношении неправильных данных по инфляции. Эквивалентная арендная плата владельцев чревата проблемами, включая значительное время задержки. Мы утверждали, что страна голосовала на основе инфляции, которую они видели в реальном мире, а не расчетной инфляции (которая казалась низкой по многим вещам, таким как расходы на медицинское страхование). Многие смотрят на такие вещи, как Truflation, чтобы получить потенциально более точную информацию в режиме реального времени (хотя не уверены, что она приносит пользу, если политики этого не делают).

Данные о рабочих местах привлекли всеобщее внимание, пришло время обратиться к данным по всем направлениям.

Давайте не будем забывать, что мы живем в мире электроники и искусственного интеллекта, который должен помочь нам получить лучшие ответы.

Две проблемы

Проблема с коллекцией.

  • Показатели ответов на опросы. Первоначальный уровень ответов на опрос в прошлом году составлял от 25% до 35%. До 2020 года первоначальный уровень ответов составлял в среднем около 70%. Сейчас мы получаем меньше половины первоначальных ответов, чем раньше, и это кажется проблематичным.
    • При окончательном пересмотре частота ответов обычно превышает 90%, даже приближаясь к 98%. Может, нам стоит перестать притворяться, что NFP своевременна?? Если после первоначальной публикации мы получим гораздо больше респондентов, неудивительно, что данные повсюду.
  • Проблемы со сбором данных возникают практически в любой серии. Это часть жизни в реальном мире, но как мы решаем эти проблемы и пытаемся их минимизировать?

Проблема сезонной корректировки.

  • Даже если базовые данные были совершенно точными (это не так), мы переходим к «сезонным корректировкам». " Мы «любим» скорректированные данные, поскольку они предоставляют «мягкие» данные. Очевидно, мы не смогли справиться с тем, что количество рабочих мест, скорректированных не по сезону, за последние четыре месяца составило 1,07 млн, +360 тыс, +703 тыс и +825 тыс (честно говоря, я не знаю, были ли они скорректированы или нет с помощью пересмотров, но это фактические данные о рабочих местах).
    • Есть ли основания полагать, что BLS (или кто-либо другой) имеет «лучшую» методологию сезонной корректировки?? Я думаю, что нет, так как я хотел бы видеть как можно больше различных оценок.

Итак, у нас есть все эти невероятно умные, хорошо обеспеченные ресурсами экономисты, пытающиеся сделать 1 из 2 вещей:

  • Определите в меру своих возможностей количество созданных рабочих мест.
  • Угадайте, какие числа рабочих мест будут рассчитаны BLS, а затем угадайте, какие будут корректировки. В той мере, в какой это распространено, это уменьшает импульс к изменению существующих официальных методологий.

Хотя «похожие» две вещи очень разные.

Во-первых, это действительно действенное упражнение в установлении того, где находится экономика, и предоставлении данных для принятия правильных решений. Несмотря на это, несколько бесполезно, если вам никто не верит и просто тяготеет к официально опубликованным данным.

Второе – это то, что делает карьеру. Bloomberg сообщает аналитиков, которые являются наиболее «точными». Не точные с точки зрения того, на что приходят окончательные данные, но при прогнозировании псевдослучайного числа, которое выходит в первую пятницу месяца (или другие даты, для других серий данных).

Моя ставка тяготеет к усилиям экономистов, пытающихся предсказать фактическое состояние экономики. (Хотя я не уверен, является ли это целью многих, или пытаюсь угадать, что NFP является целью, которая похожа, но отличается).

Пища для размышлений о решениях

Достаточно разглагольствовать и пересказывать старые аргументы. Давайте рассмотрим некоторые потенциальные решения или, по крайней мере, некоторые идеи, которые, по нашему мнению, заслуживают обсуждения.

Получение максимально точных, своевременных данных.

Каждый год наши работодатели отправляют Налоговому управлению США наши налоговые формы, которые включают наш доход и наше социальное обеспечение, поэтому Налоговое управление США может связать все наши доходы от занятости вместе. W2 и 1099 должны охватывать значительную часть рабочей силы. Возможно, я ошибаюсь, но я ожидаю, что W2s и 1099s покроют большой процент легальной, документированной рабочей силы. Он пропускает платежи под столом, все наличные рабочие места и, вероятно, некоторые рабочие места индивидуального предпринимателя, но практически все, кого я знаю, получают по крайней мере 1 зарплату в месяц (некоторые еженедельно или раз в две недели).

Итак, как насчет «поощрения» компаний предоставлять эту информацию каждый месяц?

  • Проблемы с конфиденциальностью? Конечно, но федеральное правительство (IRS) и, вероятно, ваш штат со временем получат эту информацию. Действительно ли важно знать ваши ежемесячные данные в дополнение к годовым? Конечно, моя первоначальная реакция заключается в том, что это кажется отрывочным, но так ли это на самом деле? Конечно, некоторая информация может быть «отредактирована», чтобы люди не выделялись (хотя SSN все равно, вероятно, потребуется сопоставить ее, чтобы определить тех, кто работает на нескольких работах). 1099s могут представлять собой некоторые аналогичные проблемы (по SSN или EIN), но, по-видимому, это должно быть "выполнимо". "
  • Что значит «поощрять»? Возможно снижение некоторых налогов на заработную плату. Может быть, даже небольшая скидка компании и/или сотруднику. Это будет стоить немного денег? Да, но будет ли это стоить больше или меньше, чем жить с данными, которые настолько ненадежны, что это приводит к плохим решениям на политическом, корпоративном и даже индивидуальном уровне? Сбор данных в любой форме, как правило, сопряжен с расходами, но было бы интересно сделать что-то для поощрения (или предоставления) своевременных данных.

Представьте себе мир, в котором 20 числа каждого месяца (только для того, чтобы выбрать дату) любой, кто сокращает проверки, которые будут отображаться в отчетах W2 или 1099, отправляет (в том же формате) информацию в область сбора данных (вероятно, с участием IRS, поскольку они уже имеют право на эту информацию на ежегодной основе).

Эти данные объединены в алгоритм, который затем приводит к изменениям в занятости.

Нам не хватает некоторых частей экономики? Конечно. Без сомнения. Но будет ли у нас высокоточная информация о подавляющем большинстве экономики? Вероятно. Эта часть отчета о работе может быть опубликована как таковая. Тогда мы все можем попытаться провести время, выясняя, что происходит в той части экономики, которая не захвачена.

Опять же, я не выступаю за отказ от нашей конфиденциальности, но реальность такова, что информация поступает в правительство, просто не в этом организованном или частом подходе. Я предполагаю, что компании или компании по начислению заработной платы могут закодировать этот дополнительный шаг в течение нескольких недель. Да, возможно, я упускаю много юридических вопросов, но может ли это быть хуже, чем опрос?

Хотелось бы также посмотреть на «короткий» анализ. Что мне нравится в Case-Schiller, так это то, что он отслеживает множество домов, а не каждый дом. Фактически существует «контрольная» группа. Для инфляции заработной платы было бы здорово увидеть данные по когорте. Отслеживайте заработную плату конкретного человека с течением времени. Когда мы думаем об инфляции заработной платы, мы думаем о том, что люди получают с течением времени. Такая методология имитирует это. Это также потенциально может быть сделано с помощью скобки доходов (теперь это может зайти слишком далеко, но просто выбросить его туда). То, что мы сейчас получаем в среднем почасовой заработок, - это изменение всего пула работников. Но если кто-то уйдет на пенсию и будет заменен новым сотрудником с гораздо более низкой заработной платой, текущая методология, скорее всего, приведет к более низкой инфляции заработной платы, чем есть на самом деле. Отслеживание когортами с течением времени может дать лучшее представление о давлении на заработную плату, чем существующие методологии. Это эффект второго порядка, но почему бы не попытаться сделать действительно надежный отчет?

Открытый исходный код сезонности. Давайте опубликуем как нескорректированное число (как бы летучим оно ни было), так и скорректированное число и алгоритм, используемый для этой корректировки. Тогда самые яркие или любопытные умы могут попытаться улучшить его. В наши дни я бы не стал спорить с группой детей в колледже, играющих с методологией и выясняющих улучшения, особенно если бы мы сократили круг вопросов, связанных со сбором данных.

Независимо от того, имеют ли эти идеи какой-либо смысл, должны быть сделаны некоторые простые шаги.

  • Выявление и внедрение способов снижения предела погрешности на широких участках рабочей силы. Больше данных, которые могут быть собраны очень точно, означает, что мы меньше беспокоимся о данных, которые не рассчитаны так точно.
    • Затем сосредоточьтесь на способах уменьшения ошибок в данных, которые не так точно собраны.
    • Параллельно работайте над тем, чтобы обеспечить реалистичность и актуальность корректировок с текущей экономикой (большой сдвиг в рабочих местах, таких как ИИ и данные), или экономикой GIG, или региональными предпочтениями в отношении того, где люди живут и работают, изменилась). Адаптация и уточнение.

Наконец, и это может показаться странным, прекратите притворяться, что данные точны до n-й степени.

Представьте себе, что у вас есть только дворовая палка без измерений, отмеченных между ними. Затем его попросили использовать этот критерий для измерения большого расстояния над холмистым скалистым полем. Вы берете этот критерий и, насколько это возможно, переворачиваете его снова и снова, подсчитывая количество переворачиваний, пока не пройдете через поле.

Затем вы приходите с ответом 3423 ярда и 12 дюймов. Изложенная методология не может произвести что-то с такой степенью точности. Возможно, вы могли бы сказать, что с учетом рельефа, проскальзывания и т. д., мы оцениваем от 3400 до 3500 ярдов, что не так удовлетворяет, как 3423 ярда и 12 дюймов, но дает более точную оценку ситуации. Значимые цифры существуют в науке не просто так, чтобы не создавать восприятие большей точности, чем есть на самом деле. Возможно, больше наших экономических данных должны включать эту концепцию?

Может быть, нам нужна предупредительная записка вместе с данными?

В наши дни мы получаем предупреждения практически обо всем. Объекты в зеркале могут быть ближе, чем кажутся. Не есть полностью приготовленную пищу. Вы поняли идею.

Предупреждающий знак должен быть:

Перед использованием этих данных предел погрешности составляет 136 000 для опроса. Да, предел погрешности в некоторых случаях больше, чем фактическое число, о котором мы сообщаем. Пожалуйста, полагайтесь на эти данные на свой страх и риск, поскольку они могут быть или не быть точными, могут быть изменены несколько раз в ближайшие месяцы и снова в ежегодных изменениях. Если вы считаете, что это большая погрешность, то мы предупреждаем вас даже не думать о погрешности в опросе домохозяйств. Технические заметки BLS.

Нижняя линия

Я не считаю, что BLS намеренно делает что-то не так в любом направлении, но я считаю, что в эпоху, когда так много данных плавает в электронном виде и возможность применить к этому хардкорную вычислительную мощность, мы должны изобретать наши инструменты сбора и публикации данных в максимально возможной степени (я бы включил инфляцию и другие важные показатели в этот проект).

Мне не нравится идея «стрелять по мессенджеру», поскольку это не создает цели истинной интеллектуальной честности в разработке новых и лучших инструментов.

Мусор внутри, Мусор Мы больше не должны быть приемлемыми, и мы должны быть в состоянии заручиться волей и ресурсами для смягчения этого риска.

Заканчивай, и удачных выходных!

Тайлер Дерден
Солнце, 08/03/2025 - 21:00

Читать всю статью