DeepSeek: Это копия Джевона?
Автор Дуг О’Лафлан через подкаст «Сфальсифицированные знания»,
Одно из моих любимых рыночных высказываний заключается в том, что «повествование следует за ценой». " В случае с DeepSeek это никогда не было правдой. Я подведу итоги высокого уровня DeepSeek и, что важно, обсудю, где мы находимся в цикле вибраций.
Для меня DeepSeek - это весело, потому что он контрастирует с тем, что было буквально месяц назад.
Месяц назад, во времена Неврипса, преобладало мнение о том, что законы масштабирования замедляются.
Поэтому продолжающиеся инвестиции в инфраструктуру ИИ замедлятся, поскольку дополнительные расходы на новое оборудование не оправдают отдачу.
Полуанализ проделал фантастическую работу, объясняя, почему это не так. Как ни странно, обучение с подкреплением и продолжающийся архитектурный прогресс были одними из основных причин. Предварительная подготовка замедляется, и, таким образом, спрос на ГПУ превышается. "
Теперь перейдем к DeepSeek, который выпустил свою модель рассуждения неделю назад, 20 января 2025 года, и v3, их гораздо меньшая модель, 26 декабря 2024 года. Для тех, кто внимательно наблюдает, я считаю, что X был по всей концепции «интеллект слишком дешев, чтобы его измерять», но затем повествование превратилось в более дикое в пятницу и в выходные.
Удивительно то, что оба эти фактора воспринимаются как вредные для расходов на инфраструктуру, но последние опровергают первое. Сейчас алгоритмический прогресс настолько значителен, что нам не нужно будет строить любойновый инфраструктуры. Технологии улучшились, но спрос упал. Реальность, конечно, находится где-то между этими двумя крайностями, потому что они не могут быть точными и не соответствуют спросу на графический процессор. Вы не можете сказать мне, что алгоритмическое улучшение от китайской компании, о котором просил рынок в прошлом квартале, теперь обречено.
Реальность такова, что этот рынок нагревается и ищет повод для чихания. Я ненавижу быть клише и называть мистера Рынка биполярным, но это действительно так. Это всего лишь последняя стена беспокойства для компаний ИИ. Давайте обсудим дебаты быка и медведя, а затем я обсудю, куда, по моему мнению, они идут.
Парадокс Джевонса (Bull Case)
Эта фраза может быть новой для вас, но я думаю, что сегодня день, когда она переходит в основной лексикон. Просто посмотрите на поисковый интерес прямо сейчас. Я считаю, что Кэти из Arkk Invest сделала его популярным, но сегодня это сплочение быков.
Что такое парадокс Джевонса? Это в значительной степени наблюдение, что технологии делают хорошее дешевле; что происходит, так это то, что спрос на хорошее парадоксальным образом увеличивается. Есть несколько примечательных примеров, и мой любимый, конечно, транзисторы. Транзисторы дешевели каждый год в течение 50 лет, и по иронии судьбы, вместо того, чтобы с каждым годом нуждаться в меньшем количестве, мы использовали гораздо больше, даже учитывая сокращение. Если бы цена перелета упала с 1000 до 10 долларов, я бы, наверное, полетел больше.
Подумайте об этом так: Если это дешевле, вы бы использовали больше, что является определением эластичного спроса и хорошим кандидатом на парадокс Джевона.
Теперь давайте используем контекст ИИ. Это WebwalkerQA (это даже не полезная статья), но я смотрел на WebWalkerQA, и они привели пример двух агентных ИИ, которые вместе искали веб-сайты, чтобы предоставить лучшую информацию.
Если стоимость агентов была ниже, зачем останавливаться на двух? Друг заметил, что ваша интеллектуальная кофемашина может заставить миллион Эйнштейнов работать над созданием лучшей чашки кофе каждый день. По мере того, как разведка дешевеет, мы будем бросать больше грубой силы на каждую из ключевых мировых проблем. В мире с значительно более низкими затратами вместо того, чтобы стать более эффективными, мы часто бросаем больше ресурсов на проблему.
Это суть парадокса Джевонса, как бычьего дела, и то, что почти наверняка произойдет. в долгосрочной перспективе. Потребовалось около 16 000 транзисторов, чтобы запустить ракету на Луну. Теперь около 16 000 транзисторов могут работать в любом современном приложении. То, что становится дешевле, используется больше, и по иронии судьбы спрос взрывается.
Поставки превышают спрос и сроки
Есть одна небольшая проблема, о которой я писал в своей недавней статье о циклах капитала. Свинец и время отставания могут создавать изломы, создавая очень радикальные сценарии. Может быть, парадокс Джевона и прав, но вопрос не в том, будем ли мы использовать больше, а в том, что Немного о сроках.
Что произойдет, если дефлятор на 90% лучших моделей значительно перевесит увеличение использования? Существует соответствующее тематическое исследование: DWDM (Dense wavelength-division multiplexing) значительно увеличивает запас волокна. И так, в то время как парадокс Джевонса был на 100% прав в этом случае. В долгосрочной перспективе 97% волокон, уложенных в 2001 году, были неосвещены. Большая часть этого волокна сейчас зажигается, но парадокс Джевонса может быть долгосрочным, а в краткосрочной перспективе компании полностью оторваны от реальности.
Это пример чрезмерного спроса и предложения, который рынок быстро рассматривает. Значение терминала приемлемо для всех участников, но досадный короткий промежуток времени ускользает от нас.
В этом случае медвежий случай заключается в том, что да, Джевонс происходит, но предложение настолько перегружает спрос в краткосрочной перспективе, что быстрое добавление предложения перегружает долгосрочный спрос.
Реальность, вероятно, никогда не будет такой плохой, как боялись, и никогда не будет такой хорошей, как мечтали.
Тайлер Дерден
Свадьба, 01/29/2025 - 18:25