Нвидеа и Церебрас: Искушение Быстродействия

В первом акте искусственного интеллекта доминировало обучение больших языковых моделей (LLM). Однако, как и в любом хорошо поставленном спектакле, наступает время для антракта, и затем – для истинного представления: вывода, или, если угодно, инференции. Ожидается, что именно этот этап станет рынком, превосходящим по масштабу первоначальную лихорадку обучения.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Телеграм канал

Обучение, этакая мускулистая гимнастика для чипов, требует колоссальных вычислительных мощностей. Инференция же, напротив, больше напоминает изящную акробатику – она концентрируется на памяти, требуя не столько грубой силы, сколько филигранной экономии ресурсов, ведь процесс этот, в отличие от обучения, бесконечен, как повторение утреннего кофе.

И вот, Nvidia и Cerebras Systems, словно алхимики, ищут новые способы ускорить этот процесс. Традиционно, графические процессоры (GPU) и другие ускорители оснащались высокоскоростной памятью (HBM). Но оба игрока обратили взор на SRAM (статическую память с произвольным доступом) – память, встроенную непосредственно в чип. Это дерзкий шаг, попытка обмануть физические законы, но, как известно, у всякой дерзости есть своя цена. SRAM, увы, объемна, и возникает неизбежный компромисс между размером чипа, объемом памяти и потребностями дата-центра в электроэнергии и охлаждении.

Посмотрим же, какой из этих полупроводниковых титанов лучше подготовлен к борьбе за лидерство на рынке инференции.

Церебрас: Гигантизм как стратегия

Чтобы обуздать неповоротливость SRAM, Церебрас создает колоссальные чипы размером с пластинку, вмещающие в себя огромное количество вычислительной мощности и памяти. Это, скажем так, подход «чем больше, тем лучше». Однако, как и в случае с любой чрезмерностью, он порождает собственные проблемы. Производство таких чипов – сложнейший процесс, и дефекты неизбежны. В этом и кроется причина монопольного положения Taiwan Semiconductor Manufacturing – компания способна производить сложные чипы с приемлемым уровнем брака, хотя даже для новейших технологий этот уровень составляет около 20%. Когда речь идет о дорогостоящих чипах размером с пластинку, такой процент брака неприемлем. Церебрас решает эту проблему, добавляя избыточные ядра, словно замазывая трещины на фамильном портрете.

Более того, эти чипы требуют специального охлаждения и управления питанием, поэтому Церебрас не продает их по отдельности, а предлагает только полные серверные стойки CS-3. Компания утверждает, что ее системы работают в 15 раз быстрее GPU, но эта скорость достигается ценой непомерно высокой. Это решение для тех, кто готов заплатить любую цену за мгновенный результат, словно заказывая время у самого Хрона.

Nvidia: Экосистемное превосходство

Приобретение Groq за 20 миллиардов долларов позволило Nvidia получить доступ к Language Processing Units (LPUs), разработанным для инференции. LPU также используют SRAM, но, в отличие от чипов Церебрас, они имеют обычные размеры. Компромисс заключается в небольшом объеме SRAM на каждом чипе, что требует их объединения в огромные, сложные кластеры. Это снижает эффективность, но, как говорится, дьявол кроется в деталях.

Чипы Церебрас в шесть раз быстрее, но они негибкие и могут использоваться только для инференции. Nvidia же, напротив, умеет находить компромиссы и адаптироваться к меняющимся условиям. Компания интегрировала LPU в свою программную платформу CUDA и разработала полные серверные системы, использующие как GPU, так и LPU. GPU обрабатывают начальную стадию понимания запроса пользователя, а LPU берут на себя заключительную стадию – формирование ответа. Благодаря использованию памяти SRAM, LPU отвечают практически без задержек, словно телепаты, улавливающие мысли пользователя.

Лучшая акция для инвестиций

Церебрас имеет потенциал перевернуть рынок инференции и уже получила значительные заказы от OpenAI. Однако, акции компании торгуются по непомерно высокой оценке (более 100-кратной прибыли) и должны доказать, что они способны стать чем-то большим, чем нишевым игроком. Это, если угодно, ставка на будущее, полная рисков и обещаний.

Nvidia же уже является признанным лидером в обучении LLM. Приобретение Groq, в свою очередь, выглядит удачным шагом, который поможет компании занять прочные позиции на рынке инференции. Благодаря возможности объединения GPU и LPU в одной серверной системе, компания смогла превратить нишевый продукт в массовый. Таким образом, я считаю, что Nvidia – более надежный выбор для инвестиций. Это, если угодно, ставка на настоящее, подкрепленная опытом и инновациями.

Смотрите также

2026-05-31 18:52