
В первом акте искусственного интеллекта доминировало обучение больших языковых моделей (LLM). Однако, как и в любом хорошо поставленном спектакле, наступает время для антракта, и затем – для истинного представления: вывода, или, если угодно, инференции. Ожидается, что именно этот этап станет рынком, превосходящим по масштабу первоначальную лихорадку обучения.
Обучение, этакая мускулистая гимнастика для чипов, требует колоссальных вычислительных мощностей. Инференция же, напротив, больше напоминает изящную акробатику – она концентрируется на памяти, требуя не столько грубой силы, сколько филигранной экономии ресурсов, ведь процесс этот, в отличие от обучения, бесконечен, как повторение утреннего кофе.
И вот, Nvidia и Cerebras Systems, словно алхимики, ищут новые способы ускорить этот процесс. Традиционно, графические процессоры (GPU) и другие ускорители оснащались высокоскоростной памятью (HBM). Но оба игрока обратили взор на SRAM (статическую память с произвольным доступом) – память, встроенную непосредственно в чип. Это дерзкий шаг, попытка обмануть физические законы, но, как известно, у всякой дерзости есть своя цена. SRAM, увы, объемна, и возникает неизбежный компромисс между размером чипа, объемом памяти и потребностями дата-центра в электроэнергии и охлаждении.
Посмотрим же, какой из этих полупроводниковых титанов лучше подготовлен к борьбе за лидерство на рынке инференции.
Церебрас: Гигантизм как стратегия
Чтобы обуздать неповоротливость SRAM, Церебрас создает колоссальные чипы размером с пластинку, вмещающие в себя огромное количество вычислительной мощности и памяти. Это, скажем так, подход «чем больше, тем лучше». Однако, как и в случае с любой чрезмерностью, он порождает собственные проблемы. Производство таких чипов – сложнейший процесс, и дефекты неизбежны. В этом и кроется причина монопольного положения Taiwan Semiconductor Manufacturing – компания способна производить сложные чипы с приемлемым уровнем брака, хотя даже для новейших технологий этот уровень составляет около 20%. Когда речь идет о дорогостоящих чипах размером с пластинку, такой процент брака неприемлем. Церебрас решает эту проблему, добавляя избыточные ядра, словно замазывая трещины на фамильном портрете.
Более того, эти чипы требуют специального охлаждения и управления питанием, поэтому Церебрас не продает их по отдельности, а предлагает только полные серверные стойки CS-3. Компания утверждает, что ее системы работают в 15 раз быстрее GPU, но эта скорость достигается ценой непомерно высокой. Это решение для тех, кто готов заплатить любую цену за мгновенный результат, словно заказывая время у самого Хрона.
Nvidia: Экосистемное превосходство
Приобретение Groq за 20 миллиардов долларов позволило Nvidia получить доступ к Language Processing Units (LPUs), разработанным для инференции. LPU также используют SRAM, но, в отличие от чипов Церебрас, они имеют обычные размеры. Компромисс заключается в небольшом объеме SRAM на каждом чипе, что требует их объединения в огромные, сложные кластеры. Это снижает эффективность, но, как говорится, дьявол кроется в деталях.
Чипы Церебрас в шесть раз быстрее, но они негибкие и могут использоваться только для инференции. Nvidia же, напротив, умеет находить компромиссы и адаптироваться к меняющимся условиям. Компания интегрировала LPU в свою программную платформу CUDA и разработала полные серверные системы, использующие как GPU, так и LPU. GPU обрабатывают начальную стадию понимания запроса пользователя, а LPU берут на себя заключительную стадию – формирование ответа. Благодаря использованию памяти SRAM, LPU отвечают практически без задержек, словно телепаты, улавливающие мысли пользователя.
Лучшая акция для инвестиций
Церебрас имеет потенциал перевернуть рынок инференции и уже получила значительные заказы от OpenAI. Однако, акции компании торгуются по непомерно высокой оценке (более 100-кратной прибыли) и должны доказать, что они способны стать чем-то большим, чем нишевым игроком. Это, если угодно, ставка на будущее, полная рисков и обещаний.
Nvidia же уже является признанным лидером в обучении LLM. Приобретение Groq, в свою очередь, выглядит удачным шагом, который поможет компании занять прочные позиции на рынке инференции. Благодаря возможности объединения GPU и LPU в одной серверной системе, компания смогла превратить нишевый продукт в массовый. Таким образом, я считаю, что Nvidia – более надежный выбор для инвестиций. Это, если угодно, ставка на настоящее, подкрепленная опытом и инновациями.
Смотрите также
- ПРОГНОЗ ДОЛЛАРА К ШЕКЕЛЮ
- БИТКОИН ПРОГНОЗ. BTC криптовалюта
- ЭФИРИУМ ПРОГНОЗ. ETH криптовалюта
- ПРОГНОЗ ЕВРО К ШЕКЕЛЮ
- ZEC ПРОГНОЗ. ZEC криптовалюта
- SOL ПРОГНОЗ. SOL криптовалюта
- HYPE ПРОГНОЗ. HYPE криптовалюта
- TON ПРОГНОЗ. TON криптовалюта
- MYX ПРОГНОЗ. MYX криптовалюта
- SIREN ПРОГНОЗ. SIREN криптовалюта
2026-05-31 18:52