В январе 2024 года Blackstone Group, ведущая частная инвестиционная компания, объявила о создании империи данных искусственного интеллекта стоимостью 25 миллиардов долларов. Несколько месяцев спустя OpenAI и Microsoft последовали за ними, предложив построить Stargate, суперкомпьютер с искусственным интеллектом стоимостью 100 миллиардов долларов, который выведет компанию на передний план революции искусственного интеллекта.
Конечно, это не удивительно. С быстрым развитием искусственного интеллекта за последние несколько лет отраслевые гиганты по всему миру отчаянно стремятся занять первые места. Эксперты уже прогнозируют, что к 2030 году глобальный рынок искусственного интеллекта достигнет 826,7 миллиарда долларов, а ежегодный рост составит 28,46 процента.
Архитектура Von Neumann - это модель дизайна, которая работает на большинстве универсальных компьютеров (состоящих из CPU, памяти, устройств ввода / вывода и системных шин), и, хотя она обеспечивает простоту и межсистемную совместимость, она сама по себе ограничена. Одна системная шина этой архитектуры ограничивает скорость передачи данных между памятью и ЦП, что делает ЦП менее подходящим для искусственного интеллекта и машинного обучения.
Вот где используются графические процессоры (GPU). Используя параллелизм в качестве технологии обработки, GPU обеспечивает улучшенную производительность и независимое выполнение команд через свои многоядерные процессоры. Однако с ростом технологий искусственного интеллекта спрос на GPU резко вырос, а цепочки поставок были напряженными, что создало серьезные узкие места для усилий многих исследователей и стартапов. Это особенно верно, поскольку глобальные поставки GPU поступают только от одного крупного производителя - Nvidia.
В то время как AWS, платформа Google Cloud и другие сверхкрупные розничные продавцы могут легко получить доступ к A100 и H100 от Nvidia, какие жизнеспособные альтернативы могут помочь компаниям, исследователям и стартапам поймать поезд искусственного интеллекта, а не застрять в списке кандидатов Nvidia на неопределенный срок?
Программируемые двери на месте
FPGA - это перепрограммируемая интегральная схема, которая может быть настроена для удовлетворения конкретных задач и потребностей приложений. Они обеспечивают гибкость, позволяют адаптироваться к различным требованиям и являются эффективными с точки зрения затрат. Поскольку FPGA эффективны в параллельной обработке, они идеально подходят для использования искусственного интеллекта / машинного обучения и имеют значительную низкую задержку в реальных приложениях.
Чип Tesla D1 Dojo является интересной реализацией FPGA, которая выпустила чип в 2021 году для обучения моделей компьютерного зрения автономных транспортных средств. Тем не менее, некоторые недостатки FPGA включают в себя высокий инженерный опыт, необходимый для проектирования оборудования, что может привести к дорогостоящим первоначальным затратам на закупку.
AMD GPU
В 2023 году такие компании, как Meta, Oracle и Microsoft, заявили, что они заинтересованы в графических процессорах AMD в качестве более экономичного решения и способа избежать блокировки доминирующей Nvidia потенциальными поставщиками. Например, серия AMD Instinct MI300 считается жизнеспособной альтернативой научным вычислениям и приложениям искусственного интеллекта. Его архитектура Graphics Core Next (GCN) подчеркивает модульность и поддержку открытых стандартов в сочетании с более доступными ценами, что делает его перспективной альтернативой графическим процессорам Nvidia.
тензорный блок
TPU - это специальная интегральная схема (ASIC), запрограммированная для выполнения задач машинного обучения. Как идея Google, TPU полагается на архитектуру в определенной области для запуска нейронных сетей, таких как тензорные вычисления. Они также имеют преимущества энергоэффективности и оптимизации производительности, что делает их экономически выгодной альтернативой расширению и управлению затратами.
Тем не менее, следует отметить, что экосистема TPU все еще находится на подъеме, и текущая доступность ограничена облачной платформой Google.
Децентрализованный рынок
Децентрализованный рынок также пытается ослабить напряжение в цепочке поставок GPU по - своему. Используя неиспользуемые ресурсы GPU в традиционных центрах обработки данных, академических учреждениях и даже частных лицах, эти рынки предоставляют исследователям, стартапам и другим организациям достаточные ресурсы GPU для запуска своих проектов. Примеры включают Render Network, FluxEdge, Bittensor и другие.
Многие из этих рынков предлагают графические процессоры потребительского уровня, которые полностью удовлетворяют потребности малых и средних компаний ИИ / ML, тем самым уменьшая нагрузку на высококачественные профессиональные графические процессоры. Некоторые рынки также предлагают дополнительные варианты для клиентов, которые также хотят промышленных GPU.
ЦП
Процессоры часто считаются неудачниками искусственного интеллекта из - за их ограниченной пропускной способности и узких мест фон Неймана. Тем не менее, в настоящее время предпринимаются усилия, чтобы выяснить, как запустить более эффективные алгоритмы искусственного интеллекта на CPU. Это включает в себя распределение определенных рабочих нагрузок на процессор, таких как простые модели NLP и алгоритмы, которые выполняют сложные статистические вычисления.
Хотя это не может быть универсальным решением, он идеально подходит для алгоритмов, которые трудно работать параллельно, таких как рекурсивные нейронные сети или системы рекомендаций для обучения и рассуждений.
Округление
Дефицит графических процессоров искусственного интеллекта может не исчезнуть в ближайшее время, но есть одна хорошая новость. Непрерывные инновации в технологии чипов искусственного интеллекта доказывают захватывающее будущее, полное возможностей, которые однажды обеспечат постепенное исчезновение проблем с GPU. Многое еще предстоит раскрыть в области искусственного интеллекта, и мы, вероятно, стоим на пороге величайшей технологической революции, известной человечеству.