Машинное Обучение

NVIDIA выложила набор инструментов для автопилота и назвала это «моментом ChatGPT»

Модель на 10 миллиардов параметров умеет объяснять, почему приняла то или иное решение за рулём.

Аркадий Степанов
Аркадий СтепановSenior ИИ-редактор
8 января 2026 г.4 мин чтения
Поделиться:
Седан Mercedes в строительной зоне с наложением траектории ИИ

На этой неделе на CES 2026 NVIDIA показала Alpamayo. Это целая экосистема для разработки беспилотников с открытым кодом: модель, симулятор, гигантский датасет. Дженсен Хуанг заявил, что это «момент ChatGPT для физического ИИ». Амбициозно. Посмотрим.

Что за модель

Итак, что конкретно выложили. Alpamayo 1 — это vision-language-action модель на 10 миллиардов параметров. Она принимает видео с нескольких камер и выдаёт траекторию движения. Ничего необычного. Но есть нюанс: модель генерирует то, что в NVIDIA называют «reasoning traces», то есть объяснения на человеческом языке, почему она собирается сделать именно это.

На демо показывали строительную зону. Модель выдаёт что-то вроде: «Смещаюсь влево, чтобы увеличить дистанцию от конусов, которые залезли на полосу». Потом строит траекторию. Объяснимость встроена в архитектуру, а не прикручена сбоку постфактум.

Под капотом — backbone Cosmos-Reason на 8,2 млрд параметров плюс «эксперт по действиям» на 2,3 млрд. Для запуска нужно минимум 24 ГБ видеопамяти. Потребительское железо отпадает, разве что у вас RTX 4090 или что-то мощнее.

Это обещали ещё в декабре

NVIDIA впервые показала наработки на NeurIPS 2025 в декабре. В посте на форуме от 3 декабря анонсировали «первую в мире открытую reasoning VLA-модель промышленного масштаба для мобильности». CES стал полноценным релизом.

Про данные

Датасет Physical AI — пожалуй, интереснее самой модели. 1727 часов вождения в 25 странах, более 2500 городов. Это примерно втрое больше Waymo Open Dataset. Семь камер, LiDAR везде, радар примерно на половине записей.

Главная фишка — географическое разнообразие. Половина данных из США, половина из 24 европейских стран. Целенаправленно собирали edge cases: стройки, странные перекрёстки, нетипичные паттерны трафика. Всё то, на чём традиционные стеки спотыкаются.

310 895 клипов по 20 секунд каждый. Всё на Hugging Face с gated access: нужно запросить разрешение. Критерии одобрения NVIDIA не раскрывает.

AlpaSim

Симуляционная часть — AlpaSim, открытый фреймворк для тестирования моделей в closed-loop сценариях. Архитектура любопытная: микросервисы на gRPC, так что компоненты можно менять, не пересобирая всё с нуля.

Интересная находка — pipeline parallelism. Пока одна сцена рендерится, модель может обрабатывать инференс по другой. Традиционные sequential rollouts тратят кучу GPU-времени на ожидание.

На старте дают около 900 реконструированных сцен из датасета Physical AI. Для валидации продакшн-системы маловато, но чтобы начать — хватит.

Кто уже подписался

В списке заинтересованных: Lucid, JLR, Uber, Berkeley DeepDrive. Кай Штеппер из Lucid назвал это «важным элементом эволюции». Обтекаемо.

С Mercedes конкретнее. Хуанг подтвердил: Mercedes CLA 2025 года выйдет с полным стеком NVIDIA, включая Alpamayo, в первом квартале 2026-го. Запускают как «Level 2+» (все сейчас так называют свои системы помощи водителю, чтобы не отвечать за «настоящую» автономность юридически).

Бизнес-логика

Есть причина, почему NVIDIA раздаёт это бесплатно. Открой модель и симулятор, подсади разработчиков на CUDA-экосистему, продавай им железо. Классическая платформенная игра.

Если ты не можешь построить собственный стек для беспилотника (а большинство традиционных автопроизводителей не могут), берёшь Alpamayo и запускаешь на чипах NVIDIA. Веса модели открыты. Скрипты для инференса открыты. Но оптимальная производительность требует железа NVIDIA. Удобно.

Регуляторный аспект тоже важен. Чёрные ящики нервируют регуляторов. Chain-of-thought reasoning с объяснением решений — это именно то, что хотят видеть NHTSA и комплаенс-команды по EU AI Act. Reasoning traces — не просто исследовательская любопытность, а фича для прохождения сертификации.

Чего не хватает

Модель позиционируют как «учительскую», а не для продакшна напрямую. Предполагается, что вы дообучите её и дистиллируете в меньшие версии для реальных машин. Насколько при этом падает качество, NVIDIA не говорит.

10 миллиардов параметров по нынешним меркам — немного. DeepSeek-V3 — 671 млрд. GPT-4, предположительно, ещё больше. Хватит ли 10 млрд для длинного хвоста сценариев на дороге — открытый вопрос.

Датасет, несмотря на размер, географически ограничен. Нет Китая, нет Японии, нет Юго-Восточной Азии. Если строите для этих рынков, обучаетесь на данных, которые не отражают местное поведение на дорогах.

На странице Hugging Face указано: минимум 24 ГБ VRAM. Для разработки нормально, но возникают вопросы о целевых платформах. NVIDIA называет DRIVE Orin (254 TOPS) и Thor (1000+ TOPS) как edge-платформы, но реальные цифры по латентности в продакшне не озвучены.

Итого

NVIDIA пытается стать Android-ом автономного вождения: раздавай софт, чтобы продавать кремний. Alpamayo — самый полный открытый тулкит для беспилотников от крупной компании. Reasoning traces реально полезны для регуляторного комплаенса. Датасет действительно большой.

Но это всё ещё исследовательский фундамент, а не продакшн-система. Mercedes с релизом в первом квартале будет первым реальным тестом того, работает ли этот стек в масштабе. Или заявление про «момент ChatGPT» состарится так же плохо, как некоторые прогнозы по срокам появления беспилотников, которые мы слышали раньше.

Аркадий Степанов

Аркадий Степанов

Senior ИИ-редактор

Бывший инженер-программист, ставший техно-журналистом, Аркадий уже пять лет внимательно следит за развитием искусственного интеллекта. Он смотрит на хайп и реальные инновации глазами практика, помогая читателям отличать действительно важное от информационного шума.

Похожие статьи

Будьте впереди в мире ИИ

Получайте последние новости, обзоры и скидки ИИ прямо на почту. Присоединяйтесь к 100 000+ энтузиастов ИИ.

Подписываясь, вы соглашаетесь с нашей Политикой конфиденциальности. Отписаться можно в любое время.