Raspberry Pi анонсировала AI HAT+ 2, плату расширения для запуска генеративных моделей на Pi 5. На странице продукта указана цена $130, отгрузка уже идёт.
На плате стоит нейроускоритель Hailo 10H с заявленной производительностью 40 TOPS при INT4-квантовании. Главное отличие от первого AI HAT+ в том, что здесь распаяно 8 ГБ LPDDR4X-памяти прямо на плате. Модели грузятся в этот пул, а не съедают системную память Pi. На старте поддерживаются Llama 3.2 1B, DeepSeek-R1-Distill 1.5B и несколько вариантов Qwen 1.5B. Обещают добавить модели покрупнее, но когда именно, не уточняют.
Джефф Гирлинг уже погонял плату и выяснил занятную вещь: процессор Pi 5 на большинстве моделей обгоняет Hailo по чистой скорости инференса. Но тут важно понимать задачу. HAT разгружает CPU, чтобы тот мог заниматься другими делами параллельно с генерацией текста. Для робототехники, киосков, встраиваемых систем, где нужен одновременно и инференс, и работа с GPIO, это имеет смысл. Потребление при этом не превышает 3 Вт.
Софт пока сырой. В репозитории Hailo есть примеры, но документация неполная, и с совместимостью под Raspberry Pi OS бывают проблемы. Raspberry Pi обещает, что экосистема быстро дозреет (хотя кто их считал, эти обещания).
Итог: за $130 плюс стоимость самой Pi 5 получаем платформу для прототипирования edge-решений с ИИ. Замену облачному инференсу это не составит.
QUICK FACTS
- Цена: $130
- NPU: Hailo-10H, 40 TOPS (INT4)
- Память на плате: 8 ГБ LPDDR4X
- Модели на старте: LLM на 1–1.5B параметров (Llama 3.2, DeepSeek-R1-Distill, варианты Qwen)
- Потребление: до 3 Вт
- Гарантия производства: до января 2036




