openFuyao: Открытая платформа для управления Kubernetes-кластерами в эпоху «облако + ИИ»
Введение: новый игрок на арене cloud-native
В мае 2025 года на конференции разработчиков Kunpeng & Ascend Developer Conference 2025 было объявлено о запуске openFuyao — открытого сообщества, ориентированного на создание программной экосистемы для разнородных вычислительных кластеров.
openFuyao позиционируется не просто как ещё один дистрибутив Kubernetes, а как целостная платформа, объединяющая принципы cloud-native и AI-native для максимального раскрытия эффективности вычислительных ресурсов. Текущая стабильная версия сообщества — v26.03, выпущенная в апреле 2026 года.
Зачем создавался openFuyao?
Разработчики проекта чётко обозначили ключевые вызовы, на которые призван ответить openFuyao:
1. Фрагментация экосистемы разнородных вычислений
Современные дата-центры всё чаще используют гетерогенные ресурсы: CPU (x86, ARM), GPU, NPU и специализированные ускорители. Традиционные инструменты оркестрации плохо справляются с унифицированным управлением такими ресурсами, что ведёт к «островкам» инфраструктуры и сложностям в эксплуатации.
2. Низкая утилизация вычислительных мощностей
В производственных средах средняя загрузка кластеров часто не превышает 30–40%. Это связано с отсутствием интеллектуальных механизмов планирования, неспособностью эффективно совмещать онлайн- и оффлайн-нагрузки, а также с игнорированием топологии оборудования (например, NUMA-архитектуры).
3. Сложность развёртывания ИИ-инфраструктуры
Развёртывание и масштабирование моделей машинного обучения требует специализированных знаний в области Kubernetes, сетевого взаимодействия, управления памятью и ускорителями. Это создаёт высокий порог входа для команд Data Science и MLOps.
4. Отсутствие стандартизированных решений для сверхмасштабных кластеров
Управление кластерами из 10000+ узлов предъявляет экстремальные требования к производительности планировщика, отказоустойчивости и наблюдаемости. Готовых открытых решений «из коробки» на рынке было недостаточно.
openFuyao создан именно для того, чтобы закрыть эти пробелы через открытую, модульную и расширяемую архитектуру.
Философия openFuyao
Платформа построена по принципу «легковесное ядро + экосистема плагинов». Базовое ядро предоставляет минимально необходимый набор функций для управления контейнеризированными кластерами, а дополнительные возможности подключаются через встроенный маркетплейс приложений. Это позволяет организациям собирать решение под свои задачи без избыточной сложности.
Направления развития
openFuyao сосредотачивается в своём развитии по следующим направлениям:
1. Унифицированное управление разнородными ресурсами — абстракция интерфейсов для CPU, GPU, NPU через механизмы Node Feature Discovery и специализированные операторы (KAE Operator, NPU Operator и т.д.).
2. Интеллектуальное планирование — поддержка NUMA-аффинити, совместного размещения онлайн/оффлайн-нагрузок (colocation), распределённой обработки заданий с учётом топологии оборудования.
3. Масштабируемость до 10000+ узлов — оптимизированный планировщик Kubernetes с поддержкой пакетного создания подов и асинхронных операций.
4. Ускорение ИИ-инференса — интеграция с InferNex, поддержка распределённого KVCache, интеллектуальная маршрутизация запросов, снижение задержки первого токена (TTFT) на 30%.
5. Оптимизация контейнерной среды — «низкошумная» контейнерная основа: значительно снижено потребление памяти компонентами Kubernetes, поддерживается запуск 1000+ подов на одном узле.
6. Сквозная наблюдаемость — расширенные метрики, логирование, трассировка и алертинг, адаптированные под ИИ- и Big Data-сценарии.
Практические преимущества
Упрощение развёртывания и обновления
Установщик openFuyao поддерживает как онлайн-, так и оффлайн-режимы, автоматизирует инициализацию управляющего узла и подключение рабочих нод. Веб-интерфейс предоставляет визуальный контроль над состоянием кластера, что снижает зависимость от CLI.
Единая точка управления для гетерогенных сред
Администратор может управлять кластерами на разных архитектурах (x86, ARM), с разными типами ускорителей, через единый API и консоль. Это устраняет необходимость в разрозненных инструментах под каждый тип оборудования.
Интеллектуальная оптимизация ресурсов
Благодаря NUMA-aware scheduling и colocation-планированию, система автоматически размещает поды с учётом топологии памяти и процессора, что повышает общую утилизацию CPU. Администратору не требуется вручную настраивать affinity-правила.
Готовые шаблоны для ИИ-нагрузок
Для развёртывания моделей достаточно выбрать соответствующий компонент в маркетплейсе, указать параметры ресурсов и модель — платформа сама настроит операторы, выделит ускорители и обеспечит мониторинг. Это сокращает время подготовки среды с дней до часов.
Расширенная наблюдаемость «из коробки»
Встроенные дашборды отображают не только стандартные метрики Kubernetes, но и специализированные: загрузку NPU, эффективность кэширования KVCache, задержки инференса. Это позволяет быстро диагностировать узкие места в ИИ-пайплайнах.
Безопасность и соответствие требованиям
Платформа поддерживает ролевую модель доступа, аудит действий, шифрование данных в покое и при передаче. Интеграция с внешними системами IAM позволяет вписать openFuyao в существующие корпоративные политики безопасности.
Успешные внедрения
Несмотря на молодость продукта, он уже имеет ряд внедрений в китайских компаниях, с подробностями этих внедрений можно ознакомится по ссылке. Вкратце можно сказать, что openFuyao помогает реализовать унифицированный подход к управлению приложениями и ресурсами в мультиархитектурных (aarch64 и x86_64) инфраструктурах и используется для повышения эффективности при сборке и обучении больших ИИ моделей.
Где почитать?
Всё отлично, а где же можно самому ознакомится с информацией по данному продукту и полистать документацию?
Вся основная документация и исходный код тут:
Перспективы развития
Насколько удалось понять, развитие openFuyao в данный момент сфокусировано на трёх стратегических направлениях:
1. Лёгкость и модульность
Планируется дальнейшая минимизация базового образа, вынос необязательных компонентов в отдельные пакеты, улучшение механизмов динамической подгрузки плагинов. Цель — сделать платформу пригодной для использования даже на периферийных устройствах с ограниченными ресурсами.
2. Интеллектуализация управления
Развитие AI-driven механизмов планирования: прогнозирование нагрузки, автоматическая корректировка политик масштабирования, рекомендательные системы по оптимизации конфигураций. Уже в версии v26.03 заложены основы для принятия решений на основе телеметрии в реальном времени.
3. Расширение сценарной поддержки
Сообщество активно работает над добавлением новых референсных реализаций: для edge-вычислений, для гибридных мультиклауд-сред, для высокопроизводительных вычислений (HPC). Особый акцент делается на совместимость с отечественными и международными стандартами облачных интерфейсов.
Команда openFuyao придерживается принципа «открытой разработки», и детали реализации обсуждаются в рамках соответствующих SIG (Special Interest Groups) на GitCode.
Для кого актуален openFuyao
openFuyao представляет собой зрелое, производственно-ориентированное решение для организаций, которые:
— Эксплуатируют или планируют внедрять гетерогенные вычислительные инфраструктуры;
— Развивают ИИ- и Big Data-направления и нуждаются в специализированной оркестрации;
— Сталкиваются с проблемами низкой утилизации ресурсов и высокой операционной сложности;
— Ищут открытую альтернативу проприетарным платформам управления кластерами.
Проект сочетает в себе надёжность Kubernetes-основы, инновации в области интеллектуального планирования и практическую ориентированность на реальные производственные сценарии. Благодаря открытой модели развития и активному сообществу, openFuyao имеет все шансы стать одним из стандартов де-факто для управления разнородными кластерами в эпоху повсеместного внедрения ИИ.