openFuyao: Открытая платформа для управления Kubernetes-кластерами в эпоху «облако + ИИ»

Введение: новый игрок на арене cloud-native

В мае 2025 года на конференции разработчиков Kunpeng & Ascend Developer Conference 2025 было объявлено о запуске openFuyao — открытого сообщества, ориентированного на создание программной экосистемы для разнородных вычислительных кластеров.

openFuyao позиционируется не просто как ещё один дистрибутив Kubernetes, а как целостная платформа, объединяющая принципы cloud-native и AI-native для максимального раскрытия эффективности вычислительных ресурсов. Текущая стабильная версия сообщества — v26.03, выпущенная в апреле 2026 года.

Зачем создавался openFuyao?

Разработчики проекта чётко обозначили ключевые вызовы, на которые призван ответить openFuyao:

1. Фрагментация экосистемы разнородных вычислений

Современные дата-центры всё чаще используют гетерогенные ресурсы: CPU (x86, ARM), GPU, NPU и специализированные ускорители. Традиционные инструменты оркестрации плохо справляются с унифицированным управлением такими ресурсами, что ведёт к «островкам» инфраструктуры и сложностям в эксплуатации.

2. Низкая утилизация вычислительных мощностей

В производственных средах средняя загрузка кластеров часто не превышает 30–40%. Это связано с отсутствием интеллектуальных механизмов планирования, неспособностью эффективно совмещать онлайн- и оффлайн-нагрузки, а также с игнорированием топологии оборудования (например, NUMA-архитектуры).

3. Сложность развёртывания ИИ-инфраструктуры

Развёртывание и масштабирование моделей машинного обучения требует специализированных знаний в области Kubernetes, сетевого взаимодействия, управления памятью и ускорителями. Это создаёт высокий порог входа для команд Data Science и MLOps.

4. Отсутствие стандартизированных решений для сверхмасштабных кластеров

Управление кластерами из 10000+ узлов предъявляет экстремальные требования к производительности планировщика, отказоустойчивости и наблюдаемости. Готовых открытых решений «из коробки» на рынке было недостаточно.

openFuyao создан именно для того, чтобы закрыть эти пробелы через открытую, модульную и расширяемую архитектуру.

Философия openFuyao

Платформа построена по принципу «легковесное ядро + экосистема плагинов». Базовое ядро предоставляет минимально необходимый набор функций для управления контейнеризированными кластерами, а дополнительные возможности подключаются через встроенный маркетплейс приложений. Это позволяет организациям собирать решение под свои задачи без избыточной сложности.

Направления развития

openFuyao сосредотачивается в своём развитии по следующим направлениям:

1. Унифицированное управление разнородными ресурсами — абстракция интерфейсов для CPU, GPU, NPU через механизмы Node Feature Discovery и специализированные операторы (KAE Operator, NPU Operator и т.д.).

2. Интеллектуальное планирование — поддержка NUMA-аффинити, совместного размещения онлайн/оффлайн-нагрузок (colocation), распределённой обработки заданий с учётом топологии оборудования.

3. Масштабируемость до 10000+ узлов — оптимизированный планировщик Kubernetes с поддержкой пакетного создания подов и асинхронных операций.

4. Ускорение ИИ-инференса — интеграция с InferNex, поддержка распределённого KVCache, интеллектуальная маршрутизация запросов, снижение задержки первого токена (TTFT) на 30%.

5. Оптимизация контейнерной среды — «низкошумная» контейнерная основа: значительно снижено потребление памяти компонентами Kubernetes, поддерживается запуск 1000+ подов на одном узле.

6. Сквозная наблюдаемость — расширенные метрики, логирование, трассировка и алертинг, адаптированные под ИИ- и Big Data-сценарии.

Практические преимущества

Упрощение развёртывания и обновления

Установщик openFuyao поддерживает как онлайн-, так и оффлайн-режимы, автоматизирует инициализацию управляющего узла и подключение рабочих нод. Веб-интерфейс предоставляет визуальный контроль над состоянием кластера, что снижает зависимость от CLI.

Единая точка управления для гетерогенных сред

Администратор может управлять кластерами на разных архитектурах (x86, ARM), с разными типами ускорителей, через единый API и консоль. Это устраняет необходимость в разрозненных инструментах под каждый тип оборудования.

Интеллектуальная оптимизация ресурсов

Благодаря NUMA-aware scheduling и colocation-планированию, система автоматически размещает поды с учётом топологии памяти и процессора, что повышает общую утилизацию CPU. Администратору не требуется вручную настраивать affinity-правила.

Готовые шаблоны для ИИ-нагрузок

Для развёртывания моделей достаточно выбрать соответствующий компонент в маркетплейсе, указать параметры ресурсов и модель — платформа сама настроит операторы, выделит ускорители и обеспечит мониторинг. Это сокращает время подготовки среды с дней до часов.

Расширенная наблюдаемость «из коробки»

Встроенные дашборды отображают не только стандартные метрики Kubernetes, но и специализированные: загрузку NPU, эффективность кэширования KVCache, задержки инференса. Это позволяет быстро диагностировать узкие места в ИИ-пайплайнах.

Безопасность и соответствие требованиям

Платформа поддерживает ролевую модель доступа, аудит действий, шифрование данных в покое и при передаче. Интеграция с внешними системами IAM позволяет вписать openFuyao в существующие корпоративные политики безопасности.

Успешные внедрения

Несмотря на молодость продукта, он уже имеет ряд внедрений в китайских компаниях, с подробностями этих внедрений можно ознакомится по ссылке. Вкратце можно сказать, что openFuyao помогает реализовать унифицированный подход к управлению приложениями и ресурсами в мультиархитектурных (aarch64 и x86_64) инфраструктурах и используется для повышения эффективности при сборке и обучении больших ИИ моделей.

Где почитать?

Всё отлично, а где же можно самому ознакомится с информацией по данному продукту и полистать документацию?

Вся основная документация и исходный код тут:

https://docs.openfuyao.cn/zh/docs/v26.03/quick_start.html

https://gitcode.com/openFuyao

Перспективы развития

Насколько удалось понять, развитие openFuyao в данный момент сфокусировано на трёх стратегических направлениях:

1. Лёгкость и модульность

Планируется дальнейшая минимизация базового образа, вынос необязательных компонентов в отдельные пакеты, улучшение механизмов динамической подгрузки плагинов. Цель — сделать платформу пригодной для использования даже на периферийных устройствах с ограниченными ресурсами.

2. Интеллектуализация управления

Развитие AI-driven механизмов планирования: прогнозирование нагрузки, автоматическая корректировка политик масштабирования, рекомендательные системы по оптимизации конфигураций. Уже в версии v26.03 заложены основы для принятия решений на основе телеметрии в реальном времени.

3. Расширение сценарной поддержки

Сообщество активно работает над добавлением новых референсных реализаций: для edge-вычислений, для гибридных мультиклауд-сред, для высокопроизводительных вычислений (HPC). Особый акцент делается на совместимость с отечественными и международными стандартами облачных интерфейсов.

Команда openFuyao придерживается принципа «открытой разработки», и детали реализации обсуждаются в рамках соответствующих SIG (Special Interest Groups) на GitCode.

Для кого актуален openFuyao

openFuyao представляет собой зрелое, производственно-ориентированное решение для организаций, которые:

— Эксплуатируют или планируют внедрять гетерогенные вычислительные инфраструктуры;

— Развивают ИИ- и Big Data-направления и нуждаются в специализированной оркестрации;

— Сталкиваются с проблемами низкой утилизации ресурсов и высокой операционной сложности;

— Ищут открытую альтернативу проприетарным платформам управления кластерами.

Проект сочетает в себе надёжность Kubernetes-основы, инновации в области интеллектуального планирования и практическую ориентированность на реальные производственные сценарии. Благодаря открытой модели развития и активному сообществу, openFuyao имеет все шансы стать одним из стандартов де-факто для управления разнородными кластерами в эпоху повсеместного внедрения ИИ.