Установка Ollama и локальный запуск LLM модели ИИ
В настоящее время технологии генеративного искусственного интеллекта (ИИ или Generative AI) получили широкое распространение и имеется тренд на встраивание их возможностей во многие отрасли нашей жизни, включая информационные технологии, медицину, финансы, производство, автомобилестроение и т.д. Однако, одной из главных проблем, связанных с использованием ИИ, является необходимость обработки огромных объемов данных и требуемых вычислительных ресурсов. Также немаловажным является вопрос простоты использования таких решений для повседневной работы.
Одним из способов решения этой проблемы для практического применения является использование уже предобученных моделей ИИ, которые могут быть запущены на локальных компьютерах или серверах. Такие модели ИИ называются LLM моделями (Large Language Model или большая языковая модель). LLM модель может быть запущена на локальном компьютере или сервере без необходимости использования облачных сервисов. Такой подход позволяет сократить затраты на обработку данных и обеспечить более высокую степень конфиденциальности, что может быть особенно полезно для выполнения задач в условиях ограниченного бюджета.
Проверить возможность применения такого рода решений можно, например, с помощью инструмента Ollama, который позволяет запускать популярные модели такие как Llama 3.3, DeepSeek-R1, Phi-4, Mistral, Gemma 2 и другие без необходимости доступа к сети для своей работы. В рамках этой статьи мы воспользуемся сервером, который располагает GPU картами NVIDIA Tesla V100 и x86_64 совместимой серверной ОС openScaler 24.03 LTS.
Конфигурация тестируемого сервера
Hardware: сервер с 2шт. картами NVIDIA Tesla V100 16 GB, 2шт. CPU Intel Xeon Gold 5118 (2,3 ГГц / 12 ядер), 256 GB RAM DDR4 2666Hz.
Операционная система: openScaler 24.03 LTS.
Подготовка тестовой ОС
Для теста была установлена ОС openScaler 24.03 LTS в минимальной конфигурации (minimal install) с инструментами для разработки (Development tools). Для получения сравнительно производительного решения для работы LLM модели с Ollama потребуется GPU карта, поэтому здесь далее будет описан процесс установки драйвера GPU и CUDA toolkit для работы приложений с их применением.
Установка драйвера и CUDA toolkit
Операционная система openScaler 24.03 LTS является ОС на основе rpm-пакетов. Для теста потребовалось загрузить на сервер последнюю версию CUDA toolkit, которую можно найти по ссылке:
Сам процесс установки:
- Выполнить команду для загрузки run-скрипта для последующей установки CUDA toolkit и драйвера:
wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda_12.8.0_570.86.10_linux.run
- Выполнить скрипт для запуска процесса установки:
sh cuda_12.8.0_570.86.10_linux.run
Потребуется подождать некоторое время, после чего будет запущен инструмент установки в текстовом виде, где сначала потребуется согласится (accept) с End User License Agreement:

Далее на следующем экране потребуется выбрать стрелками клавиатуры Install и продолжить далее:

В конце этого процесса будет выдано:
# sh cuda_12.8.0_570.86.10_linux.run
Installation failed. See log at /var/log/cuda-installer.log for details.
Просмотрев журнал будет понятно, что процесс на этом не завершился с ошибкой, т.к. фактически на этом этапе инсталлятор отключил модуль ядра Nouveau, из-за того, что он будет конфликтовать с драйвером NVIDIA и для вступления изменений в силу требуется перезагрузка сервера.
Прежде чем это сделать выполним установку дополнительного пакета kernel-devel-6.6.0-28.0.0.34.os2403.x86_64 и затем произведем перезагрузку сервера командами ниже:
dnf install kernel-devel-6.6.0-28.0.0.34.os2403.x86_64
reboot
После перезагрузки сервера в случае успешной установки пакета kernel-devel нужно повторно запустить инсталлятор CUDA toolkit:
sh cuda_12.8.0_570.86.10_linux.run
В ходе этого запуска будет повторно предложено принять EULA и потребуется выбрать Install ровно также, как было укзазано в статье выше.
Далее производится установка GPU драйвера и CUDA toolkit и в случае успешного выполнения установку можно считать завершенной.
Пример листинга команды с успешным выполнением run-скрипта по установке компонентов:
[root@fusion148-os2403 ~]# sh cuda_12.8.0_570.86.10_linux.run
===========
= Summary =
===========
Driver: Installed
Toolkit: Installed in /usr/local/cuda-12.8/
Please make sure that
– PATH includes /usr/local/cuda-12.8/bin
– LD_LIBRARY_PATH includes /usr/local/cuda-12.8/lib64, or, add /usr/local/cuda-12.8/lib64 to /etc/ld.so.conf and run ldconfig as root
To uninstall the CUDA Toolkit, run cuda-uninstaller in /usr/local/cuda-12.8/bin
To uninstall the NVIDIA Driver, run nvidia-uninstall
Logfile is /var/log/cuda-installer.log
[root@fusion148-os2403 ~]#
Проверить, что драйвер работает и узнать текущее состояние GPU можно с помощью команды nvidia-smi . Ниже пример выполнения команды:

Установка Ollama
Для локального запуска ИИ моделей нам потребуется такой инструмент как Ollama, который можно свободно загрузить с официального сайта производителя ПО. Процесс установки для ОС семейства Linux довольно прост и для этого потребуется выполнить следующую команду:
curl -fsSL https://ollama.com/install.sh | sh
Если процесс завершается нормально, то результат выполнения будет примерно такой:
[root@fusion148-os2403 ~]# curl -fsSL https://ollama.com/install.sh | sh
>>> Installing ollama to /usr/local
>>> Downloading Linux amd64 bundle
######################################################################## 100.0%
>>> Creating ollama user…
>>> Adding ollama user to render group…
>>> Adding ollama user to video group…
>>> Adding current user to ollama group…
>>> Creating ollama systemd service…
>>> Enabling and starting ollama service…
Created symlink /etc/systemd/system/default.target.wants/ollama.service → /etc/systemd/system/ollama.service.
>>> NVIDIA GPU installed.
[root@fusion148-os2403 ~]#
Как видим, в процессе установки Ollama проверяет, что на сервере доступен GPU. В противном случае будет выдана информация, что запуск будет происходить на CPU и в этом случае модель будет работать существенно медленнее:
WARNING: No NVIDIA/AMD GPU detected. Ollama will run in CPU-only mode.
В нашем же случае сервер располагал 2шт. картами Tesla V100 и далее приведем пример запуска и выполнения пробного запроса для генерации текста с помощью ИИ модели.
Загрузка модели ИИ и выполнение запроса
Для примера мы выбрали одну из популярных моделей DeepSeek-R1-Distill-Qwen-32B и для её загрузки и выполнения нужно выполнить команду:
ollama run deepseek-r1:32b
Начнется загрузка, которая по завершению будет выглядеть примерно следующим образом:
[root@fusion148-os2403 ~]# ollama run deepseek-r1:32b
pulling manifest
pulling 6150cb382311… 100% ▕███████████████████████████▏ 19 GB
pulling 369ca498f347… 100% ▕███████████████████████████ 387 B
pulling 6e4c38e1172f… 100% ▕███████████████████████████▏ 1.1 KB
pulling f4d24e9138dd… 100% ▕███████████████████████████▏ 148 B
pulling c7f3ea903b50… 100% ▕███████████████████████████ 488 B
verifying sha256 digest
writing manifest
success
>>>
Далее уже можно приступить к созданию какого-то собственно запуска запроса для выполнения генерации текста на его основе. Например, такой вариант запроса и его вывод:
>>> Что можно сделать для продвижения товара в рамках нового маркетингового 2025 года?
<think>
Хорошо, пользователь спрашивает, что можно сделать для продвижения товара в рамках нового маркетингового плана на 2025 год. Я должен дать ему подробный и структурированный ответ.
Сначала подумаю о ключевых трендах 2025 года. Скорее всего, важными будут цифровизация и персонализация. Может быть, стоит упомянуть искусственный интеллект и машинное обучение как основные инструменты.
Далее, социальные сети всё ещё будут играть большую роль. Возможно, стоит предложить создание уникального контента для разных платформ и использование микроблогов или историй в Instagram/TikTok.
Важно не забыть о мобильных технологиях, так как все больше людей будут использовать телефоны для покупок. Мобильная оптимизация сайта и приложения – это ключевой момент.
Экологичность сейчас популярна, поэтому стоит подумать о том, чтобы связать продвижение с экологическими ценностями. Может быть, провести акции, связанные с утилизацией или повторным использованием товаров.
Видеоконтент тоже будет важен. Предложить создание видеороликов для YouTube и других платформ, возможно, использование стриминговых технологий.
Прямые продажи через соцсети и мессенджеры – это тоже тренд. Можно предложить интеграцию с WhatsApp Business или Instagram Shopping.
Интерактивные кампании, например виртуальные примерки или аудиогиды с использованием AR и VR, могут привлечь внимание молодежи.
Для лояльных клиентов полезны партнерские программы и системы вознаграждений. Это поможет удерживать текущих клиентов и привлекать новых через их рекомендации.
Интеграция с блокчейном может быть интересной идеей, особенно для повышения доверия покупателей к происхождению товаров.
Умные контракты могут автоматизировать процесс оплаты и доставки, упрощая жизнь клиентам.
Кроме того, важно использовать аналитику данных для постоянного мониторинга кампаний и корректировки стратегии. Это поможет эффективнее расходовать бюджет и достигать целей.
Важно также не забыть о безопасности данных и конфиденциальности, особенно с учетом новых законов, как GDPR. Это укрепит доверие клиентов к компании.
Поддержка локальных сообществ и благотворительные акции могут улучшить репутацию бренда и повысить его популярность в целевой аудитории.
В целом, нужно создать интегрированный подход, объединяющий онлайн и оффлайн каналы, чтобы обеспечить максимальное охват и эффективность.
</think>
Для продвижения товара в рамках нового маркетингового плана на 2025 год можно рассмотреть следующие ключевые стратегии:
### 1. **Использование искусственного интеллекта (AI) и машинного обучения (ML):**
– **Персонализация:** Используйте алгоритмы для создания персонализированных предложений на основе данных о клиентах.
– **Предиктивный анализ:** Анализируйте данные о покупательском поведении, чтобы прогнозировать спрос и оптимизировать маркетинговые кампании.
– **Чат-боты:** Интегрируйте AI-assisstants для взаимодействия с клиентами в режиме реального времени.
### 2. **Социальные сети и контент-маркетинг:**
– **Контент для платформ:** Создавайте уникальный контент (видео, инфографики, истории) для каждой социальной сети.
– **Инfluencer-маркетинг:** Работайте с микроблогерами и ключевыми оппонентами в вашей нише.
– **Совместные проекты:** Партнерство с другими брендами или Influence-рами для расширения аудитории.
### 3. **Мобильные технологии:**
– **Мобильная коммерция (m-commerce):** Оптимизируйте сайт и приложения под мобильные устройства.
– **Уведомления push:** Используйте умные push-уведомления для привлечения клиентов к покупкам.
### 4. **Экологичность и устойчивое развитие:**
– **Сообщение об экологии:** Расскажите о том, как ваш продукт соответствует стандартам устойчивого развития.
– **Акции:** Организуйте акции по повторному использованию или утилизации товаров.
### 5. **Видеоконтент и стриминг:**
– **Видеоролики:** Создавайте короткие, яркие видео для YouTube, TikTok и Instagram.
– **Прямые эфиры:** Используйте прямые трансляции для демонстрации товаров или проведения Q&A с клиентами.
### 6. **Интерактивные кампании:**
– **Виртуальные примерки:** Используйте AR-технологии для виртуальных примерок одежды, обуви и других товаров.
– **Геймификация:** Создавайте игры или интерактивные задания, связанные с вашим продуктом.
### 7. **Прямые продажи (Direct-to-Consumer):**
– **Социальные сети как платформы для продаж:** Используйте Instagram Shopping, Facebook Marketplace и другие возможности для прямых продаж.
– **Мессенджеры:** Интегрируйте функционал продаж через WhatsApp Business или Telegram.
### 8. **Контент-маркетинг и educate marketing:**
– **Образовательные материалы:** Создавайте контент, который помогает клиентам лучше понять ваш продукт (например, мастер-классы, обзоры).
### 9. **Интеграция с блокчейном и умными контрактами:**
– **Прозрачность:** Используйте блокчейн для отслеживания цепочки поставок и повышения доверия клиентов.
– **Умные контракты:** Автоматизируйте процесс оплаты и доставки с использованием blockchain.
### 10. **Аналитика и измерение результатов:**
– **Дашборды:** Используйте инструменты аналитики для мониторинга эффективности кампаний.
– **A/B-тестирование:** Постоянно тестируйте разные версии рекламных объявлений, landing pages и_email рассылок.
### 11. **Лояльность клиентов:**
– **Программы лояльности:** Внедряйте системы наград за повторные покупки.
– **Кастомизация:** Предоставляйте персонализированные предложения и сюрпризы для постоянных клиентов.
### 12. **Благотворительность и корпоративная социальная ответственность (CSR):**
– **Социальные инициативы:** Участвуйте в благотворительных акциях, связанных с вашим продуктом.
– **Поддержка сообществ:** Работайте с локальными сообществами, чтобы укрепить brand reputation.
### 13. **Использование данных и аналитики:**
– **Клиентоориентированный подход:** Используйте данные для создания действительно релевантных предложений.
– **Регулярный анализ:** Постоянно мониторьте эффективность каждой кампании и корректируйте стратегию.
### 14. **Безопасность данных и приватность:**
– **Защита персональных данных:** Обеспечьте безопасность данных клиентов, чтобы укрепить их доверие.
– **Прозрачность:** Расскажите клиентам о том, как вы используете их данные.
### 15. **Интеграция online и offline каналов:**
– ** Omnichannel маркетинг:** Обеспечьте Seamless опыт для клиентов, переходя от онлайн-каналов к offline-активностям и обратно.
– **Физические Stores:** Если у вас есть физические магазины, интегрируйте их с online-каналами (например, Click-and-Collect).
### 16. **Использование AI и машинного обучения:**
– **Персонализация:** Используйте AI для создания персонализированных рекомендаций и предложений.
– **Обработка данных:** Используйте ML для анализа большого количества данных и выявления тенденций.
### 17. **Концентрация на опыте клиента (CX):**
– **Эмпатия:** Ставьте себя на место клиента и задумывайтесь, как сделать его взаимодействие с вами максимально удобным.
– **Фидбек:** Постоянно собирайте обратную связь от клиентов и корректируйте свои действия.
### 18. **Использование социальных сетей:**
– **Органический рост:** Создавайте ценный контент, чтобы привлечь organic traffic.
– **Партнерства с Influencer: Работайте с влиятельными людьми в вашей нише для расширения аудитории.
### 19. **Вовлеченность сотрудников:**
– **Коммуникация:** Обеспечьте open communication внутри команды, чтобы все работали сообща над общими целями.
– **Обучение:** Постоянно обучайте сотрудников новым tool и стратегиям.
### 20. **Регулярное тестирование гипотез:**
– **Иновации:** Не бойтесь экспериментировать с новыми подходами и технологиями.
– **Fail fast:** Быстро оценивайте результаты, чтобы избежать больших потерь.
Эти шаги помогут вам создать эффективную маркетинговую стратегию для продвижения вашего продукта в современном цифровом мире.
>>> Send a message (/? for help)
Как видим выше, установка и использование инструмента Ollama, а также популярной LLM модели довольно просты, а результаты работы ИИ модели и выполенения запроса к ней с помощью Ollama вполне подробные и есть интересные возможности для использования продукта в дальнейшей работе. По результатам успешной установки инструмента Ollama на совместимую серверную ОС openScaler 24.03 LTS можно сделать вывод, что такое решение может быть успешно использовано для решения широкого круга задач и при этом будут задействованы лишь локальные ресурсы сервера, что может быть вполне удобным и достаточным инструментом для большинства пользователей.