Установка KUMA версии от 2.1.Х с отказоустойчивым ядром

Отказоустойчивость KUMA обеспечивается путем внедрения ядра KUMA в кластер Kubernetes, развернутый установщиком KUMA. В качестве распределённого блочного хранилища для кластера используется Longhorn. Схема:

Для установки KUMA в отказоустойчивом исполнении используется установщик kuma-ansible-installer-ha-2.1. X.tar.gz. Конфигурация кластера Kubernetes задается в файле инвентаря k0s.inventory.yml.

Порты доступа для кластера ядра

Трафик KUMA core в отказоустойчивой конфигурации (трафик, в котором и источником и получателем выступают внешние сервисы KUMA здесь не рассматривается) В таблице указаны инициатор соединения (источник) и назначение. Номер порта на инициаторе может быть динамическим. Обратный трафик в рамках установленного соединения не должен блокироваться Источник Назначение Порт назначения Тип Внешние сервисы KUMA Балансировщик нагрузки 7209 tcp Внешние сервисы KUMA Балансировщик нагрузки 7210 tcp Внешние сервисы KUMA Балансировщик нагрузки 7220 tcp Внешние сервисы KUMA Балансировщик нагрузки 7222 tcp Внешние сервисы KUMA Балансировщик нагрузки 7223 tcp Рабочий узел Балансировщик нагрузки 6443 tcp Рабочий узел Балансировщик нагрузки 8132 tcp Управляющий узел Балансировщик нагрузки 6443 tcp Управляющий узел Балансировщик нагрузки 8132 tcp Управляющий узел Балансировщик нагрузки 9443 tcp Рабочий узел Внешние сервисы KUMA в зависимости от настроек при создании сервиса tcp Балансировщик нагрузки Рабочий узел 7209 tcp Балансировщик нагрузки Рабочий узел 7210 tcp Балансировщик нагрузки Рабочий узел 7220 tcp Балансировщик нагрузки Рабочий узел 7222 tcp Балансировщик нагрузки Рабочий узел 7223 tcp Внешние сервисы KUMA Рабочий узел 7209 tcp Внешние сервисы KUMA Рабочий узел 7210 tcp Внешние сервисы KUMA Рабочий узел 7220 tcp Внешние сервисы KUMA Рабочий узел 7222 tcp Внешние сервисы KUMA Рабочий узел 7223 tcp Рабочий узел Рабочий узел 179 tcp Рабочий узел Рабочий узел 9500 tcp Рабочий узел Рабочий узел 10250 tcp Рабочий узел Рабочий узел 51820 udp Рабочий узел Рабочий узел 51821 udp Управляющий узел Рабочий узел 10250 tcp Балансировщик нагрузки Управляющий узел 6443 tcp Балансировщик нагрузки Управляющий узел 8132 tcp Балансировщик нагрузки Управляющий узел 9443 tcp Рабочий узел Управляющий узел 6443 tcp Рабочий узел Управляющий узел 8132 tcp Рабочий узел Управляющий узел 10250 tcp Управляющий узел Управляющий узел 2380 tcp Управляющий узел Управляющий узел 6443 tcp Управляющий узел Управляющий узел 9443 tcp Управляющий узел Управляющий узел 10250 tcp Консоль управления кластером (CLI) Балансировщик нагрузки 6443 tcp Консоль управления кластером (CLI) Управляющий узел 6443 tcp

Минимально кластер должен включать:

один контроллер (выделенный или совмещенный с рабочим узлом);
один рабочий узел (выделенный, или совмещенный с контроллером);
0 и более выделенных рабочих узлов.

Минимальная конфигурация, на которую можно произвести установку - один контроллер, совмещенный с рабочим узлом. Данная конфигурация не обеспечивает отказоустойчивости core и служит для демонстрации возможностей/проверки программной среды.

Для реализации отказоустойчивости необходим выделенный контроллер кластера и минимум 2 рабочих узла. Если контроллер кластера содержит рабочую нагрузку и под (pod) с Core размещается на нем, то его отключение приведет к полной потере доступа к Core.

В нашем случае мы будем использовать установку All-In-One хост kuma-1.local, один узел контроллера (хост kuma-2.local) и два рабочих узла (хост kuma-3.local и kuma-4.local), пример файла инвентаря: https://box.kaspersky.com/f/bf06497b5b004dc3b1e5/ Другие примеры инвентарей: https://box.kaspersky.com/d/b397490dc08048acb671/
В распределенной установке kuma в секции инвентаря kuma_core нужно указать хост, который есть в роли worker (один из двух)
ВАЖНО! Для успешной установки должны быть соблюдены следующие требования:
- все машины кластера должны быть добавлены в /etc/hosts;
- установлены пакеты в соответствии с: https://support.kaspersky.com/help/KUMA/2.1/ru-RU/244399.htm;
- На Astra Linux на машине балансировщика нужно установить в дополнение пакету nginx еще один пакет libnginx-mod-stream
- в /var/lib/ должно быть не менее 32GB свободного места;
Значение переменных в инвентаре ansible:
- need_transfer – установка KUMA 2.1 происходит поверх предыдущей версии?;
- airgap - значение неважно, может отсутствовать;
- low_resources – использовать минимальные ресурсы для разворачивания? Отсутсвует по умолчанию. (Достаточно ресурсов: 2 CPU 4 RAM, НО при этом создается том хранения 4 Гб, без этого параметра том создается 512 Гб)
- для части инвентаря kuma_k0s и переменных ansible_host важно указывать IP адреса.
Создайте резервную копию ресурсов и сертификатов, см. советующий раздел в этой инструкции.
Распакуйте архив (операции выполняются на ядре системы KUMA): tar -xvf kuma-ansible-installer-(ВЕРСИЯ).tar.gz
Перейдите в распакованную папку: cd kuma-ansible-installer
Добавить файл лицензии в папку kuma-ansible-installer/roles/kuma/files и переименовать на license.key: cp ПУТЬ_ДО_КЛЮЧА*.key roles/kuma/files/license.key
Выполните команду копирования шаблона (пример заполненного файла в п. 0): cp k0s.inventory.yml.template k0s.inventory.yml
ВАЖНО! Регистр написания хостнеймов в inventory должен совпадать с выводом значения на хостах команды hostname -f
ВАЖНО! Хостнейм при команде hostname -f должен содержать хотя бы одну точку, пример: kuma.local
Входим в ОС из-под суперпользователя (root), если это не было сделано ранее: sudo -i
Запустите установку: ./install.sh k0s.inventory.yml
Зайдите на веб интерфейс ядра KUMA по одному из адресов рабочих узлов или балансировщика, например, в нашем случае это - https://192.168.0.153:7220
Для начального администрирования кластера воспользуйтесь командами этого раздела.

В случае, если при установке произошел сбой, перед последующей установкой рекомендуется выполнить uninstall.sh и перезагрузить все узлы кластера. Если uninstall выполнить нельзя (идет миграция существующей установки в кластер), то перед повторной попыткой установки нужно вручную выполнить команду sudo k0s reset на всех узлах кластера и перезагрузить их

Перестроение между воркерами в кластере Kubernetes происходит с таймаутом ~ 5 мин

Отказоустойчивость балансировщиков, пример - https://www.nginx.com/products/nginx/high-availability/

Для работы с кластером можно использовать команды и инструменты отсюда

Видео установки в конфигурации AiO-1LB-1CP-2W тут