# Создание парсеров в KUMA (CookBook) Этакий "CookBook" по различным приемам парсинга в KUMA # CookBook по регулярным выражениям (REGEX) Проверка работы регулярок (выставить флаги gm): - [https://regexr.com/](https://regexr.com/) - [https://regex101.com/](https://regex101.com/) Доп чтиво: - [https://habr.com/ru/articles/545150/](https://habr.com/ru/articles/545150/) - [https://regex.sorokin.engineer/ru/latest/regular\_expressions.html](https://regex.sorokin.engineer/ru/latest/regular_expressions.html)

В KUMA все группы которые участвуют в маппинге (нормализации) должны быть именованы, пример именования "priority" для группы: `(?P\d|\d{2}|1[1-8]\d|19[01])`

Если группа не нужна в маппинге, то можно использовать не именованную группу, пример: `(?:\d|\d{2}|1[1-8]\d|19[01])`

Простейшие приемы, практику отработаем на тестовом сообщении: ``` Message from 127.0.0.1 (localhost): KUMA is the best SIEM in 2023! ``` ### Захватить строку KUMA `KUMA` *Ищется полное соответствие строке KUMA.* [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/scaled-1680-/oJYimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/oJYimage.png) ### Захватить строку содержащую только буквы `[A-Za-z]+` *Ищем группу (**\[\]**) символов с большими (**A-Z**) и маленькими (**a-z**) буквами от одной и более (**+**).* [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/scaled-1680-/sOYimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/sOYimage.png) ### Захватить строку содержащую только числа `\d+` *Ищем по токену **\\d**, что является эквивалентом **\[0-9\]** от одного и более вхождений (**+**).* [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/scaled-1680-/bf3image.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/bf3image.png) ### Захватить строку внутри круглых скобок `$(\w+)$` *Ищем по токену **\\w**, что является эквивалентом **\[a-zA-Z0-9\_\]** от одного и более вхождений (**+**), при этом экранируем круглые скобки с помощью обратного слеша **\\** и строку нашу определяем в группу круглыми скобками **()*** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/scaled-1680-/mR9image.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/mR9image.png) ### Захватить строку до двоеточия `^[^\:]+` *Ищем с начала строки **^**, далее захватываем в группе все кроме двоеточия (символ двоеточия экранирован) **\[^\\:\]** от одного и более вхождений (**+**)* [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/scaled-1680-/p5Ximage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/p5Ximage.png) ### Захватить строку после двоеточия `[^\:]+$` Такая, подобная предствленной выше, конструкция не подойдет, т.к. она будет очень емокой (633 шага). *Ищем все кроме двоеточия (символ двоеточия экранирован) **\[^\\:\]** от одного и более вхождений (**+**), но до конца строки **$*** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/scaled-1680-/aPvimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/aPvimage.png) В нашем случае лучше использовать следующее *`\:(.*)$` Ищем в строке двоеточие **\\:**, далее захватываем все символы от нуля и более вхождений (**\***), и берем все что нам нужно в группу **()*** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/scaled-1680-/cY9image.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/cY9image.png) ### Захватить IP-адрес `\d+\.\d+\.\d+\.\d+` *Ищем числа от одного и более **\\d+**, с точкой и так 4 раза* [![Untitled.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/scaled-1680-/untitled.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/untitled.png) ### Захватить слова состоящие из 4 букв `\b[a-zA-Z]{4}\b` *Ищем группу 4 символов из букв и разграничиваем их (boundary) **\\b*** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/scaled-1680-/cCVimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/cCVimage.png) ### Захватить слова состоящие от 3 до 4 букв `\b[a-zA-Z]{3,4}\b` *Ищем группу 4 символов из букв и разграничиваем их (boundary) **\\b*** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/scaled-1680-/cOcimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-10/cOcimage.png) ### Захватить IPv4 адрес **`\b((2([0-4][0-9]|5[0-5])|[0-1]?[0-9]?[0-9])\.){3}((2([0-4][0-9]|5[0-5])|[0-1]?[0-9]?[0-9]))\b`** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/scaled-1680-/Gioimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/Gioimage.png) Более ленивый вариант, но быстрый, без валидации: **`(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})`** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/scaled-1680-/XXgimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/XXgimage.png) ### Захватить IPv6 адрес **`(([a-fA-F0-9]{1,4}|):){1,7}([a-fA-F0-9]{1,4}|:) `** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/scaled-1680-/huCimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/huCimage.png) ### Захватить HASH сумму - MD **`^[a-fA-F0-9]{32}$`** - SHA1 **`^[a-fA-F0-9]{40}$`** - SHA256 **`^[a-fA-F0-9]{64}$`** - SHA512 **`^[a-fA-F0-9]{128}$`** ### Захватить URL адрес **`^((https?:\/\/)?([\da-z\.-]+\.[a-z\.]{2,6}|[\d\.]+)([\/:?=&#]{1}[\da-z\.-]+)*\S+)$ `** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/scaled-1680-/p1Timage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/p1Timage.png) ### Захватить EMAIL адрес Определяет почти все типы валидных адресов **`\b[\w\.\-\+\!\/\"\%]+@[\w\.-]+(\.\w{2,4})?\b`** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/scaled-1680-/uDRimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/uDRimage.png) ### Захватить CSV структуру Создаются группы по значениям из CSV **`(?:\s*(?:\"([^\"]*)\"|([^,]+))\s*,?)+?`** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/scaled-1680-/Byyimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/Byyimage.png) ### Захватить Syslog структуру Разбираются сообщения по rfc [https://datatracker.ietf.org/doc/html/rfc5424](https://datatracker.ietf.org/doc/html/rfc5424) и [https://datatracker.ietf.org/doc/html/rfc3164](https://datatracker.ietf.org/doc/html/rfc3164) **`(?P^<(?P\d|\d{2}|1[1-8]\d|19[01])>(?P\d{1,2})?\s?(?P(?P[A-Z][a-z][a-z]\s{1,2}\d{1,2}\s\d{2}[:]\d{2}[:]\d{2})|(?P\d{4}[-]\d{2}[-]\d{2}[T]\d{2}[:]\d{2}[:]\d{2}(?:\.\d{1,6})?(?:[+-]\d{2}[:]\d{2}|Z)?))\s?(?P[\S]{1,255})\s?(?P[\/\w-]{1,48})?\s?\[?(?P[\w]{1,128})?(?P\]\:\s|\s\-\s|\:\s|\s)(?P(?P[\S]{1,32})?(?P\]\:\s|\s\-\s|\:\s|\s)?(?P\[.+[\]]+|-)?(?:\s(?P.+))?)$)`** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/scaled-1680-/2Cgimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/2Cgimage.png) ### Захватить символы (не буквы и не цифры) **`[^\w \xC0-\xFF]`** [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/scaled-1680-/3uGimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/3uGimage.png) ### Работа с многострочным сообщением В regexp существуют следующие флаги: - `i` - нечувствителен к регистру (по умолчанию false) - `m` - многострочный режим, ^ и $ соответствуют строке начала/конца в дополнение к тексту начала/конца (по умолчанию false) - `s` - позволяет `.` (точке) совпадать с `\n` (по умолчанию false) - `U` - не жадный режим, меняет местами значения x\* и x\*?, x+ и x+? и т. д. (по умолчанию false) Синтаксис флага: xyz (установить) или -xyz (очистить) или xy-z (установить xy, очистить z). Устанавливаем флаг s [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/scaled-1680-/nTgimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/nTgimage.png) Использование в KUMA: [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/scaled-1680-/jcsimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/jcsimage.png) [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/scaled-1680-/CxFimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/CxFimage.png) ### Замена разделителя в структуре KV Иногда в структуре KV разделитель пробел создает нам проблемы, пример такого события: ```bash pid=\"29753\" appname=\"DBeaver 23.2.1 - SQLEditor \" user=\"user2\" dbname=\"test_db\" rhost=\"comp.local(911)\" queryid=\"0\" command_tag=\"BIND\" sql_state=\"42501\" session_id=\"6662a086.7439\" session_seq=\"74\" session_start_time=\"2024-06-07 05:54:14 UTC\" virt_trans_id=\"5/231\" trans_id=\"0\" msg=STATEMENT: select lo_export(111,'/tmp/pido') ``` В примере значение по ключу msg без кавычек, и оно будет некорректно парситься, поэтому можно, либо заменами добавить эти кавычки, либо воспользоваться приемом полегче и сделать разделитель, например | Для этого используем функцию replaceWithRegexp: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-06/scaled-1680-/image.png) Вот как выглядит будет замена: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-06/scaled-1680-/SY2image.png) Вот как это выглядит в KUMA: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-06/scaled-1680-/BXjimage.png) ### Общая шпаргалка [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-12/scaled-1680-/image.png)](https://kb.kuma-community.ru/uploads/images/gallery/2024-12/image.png) # Приемы парсинга событий ### Использование нормализатора в качестве доп. парсера ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2026-01/scaled-1680-/image.png) KUMA 4.0.1 была добавлена возможность использовать нормализатор, как элемент другого нормализатора. Пример можно посмотреть в нормализаторе "\[OOTB\] Microsoft Products via KES WIN NG for KUMA 4.0.1" ### Парсинг нестандартной даты [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/scaled-1680-/iFzimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2023-11/iFzimage.png) --- ### Ветвление событий от beats в зависимости от input типа Даны следующие типы событий (содержимое тестового сообщения сокращено для лучшего понимания): ```json {"tags":["beats_input_raw_event"],"input":{"type":"filestream"}} {"message":"I0130 14:38:47.090079 1837403 utils.go:187] ID: 544472 GRPC response: {}","input":{"type":"container"}} {"journal":{"system":"true"},"tags":["beats_input_codec_plain_applied"],"input":{"type":"journald"}} {"input":{"type":"journald"},"journal":{"system":"true"},"tags":["beats_input_codec_plain_applied"]} {"journal":{"system":"true"},"input":{"type":"journald"},"tags":["beats_input_codec_plain_applied"]} ``` Необходимо в парсинге разветлять (тк у каждого типа свой набор полей) парсинг в зависимости от типа input поля, мы имеем три типа в данном примере: - "input":{"type":"container"} - "input":{"type":"journald"} - "input":{"type":"filestream"} Причем, поле input может находиться как в начале, так и в середине, и в конце сообщения. Поэтому для ветвления в первом шаге парсинга будут использоваться регулярные выражения: [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-01/scaled-1680-/mpAimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2024-01/mpAimage.png) Поле из regex с наименованием route будет использоваться для маршрутизации по условию в нужный парсер, поле all необходимо для передачи полного содержимого в подпарсер. Структура парсера выглядит следующим образом: [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-01/scaled-1680-/EBMimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2024-01/EBMimage.png) Рассмотрим один подпарсер, например, filestream: [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-01/scaled-1680-/1j0image.png)](https://kb.kuma-community.ru/uploads/images/gallery/2024-01/1j0image.png) Тк общая структура сообщения формата JSON, используется соответсвующий коробочный парсер: [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-01/scaled-1680-/H2limage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2024-01/H2limage.png) --- ### Парсинг массивов

Актуально для KUMA 3.0+

В KUMA 3.0.2 появилась возможность создания кастомных полей типа "массив" (SA, NA, FA), доступные для методов парсинг JSON и KV. Чтобы записать массив в дополнительное поле, достаточно его указать в маппинге: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-02/scaled-1680-/gAsimage.png) В событии это будет выглядеть следующим образом: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-02/scaled-1680-/egnimage.png) Если с массивом в таком случае работать не удобно и нужно все элементы из массива "склеить" через делиметр и записать в отдельное поле, можно воспользоваться обогащением. Для этого сначала массив мапится на строковое поле: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-02/scaled-1680-/15gimage.png) В таком случае в событии данное поле будет представлять собой массив переведенный в строку: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-02/scaled-1680-/tOdimage.png) Чтобы привести ее в более "приятный" вид можно выполнить следующие преобразования: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-02/scaled-1680-/mH1image.png) После этого в DeviceCustomString1 будут записаны все элементы массива через выбранный в последнем (3) преобразовании делиметр (в данном примере это "пробел"): ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-02/scaled-1680-/ZTMimage.png) --- ### Передача сырого события в экстранормализатор, для доступа к элементам массива

Актуально для KUMA 3.0+

Для передачи «сырого» события в экстра-нормализатор необходимо: - открыть нормализатор событий; - перейти в меню «Условия дополнительной нормализации»; - активировать параметр «Использовать сырое событие».

По умолчанию параметр «Использовать сырое событие» не активен.

[![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/scaled-1680-/lU1image.png)](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/lU1image.png) Рекомендуется активировать параметр «Использовать сырое событие» в нормализаторах типа **«xml», «json»**. Для передачи «сырого» события в экстра-нормализатор второго, третьего и более глубоких уровней вложенности необходимо последовательно включить параметра «Использовать сырое событие» в каждом экстра-нормализаторе по пути следования события в целевой экстра-нормализатор и непосредственно в целевом экстра-нормализаторе. В качестве примера работы данной функции вы можете обратиться к нормализатору Microsoft Products для KUMA 3.0.1: параметр «Использовать сырое событие» включен последовательно в экстра-нормализаторах «AD FS» и «424». В качестве примера, событие: *<Event xmlns='http://schemas.microsoft.com/win/2004/08/events/event'><System><Provider Name='ESENT'/><EventID Qualifiers='0'>216</EventID><Level>4</Level><Task>3</Task><Keywords>0x80000000000000</Keywords><TimeCreated SystemTime='2024-01-20T20:06:07.144730300Z'/><EventRecordID>870234</EventRecordID><Channel>Application</Channel><Computer>COMPANY.COM</Computer><Security/></System><EventData><Data>lsass</Data><Data>724,R,98</Data><Data></Data><Data>C:\\Windows\\NTDS\\ntds.dit</Data><Data>\\\\?\\GLOBALROOT\\Device\\HarddiskVolumeShadowCopy50\\Windows\\NTDS\\ntds.dit</Data></EventData></Event>* При парсинге ID события 216: [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/scaled-1680-/6ssimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/6ssimage.png) Будет корректно разбираться: [![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/scaled-1680-/Wizimage.png)](https://kb.kuma-community.ru/uploads/images/gallery/2024-03/Wizimage.png) --- ### Смена порядка следования экстранормализаторов

Материал был предостален пользователем комьюнити ❤️

По умолчанию в GUI KUMA отсутствует возможность перемещать экстранормализаторы внутри правила нормализации и менять их местами. Однако, в ряде случаев данная операция всё же требуется. Например, когда нужно добавить блок с экстранормализатором выше уже существующих, так как они проверяются последовательно. Через веб-интерфейс это сделать проблематично, т.к. потребуется удаление и пересоздание заново всех блоков экстранормализаторов идущих ниже. ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/B2Mimage.png) Ниже описан workaround, который позволяет получить нужное правило нормализации в виде JSON файла из MongoDB и отредактировать его, задав нужную последовательность экстранормализаторов.

**Необходимые меры предосторожности**: 1. Все действия по подготовке нужного правила настоятельно рекомендуется выполнять на тестовом стенде (не на продуктовой инсталляции), так как предполагается прямой доступ и запись данных в MongoDB (основную базу настроек KUMA). Нельзя исключать риск нарушения работы инсталляции KUMA из-за возможных ошибок. 2. Предварительно рекомендуется сделать выгрузку контента и бэкап самой базы: средствами kuma tools (old), по API или через утилиту mongodump.

1\. Разместить на стенде KUMA правило нормализации, которое будет подлежать редактированию. Открыть его в браузере и скопировать его UUID из строки URL. ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/HSkimage.png)

Необходимые утилиты под вашу ОС можно загрузить отсюда: [https://www.mongodb.com/try/download/database-tools](https://www.mongodb.com/try/download/database-tools) Документация по утилитам: [https://www.mongodb.com/docs/v4.2/reference/program/](https://www.mongodb.com/docs/v4.2/reference/program/)

2\. C помощью встроенной консольной утилиты mongoexport выполнить подключение к базе kuma и экспорт нужного правила нормализации в файл: ```bash /opt/kaspersky/kuma/mongodb/bin/mongoexport --db=kuma --collection=resources --query='{"_id": "your_normalizer_id"}' > normalizer.json ``` Пример успешного экспорта: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/17timage.png) 3\. Открыть полученный JSON файл в редакторе, поддерживающим форматирование JSON и работу с объектами (например, Notepad++ c плагином JSTool). ― Сразу поменять uuid в полях "\_id", "exportID", "id" на новый. Он должен быть уникальным в рамках всех остальных ресурсов KUMA для успешного импорта правила обратно. Сгенерировать UUID: cat /proc/sys/kernel/random/uuid ― Сразу поменять значение поля "name", задав новое название правила или его версию. ― Найти в структуре файла блок "extra", содержащий экстранормализаторы. Развернуть его и выполнить поиск нужного блока экстранормализации который требуется переместить. ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/EVmimage.png) 4\. В блоке "extra" найти по нужный экстранормализатор, выделить и скопировать его код целиком, ориентируясь на открывающую скобку перед полем "normalizer" и соответствующую закрывающую скобку. ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/vNkimage.png) 5\. Вставить скопированный код в нужное место в блоке "extra". Например, в его начале или между требуемых экстранормализаторов (зависит от нужного вам порядка их следования). Проверить, что все скобки { } на месте. 6\. Сохранить получившийся JSON файл, перенести его обратно на сервер с KUMA Core и выполнить его импорт в MongoDB: ```bash /opt/kaspersky/kuma/mongodb/bin/mongoimport --db kuma --collection resources --file new_normalizer.json ``` Пример успешного импорта: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/N3yimage.png) 7\. Зайти в веб-интерфейс KUMA и проверить наличие отредактированного нормализатора (в том же тенанте и папке, т.к. они не менялись) ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/15Iimage.png) Результат: изменён порядок следования экстранормализаторов без их удаления и пересоздания вручную через веб-интерфейс ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/zYLimage.png) #### Альтернативный вариант с VS Code

Потребуется приложение: [https://code.visualstudio.com/](https://code.visualstudio.com/) и плагин для работы с MongoDB: [https://marketplace.visualstudio.com/items?itemName=mongodb.mongodb-vscode](https://marketplace.visualstudio.com/items?itemName=mongodb.mongodb-vscode)

Также можно использовать клиент MongoDB Compass для подключения к MongoDB: [https://www.mongodb.com/products/tools/compass](https://www.mongodb.com/products/tools/compass)

Рекомендуется работать с копией / дубликатом ресурса, чтобы предотвратить возможные проблемы

1\. Подключение к монго через SSH: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/VZAimage.png) ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/GvHimage.png) Прописываем адрес, логин и пароль для SSH: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/Wtnimage.png) 2\. Заходим в БД kuma ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/uYpimage.png) 3\. Переходим в коллекцию resoureces и нажимаем на значок поиска ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/Y9Uimage.png) 4\. Ищем ресурс по имени или ID (кому как удобно): ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/6Bcimage.png) 5\. Переходим в режим редактирования и далее можно перемежать блоки JSON нормализатора и других ресурсов, как вам удобно, для сохранения используте комбинацию клавиш Ctrl+S: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-09/scaled-1680-/SSeimage.png) # Принцип работы правила агрегации (схематично) Отразим схематично принцип работы агрегации на примере событий аудита от ОС Linux: ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-10/scaled-1680-/65vimage.png)

При склейке множества событий в одно, порядок событий не сохраняется, т.к обработка многопоточная (на выход события могут прийти не в той последовательности, как на вход). Для того чтобы обработка происходила в 1 поток необходимо в настройках коллектора на 1 шаге указать количество рабочих процессов (workers) = 1. см пример со склейктой [тут](https://kb.kuma-community.ru/books/sozdanie-parserov-v-kuma-cookbook/page/obrabotka-mnogostrocnyx-sobytii-na-primere-auditd-v-kuma)

# Обработка многострочных событий на примере AuditD в KUMA

Официальный способ получения multiline auditd - через переключатель "auditd", который доступен в KUMA 3.2: [https://support.kaspersky.com/help/KUMA/3.2/ru-RU/220739.htm](https://support.kaspersky.com/help/KUMA/3.2/ru-RU/220739.htm) Описанный ниже способ является wa и примером обработки многострочных событий на примере AuditD и может быть перенесен на другие источники с похожей структурой событий.

### Введение В данной статье будет рассмотрен процесс (**workaround**) обработки многострочных событий на примере событий AuditD.

1) Каждая пачка событий, попавшая под агрегацию будет посчитана как 2 события (не 2 пачки). Так что в общем случае, когда в многострочном событии 2 и более событий увеличение числа EPS не произойдет. 2) Метод не подразумевает сохранение исходных событий (**Raw**), при необходимости собирать сырые события нужно будет создать дополнительный коллектор, который будет за это отвечать 3) После склейки, многострочное событие записывается в одно поле (в примере далее это **Extra и Message**). Соответственно потребуется использование измененных нормализаторов.

Коробочный парсер в данном случае не подходит, но его можно использовать за основу.

Так как алгоритм работы цикличный, крайне рекомендуется прочитать данную статью два раза.

--- ### Принцип работы Ниже представлена схема работы склейки многострочного события. ![2.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-05/scaled-1680-/2.png)

Основная идея заключается в том, чтобы на коллекторе сагрегировать все события одного многострочного события в одно. Всю полезную информацию при агрегации записать в одно поле и затем отправить такое агрегированное событие обратно на вход коллектору для нормализации.

--- ### Алгоритм работы на примере Auditd 1\) На первом шаге в коллектор поступает событие, где происходит проверка, был ли отправлен syslog или json, в условиях экстранормализации, соответственно, выполняется проверка формата сообщения.

В общем виде, проверка может быть любой. Основная идея - разделить на главном нормализаторе исходные события от источника от агрегированных событий.

Пример нормализации. ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-05/scaled-1680-/GZ4image.png) Пример условий для передачи событий в экстранормализатор, если событие исходное. ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-05/scaled-1680-/gHNimage.png)Пример условий для передачи событий в экстранормализатор, если событие агрегированное. ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-05/scaled-1680-/oQiimage.png)2) В случае отправки syslog'а на этапе нормализации не будет происходит обогащения полями **DeviceProduct** и **DeviceVendor,** поэтому их можно будет добавить в условие для агрегации. Ниже приведен пример для агрегации событий AuditD:

Здесь также проверка может быть любой. Основная идея - под правило агрегации должно попадать только исходное событие. Попадание под правила агрегации должно быть исключено для событий, попавших в коллектор второй раз. Также в поле суммы должно быть указано то поле, в которое на этапе парсинга пишутся полезные данные.

![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-05/scaled-1680-/AwVimage.png) 3\) На этапе маршрутизации есть две точки назначения: 1. **Storage for AuditD** - хранилище и **loop** - перенаправка событий обратно в коллектор (сам в себя). Во время этого этапа происходит проверка типа событий **loop** - для ***Type=2*** (агрегированные события) и **Storage for AuditD** для ***Type=1*** (базовые события). Обратите внимание, что при создании точки **loop,** нужно будет указать выходной формат **json**:

Основная идея - разграничение точек назначения по типу событий. Обратно на вход коллектора должны подаваться агрегированные события, а в хранилище должны записываться только повторно обработанные события.

Пример точки назначения для отправки агрегированных событий в тот же коллектор ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-05/scaled-1680-/ZMzimage.png) Пример условия для точки назначения для отправки агрегированных событий в тот же коллектор ![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-05/scaled-1680-/ll9image.png) 4\) После отправки агрегированного события на вход тому же коллектору, коллектор получает json, где уже происходит обогащение, а также вынос информации из Message в Extra. Это событие уже не будет считаться агрегированным из-за чего будет отправка в другую точку назначения.

В общем случае, поле, в которое помещается информация из нескольких событий может быть любым. Также стоит учитывать максимально возможную длину полей.

![image.png](https://kb.kuma-community.ru/uploads/images/gallery/2024-05/scaled-1680-/QUnimage.png) --- ### Заключение Метод приведенный выше позволяет склеивать и нормализовывать многострочные события, у которых есть общий идентификатор (id, timestamp или комбинация таких полей), по которому можно однозначно определить принадлежность каждого конкретного события к многострочному. Также, для простоты администрирования и нормализации можно использовать 2 коллектора вместо одного: - Первый коллектор агрегирует события, записывая всю полезную информацию в одно или несколько полей KUMA и отправляет на вход второму коллектору без отправки в Хранилище/Коррелятор. - Второй коллектор парсит полученные агрегированные события от первого и направляет нормализованные события в Хранилище/Коррелятор. --- ### Полезные ссылки 1\. Пример нормализатора и правила агрегации из примера: [https://github.com/KUMA-Community/kuma\_auditd\_multiline\_wa/](https://github.com/KUMA-Community/kuma_auditd_multiline_wa/) 2\. Принцип работы правил агрегации (схематично): [https://kb.kuma-community.ru/books/sozdanie-parserov-v-kuma-cookbook/page/princip-raboty-pravila-agregacii-sxematicno](https://kb.kuma-community.ru/books/sozdanie-parserov-v-kuma-cookbook/page/princip-raboty-pravila-agregacii-sxematicno)