Я уже рассказывал про первый уровень мониторинга инфраструктуры, и сейчас пора продолжить эту тему. Поговорим о втором и третьем уровнях.
Второй уровень мониторинга предназначен для нагруженных устройств — чтобы анализировать проблемы производительности и выявлять узкие места.
Сюда же стоит прикрутить оповещения от системы тестирования бэкапов (вы ведь не тестируете все бэкапы вручную? ) Знать о проблемах с резервным копированием лучше заранее, а не когда все горит, а бэкапы не распаковываются.
Если у вас есть данные по нагрузке на железо, инфраструктура будет работать более контролируемо и предсказуемо. Вы сможете своевременно готовиться к нехватке памяти, планировать апгрейды или узнавать, что время бэкапа приближается к размеру технологического окна.
Третий уровень мониторинга — анализ работы приложений. Он дает ощутимую нагрузку на систему, поэтому к нему прибегают в случае необходимости — то есть когда начались проблемы в производительности. Например, стали медленно проводиться документы в 1С или сайт грузит страницу за полминуты.
Можно собирать данные скриптами или глазами по логам. Но намного проще и быстрее единоразово построить систему, которая будет сообщать об инцидентах в режиме реального времени. Включил мониторинг → собрал данные → посмотрел на график → нашел проблему.
О приложениях для мониторинга писать не буду, так как каждый выбирает то, что ему удобно. Но если нужно раскрыть эту тему, дайте знать в комментариях — сделаю отдельный пост.
Больше интересного в нашем телеграмм-канале https://t.me/+a8sjeXybRkIwNWQy
Обратитесь к нам прямо сейчас и мы подберем для вас лучшие решения на самых выгодных условиях!