Есть установленная grafana.
Нужно установить InstafluxDB и к ней telegraf, для того чтобы загружать данные через csv файлы, которые будут обновляться каждую минуту. Тем самым создать dashboard красивый
Список метрик смогу дать уже при личной беседе. Первый шаг надо мониторить урлы на доступность и если урл перестал отвечать. Прислать в slack уведомление.