Hamdar containers metrics

داشبورد Hamdar containers metrics

روش عمومی خواندن پنل‌ها در راهنمای پنل مانیتورینگ آمده است.

کاربرد داشبورد

این داشبورد تعداد Containerها، مصرف منابع، ترافیک شبکه، Uptime و Restartهای Containerهای همدار را نشان می‌دهد. هنگام کندی یا ناپایداری سرویس‌های همدار مانند REST یا DB، از این داشبورد برای پیداکردن Containerهای پرمصرف یا Containerهایی که مرتب Restart می‌شوند استفاده کنید.

پنل‌ها

Containers، Network Traffic و Uptime

این ردیف تعداد Containerهای شناسایی‌شده، ترافیک کل Host و هر Container و مدت فعالیت Containerها را نشان می‌دهد. کاهش تعداد Containerها یا Uptime کوتاه بدون Deploy می‌تواند نشانه توقف سرویس یا Restart باشد.

Container Restarts [1d] و ترافیک دریافتی

تعداد Restartهای یک روز و ترافیک دریافتی هر Container را بررسی کنید. افزایش تکرارشونده Restart نیازمند بررسی Exit code و لاگ Docker است؛ عدم توازن شدید ترافیک را نیز با لاگ سرویس تطبیق دهید.

CPU و حافظه Containerها

پنل‌های CPU Usage، CPU Usage per Container، Used Memory، Available Memory و RSS Memory مصرف منابع را در سطح کل و هر Container نمایش می‌دهند. نزدیک‌شدن حافظه به Limit یا رشد بدون بازگشت می‌تواند نشانه Leak یا OOM باشد.

پیوست فنی

این بخش برای نگهداری و Provisioning داشبورد است و در بررسی‌های روزمره کاربردی ندارد.

ویژگی مقدار
پوشه Provisioning hamdar (dashboards/hamdar/hamdar-containers-metrics.json)
UID bectmv4b0z85cb
Datasource VictoriaMetrics (monitoring-prometheus)
متریک پایه container_* (cAdvisor) با product="hamdar"

Queryهای کلیدی:

هدف Query نمونه
شمار Container count(rate(container_last_seen{product="hamdar",id=~".*/docker-.*",instance=~"$node"}[5m]))
Restart در ۱ روز count by(name)(count_over_time(container_last_seen{product="hamdar",name=~".+"}[1d])) - 1
CPU هر Container sum(rate(container_cpu_usage_seconds_total{product="hamdar",name=~".+"}[5m])) by (name) * 100
RSS هر Container sum(container_memory_rss{product="hamdar",name!=""}) by (name)
ترافیک هر Container rate(container_network_receive_bytes_total{product="hamdar",name!=""}[5m])*8