مقدمه

زبیکس یک سیستم نگهدارنده است. همچنین، خود سیستم نگهدارنده نیاز به منابع، تنظیمات و نگهداری دارد. و تنظیمات مربوطه باید مطابق نیاز روز سامانه زبیکس وشرایط مختلف بروزرسانی شود. از این رو بر آن شدیم در این مقاله به Tunning و خطاهای رایج زبیکس بپردازیم. این نوشته می تواند بسیار کاربردی باشد و لازم است تا بارها بدان ارجاع شود.
در این مطلب قصد داریم خطاهای رایجی که در سیستم زبیکس رخ می دهد و نیاز به عملیات Tuning دارند بررسی و آنها را تکمیل کنیم.

خطای رایج کمبود فرایند poller

Zabbix unreachable poller processes more than 75% busy.

Zabbix-unreachable-poller-processes-more-than-75-busy.Zabbix-unreachable-poller-processes-more-than-75-busy_graph_tahlilyar

خطای رایج زبیکس نیازمند tunning

تعریف فرایند poller

فرایندی است که هنگام ارتباط با هاست هایی که بصورت Passive مانیتور می شوند روی سیستم سرور اجرا می شود و دائم به هاست ها سرکشی می کند و به agent های (SNMP/IPMI/ODBC/telnet agent/ssh agent) دستور می دهد که داده های خواسته شده را بفرستند. همچنین یک لیست از آیتم های تعریف شده در هاست (سمت Frontend) را ارسال می کند.

در واقع مسئول تعامل با Agent های Passive می باشد.

راه حل

برای این منظور سه راهکار مطرح می گردد.

  1.  هاست های خاموش را غیرفعال کنید.
  2. از هاست Active به جای Passive استفاده کنید.
  3. در فایل تنظیمات زبیکس تعداد فرایند های Poller را افزایش دهید.

جهت تغییر تنظیمات – راهکار 3:

به مسیر تنظیمات زبیکس رفته و فایل zabbix_server.conf را باز کرده سپس پارامتر StartPollersUnreachable را افزایش دهید.

vim /etc/zabbix/zabbix_server.conf

مثلا در اینجا مقدار StartPollersUnreachable را به 80 تغییر می دهیم.

StartPollersUnreachable=80

اگر از راهکار دوم استفاده کردید (این کار به راهکار اول هم مربوط میشود) می توانید StartPollersUnreachable را برابر با 0 (صفر) قرار دهید.

هر از گاهی ممکن است این خطا را به عنوان Warning یا اخطار در بخش مشکلات سرور زبیکس مشاهده کنید اما اگر این پارامتر را افزایش داده باشید زمان کمی قابل مشاهده خواهد بود و به زودی اصلاح خواهد شد.

Zabbix unreachable poller processes more than 75% busy_problem_tahlilyar

خطای کمبود Poller بعد از اصلاح.

خطای رایج از دست رفتن بیش از 100 آیتم در 10 دقیقه

More than 100 items having missing data for more than 10 minutes

اگر این خطا را مشاهده نمدید حاکی از آن است که سرور زبیکس در 10 دقیقه درخواستهای زیادی به سمت Agent ها داشته که بیشتر از 100 آیتم آنها داده دریافت نکرده اند. این مورد بیشتر به زمانی بر می گردد که شما آیتم هایی را اضافه کرده باشید که به خوبی با سیستم مورد نظر (سمت agent) انطباق نداشته باشند. و این باعث می شود سرور فککر کند که داده گم شده است.

راه حل

اگر با این خطا مواجه شدید به تنظیمات هاست ها رجوع کنید و وضعیت آیتم ها را بررسی کنید. به احتمال زیاد آیتم هایی را مشاهده می کنید که سمت راست جدول آنها یک دکمه قرمز وجود دارد و اگر موس خورد را روی آن دکمه نگه دارید متن خطا را مشاهده می کند. پس، یا آیتم های اضافی را پاک کنید و یا این که تنظیمات اشتباه سمت Agent را برطرف کنید.

خطای رایج کمبود فضای کش سرور زبیکس

Zabbix value cache working in low memory mode
More than 75% used in the configuration cache
More than 95% used in the value cache

این خطاها نیز مانند خطای کمبود فرایند poller می باشد با این تفاوت که در این خطاها باید مقدار پارامتر CacheSize را تغییر دهید.
هرگاه با این خطا مواجه شدید به بخش تنظیمات سرور زبیکس مراجعه کنید و مقدار پارامتر CacheSize را افزایش دید.

نتیجه

توصیه می شود این مقاله را ذخیره کرده و در بازه های زمانی پیاپی بدان رجوع کنید.