پاسخ: مشکل تأخیر بالا – ذخیره سازی چابک – سوئیچ های fc بروکات

جالب است بدانید که دوره هایی وجود دارد که زمان تاخیر بین 1 تا 200 میلی ثانیه در نوسان است. این مراحل آرام معمولا بین 30 دقیقه تا دو ساعت طول می کشد. من نمی توانم ببینم که ما در چنین مرحله ای ترافیک کمتری روی سیستم های خود داریم. با این حال، تاخیرها در نهایت به سطحی افزایش می‌یابند که کار تولیدی روی سیستم‌ها را غیرممکن می‌کند.

در طی یکی از این مراحل آرام، من معیارهایی را با استفاده از شش IOmeter انجام دادم. سیستم ذخیره سازی Nimble با حداکثر ظرفیت خود از نظر IOPS کار می کرد، اما این باعث افزایش زیادی در تأخیر نشد. هنگام بررسی آمار سیستم‌های ما، میزان ترافیک غیرمعمول بالایی در دوره‌های تاخیر بالا ثبت نشده است.

دیروز ساعت 10 شب تمام آمار سوئیچ ها را پاک کردم. من اکنون (حدود 18 ساعت بعد) خطاها را بررسی کرده ام (با استفاده از دستور “porterrshow”)، و حتی یک خطا گزارش نشده است. من به نظارت بر وضعیت ادامه خواهم داد.

در آمار vSphere، می توانم به 1 ژانویه 2022 برگردم. از 3 آوریل 2023، روند واضحی از افزایش تاخیر تا زمانی که تشدید شد وجود دارد. قبل از آن تاریخ، تأخیر به طور مداوم کم بود (بین 2 تا 10 میلی ثانیه). این نشان می دهد که موضوع در آن تاریخ مشخص شروع شده است. آمار میزبان‌های ESXi همین الگو را تأیید می‌کند و همه میزبان‌ها به طور مداوم تحت تأثیر قرار می‌گیرند.
در آن زمان، هیچ تغییری در سیستم ما ایجاد نشد، مانند اضافه کردن هاست جدید یا تغییرات مشابه.

متأسفانه، تنها یک هاست ESXi می تواند در یک زمان خاموش شود، زیرا سیستم ها باید آنلاین بمانند. با این حال، ما آزمایش‌های خاموش کردن فردی را روی همه میزبان‌ها، از جمله میزبان ویندوز سرور انجام دادیم. ما همچنین سرور پشتیبان Veeam خود را خاموش کردیم و آن را از سوییچ و همچنین کتابخانه نوار جدا کردیم. متأسفانه، هیچ بهبودی در تأخیر مشاهده نشد. همه هاست ها تحت تاثیر قرار می گیرند، نه فقط هاست های ESXi.

ما با پشتیبانی VMWare درگیر شده ایم و آنها گفته اند که آخرین نسخه سیستم عامل قبلاً نصب شده است. آنها معتقدند که از آنجایی که همه هاست ها این مشکل را تجربه می کنند، نمی توان آن را به هاست ESXi نسبت داد.

ما یک به‌روزرسانی Nimble را در 20 مارس 2023 به نسخه 5.2.1.1000 و در 28 آوریل 2023 به نسخه 6.1.1.200 انجام دادیم. این یک پیکربندی Persistence است.

 




منبع: https://community.hpe.com/t5/array-setup-and-networking/high-latency-issue-nimble-storage-brocade-fc-switches/m-p/7188475#M3197