پستهای وبلاگ این شرکت نشان میدهد که طی چهار ماه گذشته، GitHub 16 اختلال در خدمات خود تجربه کرده است.
GitHub متعلق به مایکروسافت که یک پلتفرم میزبانی کد برای کنترل نسخه و همکاری ارائه می دهد، هفته گذشته به دنبال ۱۳ مورد از این قبیل در سه ماه گذشته، با سه اختلال در خدمات خود مواجه شد.
«هفته گذشته، GitHub چندین رویداد در دسترس را تجربه کرد، چه طولانی مدت و چه مدت کوتاه تر. مایک هانلی، افسر ارشد امنیتی در GitHub، در پست وبلاگ.
«دلایل اصلی این حوادث نامرتبط بود، اما در مجموع، بر خدماتی که سازمانها و توسعهدهندگان به GitHub اعتماد دارند، تأثیر منفی گذاشت. هانلی افزود: این قابل قبول نیست و استانداردی که ما خود را به آن می دانیم نیست.
این شرکت گفت که این سه حادثه که در تاریخهای ۹، ۱۰ و ۱۱ می رخ دادهاند، بر اکثر سرویسهای حیاتی که GitHub ارائه میدهد، تأثیر گذاشته است.
حوادث سرویس های مهم GitHub را از بین می برد
به گفته این شرکت، حادثه ای که در ۹ می رخ داد، پایگاه داده GitHub را به دلیل تغییر پیکربندی مختل کرد.
“در ۹ مه، ما با یک حادثه مواجه شدیم که باعث شد ۸ سرویس از ۱۰ سرویس موجود در پورتال وضعیت تحت تاثیر یک قطعی بزرگ (وضعیت قرمز) قرار بگیرند. هانلی در پست وبلاگ گفت: اکثر اوقات از کار افتادگی بیش از یک ساعت به طول انجامید.
هنلی توضیح داد که در زمان قطع، بسیاری از سرویسها نمیتوانستند دادههای Git جدید نوشته شده را بخوانند، که باعث خرابیهای گسترده میشود، و افزود که پس از قطع، یک جدول زمانی طولانی برای بازیابی پس از حادثه برخی از درخواستهای کشش و فشار وجود دارد. .
طبق گفته هانلی، این قطعی با تغییر پیکربندی در سرویس داخلی ارائهدهنده دادههای Git ایجاد شد.
“این تغییر برای جلوگیری از اشباع اتصال در نظر گرفته شده بود و قبلاً با موفقیت در جای دیگری در باطن Git معرفی شده بود. مدت کوتاهی پس از شروع عرضه، خوشه با شکست مواجه شد. ما تغییر پیکربندی را برگرداندیم و در عرض چند دقیقه تلاش کردیم که به عقب برگردیم، اما به دلیل یک خطای زیرساخت داخلی، بازگشت ناموفق بود.
حادثه در ۱۰ می، که به دلیل کاهش قابلیت صدور توکن تأیید اعتبار برنامه GitHub رخ داد، شش مورد از ده سرویس مهم GitHub را نیز تحت تأثیر قرار داد.
«در ۱۰ می، خوشه پایگاه داده ای که توکن های تأیید اعتبار GitHub App را ارائه می کند شاهد افزایش ۷ برابری تأخیر نوشتن برای مجوزهای برنامه GitHub (وضعیت زرد) بود. هانلی در پست وبلاگ گفت: نرخ شکست این درخواستهای توکن تأیید ۸ تا ۱۵ درصد برای اکثر این رویدادها بود، اما برای مدت کوتاهی به ۷۶ درصد درصد رسید.
مدیر ارشد امنیتی توضیح داد:
مشکل مربوط به صدور رمز در نتیجه “اجرای ناکارآمد” یک API برای مدیریت مجوزهای برنامه GitHub بود و افزود که شرکت در حال به روز رسانی API برای بررسی تغییر وضعیت نصب است. p>
این شرکت گفت که پایگاه داده GitHub دوباره در ۱۱ مه به دلیل از دست دادن نسخه های خوانده شده مورد حمله قرار گرفت.
هانلی در پست وبلاگ گفت: «در رویدادهای پایگاه داده Git، خواندن و نوشتن Git در هسته بسیاری از سناریوهای GitHub قرار دارد، بنابراین افزایش تأخیر و خرابیها باعث میشود که گردشهای کاری GitHub Actions قادر به جمعآوری دادهها یا درخواستهایی که بهروزرسانی نمیشوند، نباشد». .
GitHub روی جلوگیری از حوادث مشابه در آینده کار می کند
به منظور جلوگیری از حوادث مشابه در آینده، هانلی گفت که شرکت روی چندین موضوع کار میکند، مانند بررسی دقیق فرآیندهای داخلی خود و انجام تنظیمات برای اطمینان از اینکه تغییرات همیشه با خیال راحتتر در حال انجام است.
هنلی گفت: «علاوه بر تجزیه و تحلیل و بررسی استاندارد پس از حادثه، ما در حال تجزیه و تحلیل وسعت تأثیر این حوادث در سراسر سرویسها هستیم تا مشخص کنیم کجا میتوانیم تأثیر خرابیهای مشابه آینده را کاهش دهیم.» و افزود که GitHub در حال کار است. برای بهبود قابلیت مشاهده الگوهای پرس و جو با هزینه بالا و حجم کم و توانایی عمومی برای تشخیص و کاهش سریع این دسته از مسائل.
اقدامات دیگر عبارتند از رسیدگی به مشکلات مربوط به خرابی پایگاه داده برای اطمینان از اینکه failover همیشه به طور کامل بدون مداخله بازیابی می شود و درک چندین تصادف خرابی پایگاه داده Git.
اگرچه این شرکت ادعا میکند که در حال کار روی رفع قطعیها است، اما GitHub در چهار ماه گذشته همچنان با اختلالاتی مواجه بوده است با چهار حادثه در آوریل، شش حادثه در ماه مارس و سه در فوریه.
پست های مرتبط
GitHub دارای مشکلات خدمات، قطعی های متعدد است
GitHub دارای مشکلات خدمات، قطعی های متعدد است
GitHub دارای مشکلات خدمات، قطعی های متعدد است