۲۹ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

GitHub دارای مشکلات خدمات، قطعی های متعدد است

پست‌های وبلاگ این شرکت نشان می‌دهد که طی چهار ماه گذشته، GitHub 16 اختلال در خدمات خود تجربه کرده است.

پست‌های وبلاگ این شرکت نشان می‌دهد که طی چهار ماه گذشته، GitHub 16 اختلال در خدمات خود تجربه کرده است.

GitHub متعلق به مایکروسافت که یک پلتفرم میزبانی کد برای کنترل نسخه و همکاری ارائه می دهد، هفته گذشته به دنبال ۱۳ مورد از این قبیل در سه ماه گذشته، با سه اختلال در خدمات خود مواجه شد.

«هفته گذشته، GitHub چندین رویداد در دسترس را تجربه کرد، چه طولانی مدت و چه مدت کوتاه تر. مایک هانلی، افسر ارشد امنیتی در GitHub، در پست وبلاگ.

«دلایل اصلی این حوادث نامرتبط بود، اما در مجموع، بر خدماتی که سازمان‌ها و توسعه‌دهندگان به GitHub اعتماد دارند، تأثیر منفی گذاشت. هانلی افزود: این قابل قبول نیست و استانداردی که ما خود را به آن می دانیم نیست.

این شرکت گفت که این سه حادثه که در تاریخ‌های ۹، ۱۰ و ۱۱ می رخ داده‌اند، بر اکثر سرویس‌های حیاتی که GitHub ارائه می‌دهد، تأثیر گذاشته است.

حوادث سرویس های مهم GitHub را از بین می برد

به گفته این شرکت، حادثه ای که در ۹ می رخ داد، پایگاه داده GitHub را به دلیل تغییر پیکربندی مختل کرد.

“در ۹ مه، ما با یک حادثه مواجه شدیم که باعث شد ۸ سرویس از ۱۰ سرویس موجود در پورتال وضعیت تحت تاثیر یک قطعی بزرگ (وضعیت قرمز) قرار بگیرند. هانلی در پست وبلاگ گفت: اکثر اوقات از کار افتادگی بیش از یک ساعت به طول انجامید.

عملی با GatsbyJS

هنلی توضیح داد که در زمان قطع، بسیاری از سرویس‌ها نمی‌توانستند داده‌های Git جدید نوشته شده را بخوانند، که باعث خرابی‌های گسترده می‌شود، و افزود که پس از قطع، یک جدول زمانی طولانی برای بازیابی پس از حادثه برخی از درخواست‌های کشش و فشار وجود دارد. .

طبق گفته هانلی، این قطعی با تغییر پیکربندی در سرویس داخلی ارائه‌دهنده داده‌های Git ایجاد شد.

“این تغییر برای جلوگیری از اشباع اتصال در نظر گرفته شده بود و قبلاً با موفقیت در جای دیگری در باطن Git معرفی شده بود. مدت کوتاهی پس از شروع عرضه، خوشه با شکست مواجه شد. ما تغییر پیکربندی را برگرداندیم و در عرض چند دقیقه تلاش کردیم که به عقب برگردیم، اما به دلیل یک خطای زیرساخت داخلی، بازگشت ناموفق بود.

حادثه در ۱۰ می، که به دلیل کاهش قابلیت صدور توکن تأیید اعتبار برنامه GitHub رخ داد، شش مورد از ده سرویس مهم GitHub را نیز تحت تأثیر قرار داد.

Aerospike برای Elasticsearch اتصال دهنده اضافه می کند تا پرس و جوهای متن کامل را اجرا کند

«در ۱۰ می، خوشه پایگاه داده ای که توکن های تأیید اعتبار GitHub App را ارائه می کند شاهد افزایش ۷ برابری تأخیر نوشتن برای مجوزهای برنامه GitHub (وضعیت زرد) بود. هانلی در پست وبلاگ گفت: نرخ شکست این درخواست‌های توکن تأیید ۸ تا ۱۵ درصد برای اکثر این رویدادها بود، اما برای مدت کوتاهی به ۷۶ درصد درصد رسید.

مدیر ارشد امنیتی توضیح داد:

مشکل مربوط به صدور رمز در نتیجه “اجرای ناکارآمد” یک API برای مدیریت مجوزهای برنامه GitHub بود و افزود که شرکت در حال به روز رسانی API برای بررسی تغییر وضعیت نصب است.

این شرکت گفت که پایگاه داده GitHub دوباره در ۱۱ مه به دلیل از دست دادن نسخه های خوانده شده مورد حمله قرار گرفت.

هانلی در پست وبلاگ گفت: «در رویدادهای پایگاه داده Git، خواندن و نوشتن Git در هسته بسیاری از سناریوهای GitHub قرار دارد، بنابراین افزایش تأخیر و خرابی‌ها باعث می‌شود که گردش‌های کاری GitHub Actions قادر به جمع‌آوری داده‌ها یا درخواست‌هایی که به‌روزرسانی نمی‌شوند، نباشد». .

GitHub روی جلوگیری از حوادث مشابه در آینده کار می کند

به منظور جلوگیری از حوادث مشابه در آینده، هانلی گفت که شرکت روی چندین موضوع کار می‌کند، مانند بررسی دقیق فرآیندهای داخلی خود و انجام تنظیمات برای اطمینان از اینکه تغییرات همیشه با خیال راحت‌تر در حال انجام است.

5 نکته که قبل از استقرار LLM باید در نظر بگیرید

هنلی گفت: «علاوه بر تجزیه و تحلیل و بررسی استاندارد پس از حادثه، ما در حال تجزیه و تحلیل وسعت تأثیر این حوادث در سراسر سرویس‌ها هستیم تا مشخص کنیم کجا می‌توانیم تأثیر خرابی‌های مشابه آینده را کاهش دهیم.» و افزود که GitHub در حال کار است. برای بهبود قابلیت مشاهده الگوهای پرس و جو با هزینه بالا و حجم کم و توانایی عمومی برای تشخیص و کاهش سریع این دسته از مسائل.

اقدامات دیگر عبارتند از رسیدگی به مشکلات مربوط به خرابی پایگاه داده برای اطمینان از اینکه failover همیشه به طور کامل بدون مداخله بازیابی می شود و درک چندین تصادف خرابی پایگاه داده Git.

اگرچه این شرکت ادعا می‌کند که در حال کار روی رفع قطعی‌ها است، اما GitHub در چهار ماه گذشته همچنان با اختلالاتی مواجه بوده است با چهار حادثه در آوریل، شش حادثه در ماه مارس و سه در فوریه.