اختلال بزرگ در شبکه اتریوم پس از ارتقای Fusaka
بلافاصله پس از ارتقای شبکه Fusaka، شبکه اتریوم با کاهش شدید مشارکت اعتبارسنجها مواجه شد. علت این مسئله، یک باگ در کلاینت اجماع Prysm بود که باعث شد بخش قابلتوجهی از رأیها از دسترس خارج شود.
طبق دادههای شبکه در Beaconcha.in، در دوره (epoch) شماره ۴۱۱۴۴۸، شبکه تنها ۷۵ درصد مشارکت همگامسازی و ۷۴.۷ درصد مشارکت رأیدهی داشت. اگر مشارکت رأیدهی به کمتر از دو سوم اتر استیکشده برسد، شبکه اتریوم نهاییسازی (finality) خود را از دست میدهد.
به گزارش کوین تلگراف، بر اساس اطلاعیهی روز پنجشنبه Prysm، نسخه v7.0.0 این کلاینت هنگام پردازش تأییدیههای قدیمی، بهطور غیرضروری حالتهای قدیمی تولید میکرد؛ خطایی که به گفته ترنس تسائو (توسعهدهنده Prysm) مانع عملکرد صحیح نودها شده بود. توسعهدهندگان بهعنوان راهکار موقت توصیه کردند کاربران کلاینت را با دستور «–disable-last-epoch-targets» اجرا کنند.
طبق دادههای Beaconcha.in، در دوره ۴۱۱۴۴۸، مشارکت همگامسازی (نسبت نودهای انتخابشدهای که سر زنجیره را امضا میکنند) ۷۵ درصد و مشارکت رأیدهی ۷۴.۷ درصد بود. کاهش ۲۵ درصدی رأیدهی به این معناست که شبکه تنها ۹ درصد با دو سوم اکثریت لازم برای حفظ نهاییسازی فاصله داشت.
دوره فعلی شبکه اتریوم (۴۱۱۷۱۲) دوباره به ۹۹ درصد مشارکت رأیدهی و ۹۷ درصد مشارکت همگامسازی رسیده و نشان میدهد شبکه به حالت عادی برگشته است. پیش از این مشکل، اپوکهای قبلی معمولاً شاهد مشارکت رأیدهی بالای ۹۹ درصد بودند.
کاهش مشارکت تقریباً برابر با سهم اعتبارسنجهایی بود که از کلاینت Prysm استفاده میکردند؛ بهطوری که این سهم از ۲۲.۷۱ درصد در چهارشنبه، پس از حادثه به حدود ۱۸ درصد رسید. این نشان میدهد مشکل تأییدیهها عمدتاً میان اعتبارسنجهای Prysm رخ داده است.
اگر مشارکت رأیدهی به کمتر از دو سوم اتر استیکشده برسد، شبکه اتریوم نهاییسازی (finality) خود را از دست میدهد. در این شرایط، بلاکها همچنان تولید میشوند، اما زنجیره دیگر «نهاییشده» محسوب نمیشود. پیامدهای احتمالی چنین رخدادی شامل توقف پلهای لایهدو، توقف برداشت در رولآپها و افزایش تعداد تأیید بلاکها در صرافیها به دلیل افزایش ریسک بازسازماندهی زنجیره است.
این اتفاق چندان دور از ذهن نیست؛ در مه ۲۰۲۳ شبکه اصلی اتریوم دو بار طی ۲۴ ساعت نهاییسازی خود را از دست داد؛ به دلیل باگهای مربوط به پردازش تأییدیههای قدیمی در کلاینتهای Prysm و Teku است.
اگرچه پیامدها آن زمان میتوانست بسیار بدتر باشد، اما شانس با شبکه همراه بود. تیم Prysm تخمین زده بود که در سپتامبر ۲۰۲۱، این کلاینت روی بیش از دو سوم نودهای اجماع اجرا میشد. دادههای سال ۲۰۲۲ نشان میدهد Prysm روی ۶۸.۱٪ نودها فعال بوده است.
تنوع کلاینتها هنوز کافی نیست
با وجود پیشرفتهایی که از سال ۲۰۲۲ در تنوع کلاینتهای اجماع اتریوم حاصل شده، هنوز سطح امن برقرار نشده است. برای جلوگیری از ایجاد اختلال شبکه توسط یک باگ واحد، هیچ کلاینتی نباید بیش از ۳۳ درصد سهم داشته باشد. اما آمار جدید MigaLabs نشان میدهد کلاینت Lighthouse حدود ۵۲.۵۵ درصد از نودها را تشکیل میدهد و Prysm حدود ۱۸ درصد سهم دارد.
این وضعیت حتی بدتر از قبل حادثه است؛ زمانی که سهم Lighthouse کمتر از ۴۸.۵ و سهم Prysm حدود ۲۲.۷۱ درصد بود. آنتونی سَسانو، تحلیلگر اتریوم، در پست X خود نوشت: «اگر این باگ بهجای Prysm در Lighthouse رخ میداد، شبکه احتمالاً نهاییسازی را از دست میداد.»