۱ دی ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

از کدام پایگاه داده ابری باید استفاده کنید؟

مروری بر نقاط قوت و ضعف سیستم های مدیریت پایگاه داده ابری امروزی.

مروری بر نقاط قوت و ضعف سیستم های مدیریت پایگاه داده ابری امروزی.

اصل اساسی سیستم های ابری تمرکز بر ماشین های چندگانه، یکبار مصرف و قابل تعویض است. این پیامدهای مستقیمی برای تکنیک‌های پیاده‌سازی و در نتیجه قابلیت‌های سیستم‌های پایگاه داده پیاده‌سازی شده در ابر دارد.

پایگاه‌های اطلاعاتی سنتی را می‌توان تقریباً به‌عنوان اول موازی (مثلاً MongoDB یا Teradata) یا ابتدا یک سیستم (مثلاً PostgreSQL یا MySQL) طبقه‌بندی کرد، اغلب با مقیاس بعدی (مثلاً Redshift، Greenplum). هر دسته دارای محدودیت های ذاتی در طراحی اصلی خود است. میزان این محدودیت ها تا حدی تابع بلوغ است. با این حال، برای برخی از تصمیمات اصلی معماری، ویژگی های خاص ممکن است به طور موثر قابل پشتیبانی نباشند.

به عنوان مثال، Greenplum دارای توالی است، اما Redshift ندارد، با وجود اینکه هر دو مشتق PostgreSQL هستند. BigQuery هیچ دنباله ای ندارد، اما Teradata دارد (اگرچه آنها واقعاً ترتیبی نیستند، به معنای سنتی).

پایگاه‌های اطلاعاتی ابری در دسته‌های مشابهی قرار می‌گیرند، با یک سوگیری متمایز نسبت به موازی اول برای سیستم‌های جدید. ویژگی های اساسی سیستم های ابری موازی بودن برای مقیاس و قابلیت جایگزینی ماشین ها است.

در دسته اول سیستم تک، نمونه‌های ابری تمایل دارند بر هزینه مدیریت‌شده، ارتقاء و قابلیت اطمینان (RPO/RTO) محصول تک‌دستگاه سنتی، مانند Heroku PostgreSQL، Amazon Aurora (PostgreSQL/MySQL) تمرکز کنند. ، Google Cloud SQL (PostgreSQL/MySQL) و Azure SQL (SQL Server).

در دسته موازی، عملاً دو زیرمجموعه وجود دارد: دسته SQL/رابطه ای (BigQuery، Snowflake، Redshift، Spark، Azure Synapse) و DHT/NoSQL (BigTable، Dynamo، Cassandra، Redis). این تمایز کمتر به وجود یا عدم وجود یک زبان شبیه به SQL مربوط می شود و بیشتر به این بستگی دارد که آیا طرح فیزیکی داده ها در سیستم برای دسترسی تک ردیفی با هش کردن برای جستجوهای سریع روی یک کلید تنظیم شده است یا انبوه. با استفاده از عملیات مرتب سازی ادغام و فیلتر دسترسی داشته باشید.

پایگاه داده های رابطه ای اول موازی اغلب به یک یا چند سیستم ذخیره سازی ابری بومی متکی هستند. این سیستم‌های ذخیره‌سازی همیشه ابتدا موازی ساخته می‌شوند و یک API get-object/put-object بسیار محدود را در معرض دید قرار می‌دهند، که معمولاً امکان پارتیشن‌بندی داده‌ها را فراهم می‌کند، اما دسترسی تصادفی با کارایی بالا را اجازه نمی‌دهد. این توانایی پایگاه داده را برای پیاده سازی ساختارهای داده پایدار پیشرفته مانند نمایه ها، یا در بسیاری موارد، داده های قابل تغییر محدود می کند.

در اینجا چیزی است که AWS در مورد استراتژی هوش مصنوعی خود در re:Invent 2023 فاش کرد

در نتیجه، پیاده‌سازی‌های ابری با استفاده از ذخیره‌سازی بومی به جای شاخص‌ها، بر خواندن و نوشتن متوالی ریزپارتیشن‌ها متکی هستند. بر اساس نام شی، دقیقاً یک مسیر دسترسی فیزیکی به یک شی در سطح ذخیره سازی وجود دارد. شاخص‌ها باید به‌صورت خارجی در فضای ذخیره‌سازی زیربنایی پیاده‌سازی شوند، و حتی وقتی این کار انجام شود، API ذخیره‌سازی ابری زیربنایی ممکن است استفاده عملی از یک آدرس یا بایت آفست را در یک شی در سطح ذخیره‌سازی سخت کند.

نقاط قوت ابر

زیرساخت برای شما مدیریت می‌شود. در فضای ابری، استقرار، قابلیت اطمینان و مدیریت مشکل شخص دیگری است. همه لایه‌های پشته، از نیرو، نصب نرم‌افزار، و سخت‌افزار گرفته تا مدیریت و امنیت سیستم‌عامل (از سخت‌سازی تا تشخیص نفوذ) توسط فروشنده ابر مدیریت می‌شوند.

راحتی پیشنهادات آزمایشی رایگان فروشنده ابری برای راه‌اندازی و اجرای آزمایش‌های اولیه و سپس در صورت نیاز به مقیاس بزرگ، چیزی است که در بهترین حالت در سیستم‌های سنتی اولیه دشوار است.

یک مزیت دیگر این است که فروشندگان ابری فرآیندهای استاندارد شده زیادی را برای ادغام با محصولات SaaS شخص ثالث ارائه می دهند. نتیجه این است که فروشنده ابری زیرساخت را به مشکل دیگران تبدیل می کند تا بتوانید روی کسب و کار اصلی خود تمرکز کنید.

کارایی. ابر با به حداکثر رساندن استفاده از منابع زندگی می کند. برای یک سیستم ابری بسیار رایج است که کنترل های استفاده از منابع را در اختیار برنامه پایگاه داده قرار دهد تا برای یک سیستم غیر ابری. بار را می توان هموار کرد، به شکاف های زمانی کم تقاضا منتقل کرد و مشاغل تعاملی و حیاتی تجاری را می توان اولویت بندی کرد.

البته فروشندگان ابری می توانند از کارایی خرید در مقیاس، اشتراک بار و نسبت های استفاده بسیار بالا استفاده کنند. این استدلال‌های مقیاس به تنهایی می‌توانند برای انتقال به ابر مفید باشند. چه رسد به مزایای استفاده از تخصص فروشنده برای سخت شدن و تشخیص نفوذ.

توسعه وب تمام پشته با HTMX و Bun، قسمت 1: Elysia و MongoDB

ارتباط نزدیک با مقیاس، توانایی فروشندگان ابری برای ارائه ارزان ذخیره سازی غیرفعال است، که حفظ پنجره های تاریخی طولانی تری از داده ها را آسان تر می کند، چه به دلایل تجربی یا تحلیلی، یا برای پشتیبان گیری یا ممیزی، و مقرون به صرفه تر باشد. ویژگی‌هایی مانند سفر در زمان را اجرا کنید، جایی که داده‌ها ممکن است از دیدگاه تاریخی بررسی شوند.

و البته، بارهای سنگین پردازش داده را می توان با کوچک کردن موقت با استفاده از مقیاس فروشنده ابری (البته با هزینه برای کاربر) حل کرد.

اقتصاد. جدای از صرفه مقیاس و کارایی، مکانیسم‌های حسابداری فروشندگان ابری تمایل دارند داده‌های هزینه ذخیره‌سازی و پردازش را تا سطح پرس و جو فردی نشان دهند. این به کاربر اجازه می‌دهد تا یک تصمیم منطقی تجاری در مورد هزینه و فایده هر بخش از تجزیه و تحلیل بگیرد و بر این اساس تصمیمات بهینه‌سازی را اتخاذ کند. در واقع، گاهی اوقات کسب و کار ممکن است تصمیم بگیرد که استفاده از مقیاس ابر برای بزرگ‌تر و «ساده‌نگر بودن» در نحوه ساختار تجزیه و تحلیل به جای صرف زمان و انرژی ذهنی برای ساختن یک «تحلیل قوی» ارزان‌تر است (تحلیلی که ارزان‌تر است. و شاید دقیق تر).

نقاط ضعف ابر

زیرساخت برای شما مدیریت می‌شود. ابر مجموعه‌ای از دامنه‌های خرابی بسیار متفاوتی از، به‌عنوان مثال، سری Z دارد. محاسبات توزیع شده بر روی ابر، که یک بستر مشترک (محاسبات، ذخیره سازی، شبکه) است، در معرض اختلالات بسیار بیشتری است و هر یک از این موارد ممکن است باعث شکست تعامل یا شکست کاری گذرا شود. حتی مدیریت خودکار توسط یک فروشنده ابری می‌تواند در موارد نادر، با تغییر ویژگی‌ها یا رفتار یک سیستم، بر تجربه مشتری تأثیر منفی بگذارد.

کارایی. بیشتر پایگاه‌های داده ابری در مقایسه با سیستم‌های سنتی اولیه هنوز نابالغ هستند. پایگاه داده های ابری فاقد ویژگی های محصولات بالغ تر هستند. برخی از ویژگی ها ممکن است هرگز معرفی نشوند زیرا مفهوم یک پلت فرم کاملاً توزیع شده و مستعد شکست آنها را غیرعملی می کند.

راز کوچک کثیف در مورد محاسبات لبه

بسیاری از سیستم‌های رابطه‌ای موازی مبتنی بر ابر، کارایی بسیار پایین‌تری برای عملیات‌های جهش پایگاه داده خاص (INSERT، UPDATE، DELETE) کاهش می‌دهند. می تواند در موارد استفاده خاص مشکل ایجاد کند.

البته تأخیر اضافی بین سیستم‌های ابری و داخلی یا سیستم‌هایی که در ابرهای دیگر میزبانی می‌شوند، باعث ادغام زیرساخت‌های ابری می‌شود. معمولاً کاربران مجبور می‌شوند ابتدا یک مکان جغرافیایی و ارائه‌دهنده را انتخاب کنند و سپس عملاً به خدمات درون آن ارائه‌دهنده محدود می‌شوند.

اقتصاد. هزینه ابر از منحنی بسیار متفاوتی نسبت به استقرار در محل پیروی می کند: افزایش ظرفیت بسیار آسان است. آنقدر آسان است که کنترل هزینه دشوارتر می شود. از سوی دیگر، اگر هزینه محدود شده باشد، مشاغل تعاملی که پس از رسیدن به سقف هزینه ارسال می شوند ممکن است رد شوند. این یک لایه پیچیدگی را اضافه می کند که مدیران پایگاه داده سنتی برای ایجاد یک استقرار موفقیت آمیز باید یاد بگیرند.

و البته، قفل شدن فروشنده در فضای ابری به اندازه جاهای دیگر رایج است. مهاجرت بین ابرها آسان تر از مهاجرت بین سیستم های داخلی نیست.

پیشنهادات بسیار زیادی برای انتخاب وجود دارد و هیچ پیشنهاد واحدی همه ویژگی ها را ندارد. مهمترین گام‌های اولیه شناسایی ویژگی‌ها یا رفتارهای اساسی همه گردش‌های کاری مورد نیاز، و اطمینان از اینکه فروشنده ابری انتخاب شده توانایی ارائه همه آنها را دارد – به طور بالقوه هر رفتار از یک محصول متفاوت، اما حداقل یکپارچه ضعیف از محصول آنهاست. سوئیت انتظار نداشته باشید که یک محصول واحد مانند Oracle یا Teradata را ببینید که “همه کارها” را نسبت به قیمت انجام می دهد.

Shevek مدیر ارشد فناوری CompilerWorks است.

New Tech Forum مکانی برای کاوش و بحث در مورد فناوری سازمانی نوظهور در عمق و وسعت بی سابقه ای فراهم می کند. انتخاب ذهنی است، بر اساس انتخاب ما از فناوری هایی که معتقدیم مهم هستند و برای خوانندگان InfoWorld بیشترین علاقه را دارند. InfoWorld وثیقه بازاریابی را برای انتشار نمی پذیرد و حق ویرایش تمام محتوای ارائه شده را برای خود محفوظ می دارد. همه سوالات را به newtechforum@infoworld.com ارسال کنید.