۱ دی ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

آینده انبار داده عملیاتی

در پنج سال گذشته شاهد ظهور انبار داده ابری بوده ایم. پنج سال آینده چه خواهد شد؟

در پنج سال گذشته شاهد ظهور انبار داده ابری بوده ایم. پنج سال آینده چه خواهد شد؟

در پنج سال گذشته، ما شاهد بودیم که انبار داده‌های ابری، که نمونه آن Snowflake و BigQuery است، تبدیل به ابزاری غالب برای کسب‌وکارهای بزرگ و کوچکی شده است که نیاز به ترکیب و تجزیه و تحلیل داده‌ها دارند. موارد استفاده اولیه معمولاً پشتیبانی تصمیم گیری کلاسیک هستند. درآمد من چقدر است؟ چند مشتری دارم؟ این معیارها چگونه تغییر می کنند و چرا؟

اما قانون آهنین پایگاه‌های داده این است که داده‌ها حجم کاری را جذب می‌کنند. وقتی همه داده‌های خود را در یک مکان داشته باشید، افراد باهوش در تیم شما استفاده‌های غیرمنتظره‌ای از آن خواهند داشت. انبار داده ابری این موارد استفاده جدید را با کشش خود فعال می کند. همانطور که چیزهای جدیدی را کشف می کنید که می خواهید با داده ها انجام دهید، می توانید ظرفیت محاسباتی جدیدی را بدون محدودیت اضافه کنید.

با این حال، این بارهای کاری جدید اغلب شبیه جستارهای تحلیلی کلاسیکی نیستند که انبارهای داده برای آنها بهینه شده اند. در ۲۰ سال گذشته، انبارهای داده تجاری برای رسیدگی به تعداد کمی پرسش‌های بزرگ بهینه‌سازی شده‌اند که جداول کامل را اسکن می‌کنند و آنها را در آمار خلاصه جمع می‌کنند. آنها برای سؤالاتی مانند:

MongoDB بزرگ می شود

به خوبی بهینه شده اند

در سال گذشته، در هر ایالت، در هر ماه، چند مشتری جدید اضافه کردم؟

اما آنها برای سوالاتی مانند:

کمتر بهینه شده اند

تمام تعاملاتی که با یک مشتری خاص داشته ام چه بوده است؟

این جستارها نیاز دارند که بسیاری از منابع داده در یک مکان باشند، اما آنها فقط درصد کمی از داده ها را از هر منبع خاصی لمس می کنند. آنها هر دو ویژگی تحلیلی و عملیاتی دارند، و نمونه‌ای از بارهای کاری جدیدی هستند که می‌بینیم زیرا انبارهای داده ابری در همه جا حاضر شده‌اند.

فروشندگان عمده انبار داده در حال ایجاد تغییراتی برای پشتیبانی بهتر از این نوع جستجوها هستند. Snowflake اخیراً سرویس بهینه سازی جستجو را منتشر کرده است که به شما امکان می دهد برای داشتن فهرست در انبار داده خود. ایندکس ها در پایگاه داده های عملیاتی همه جا وجود دارند، اما در گذشته بیشتر انبارهای داده از آنها پشتیبانی نمی کردند، زیرا تصور می شد که آنها به حجم کاری تحلیلی بی ربط هستند. در همین حال، BigQuery BI Engine را منتشر کرده است که به شما امکان می دهد زیر مجموعه ای از خود را ذخیره کنید. پایگاه داده در حافظه برای دسترسی سریعتر.

Apache Spark 3.0 پشتیبانی از پردازنده گرافیکی Nvidia را برای یادگیری ماشین اضافه می کند

در طول پنج سال آینده، این موارد استفاده عملیاتی-تحلیلی بر حجم کاری انبار داده ابری تسلط خواهند داشت. انبارهای داده ابری پیشرو برای پشتیبانی بهتر از این بارهای کاری به چرخش خود ادامه خواهند داد، اما همچنین ممکن است شاهد ظهور یک معماری پایگاه داده جدید بهینه سازی شده برای این سناریو باشیم. چندین موتور پایگاه داده جدید از دنیای آکادمیک وجود دارد که نقطه جدیدی را در فضای طراحی کشف می کند که از نظر تئوری برای پرس و جوهای تحلیلی و عملیاتی و همه چیز بین آنها بهینه شده است. نمونه های قابل توجه Umbra از دانشگاه فنی مونیخ و NoisePage از Carnegie Mellon.

Neo4j 4.0 مقیاس پذیری، امنیت و عملکرد را هدف قرار می دهد

پیش‌بینی تکامل فناوری دشوار است و بسیار وابسته به مسیر است. ده سال پیش، بسیاری از مفسران هوشمند انتظار داشتند که Hadoop جایگزین انبار داده سنتی SQL شود، اما این روند با ظهور انبار داده بومی ابری به طور ناگهانی معکوس شد. اکوسیستم Hadoop بسیار کند تکامل یافت و سیستم‌های پایگاه داده تجاری جدید توانستند از ویژگی‌های منحصربه‌فرد ابر استفاده کنند تا تجربه کاربری بسیار بهتری را ارائه دهند. در ده سال آینده، رشد حجم کار عملیاتی-تحلیلی یا باعث تکامل انبار داده‌های ابری فعلی می‌شود—یا انقلابی خواهد شد.

جرج فریزر مدیر عامل Fivetran است.

New Tech Forum مکانی برای کاوش و بحث در مورد فناوری سازمانی نوظهور در عمق و وسعت بی سابقه ای فراهم می کند. انتخاب ذهنی است، بر اساس انتخاب ما از فناوری هایی که معتقدیم مهم هستند و برای خوانندگان InfoWorld بیشترین علاقه را دارند. InfoWorld وثیقه بازاریابی را برای انتشار نمی پذیرد و حق ویرایش تمام محتوای ارائه شده را برای خود محفوظ می دارد. همه سوالات را به newtechforum@infoworld.com ارسال کنید.