در پنج سال گذشته شاهد ظهور انبار داده ابری بوده ایم. پنج سال آینده چه خواهد شد؟
در پنج سال گذشته، ما شاهد بودیم که انبار دادههای ابری، که نمونه آن Snowflake و BigQuery است، تبدیل به ابزاری غالب برای کسبوکارهای بزرگ و کوچکی شده است که نیاز به ترکیب و تجزیه و تحلیل دادهها دارند. موارد استفاده اولیه معمولاً پشتیبانی تصمیم گیری کلاسیک هستند. درآمد من چقدر است؟ چند مشتری دارم؟ این معیارها چگونه تغییر می کنند و چرا؟
اما قانون آهنین پایگاههای داده این است که دادهها حجم کاری را جذب میکنند. وقتی همه دادههای خود را در یک مکان داشته باشید، افراد باهوش در تیم شما استفادههای غیرمنتظرهای از آن خواهند داشت. انبار داده ابری این موارد استفاده جدید را با کشش خود فعال می کند. همانطور که چیزهای جدیدی را کشف می کنید که می خواهید با داده ها انجام دهید، می توانید ظرفیت محاسباتی جدیدی را بدون محدودیت اضافه کنید.
با این حال، این بارهای کاری جدید اغلب شبیه جستارهای تحلیلی کلاسیکی نیستند که انبارهای داده برای آنها بهینه شده اند. در ۲۰ سال گذشته، انبارهای داده تجاری برای رسیدگی به تعداد کمی پرسشهای بزرگ بهینهسازی شدهاند که جداول کامل را اسکن میکنند و آنها را در آمار خلاصه جمع میکنند. آنها برای سؤالاتی مانند:
به خوبی بهینه شده اند
در سال گذشته، در هر ایالت، در هر ماه، چند مشتری جدید اضافه کردم؟
اما آنها برای سوالاتی مانند:
کمتر بهینه شده اند
تمام تعاملاتی که با یک مشتری خاص داشته ام چه بوده است؟
این جستارها نیاز دارند که بسیاری از منابع داده در یک مکان باشند، اما آنها فقط درصد کمی از داده ها را از هر منبع خاصی لمس می کنند. آنها هر دو ویژگی تحلیلی و عملیاتی دارند، و نمونهای از بارهای کاری جدیدی هستند که میبینیم زیرا انبارهای داده ابری در همه جا حاضر شدهاند.
فروشندگان عمده انبار داده در حال ایجاد تغییراتی برای پشتیبانی بهتر از این نوع جستجوها هستند. Snowflake اخیراً سرویس بهینه سازی جستجو را منتشر کرده است که به شما امکان می دهد برای داشتن فهرست در انبار داده خود. ایندکس ها در پایگاه داده های عملیاتی همه جا وجود دارند، اما در گذشته بیشتر انبارهای داده از آنها پشتیبانی نمی کردند، زیرا تصور می شد که آنها به حجم کاری تحلیلی بی ربط هستند. در همین حال، BigQuery BI Engine را منتشر کرده است که به شما امکان می دهد زیر مجموعه ای از خود را ذخیره کنید. پایگاه داده در حافظه برای دسترسی سریعتر.
در طول پنج سال آینده، این موارد استفاده عملیاتی-تحلیلی بر حجم کاری انبار داده ابری تسلط خواهند داشت. انبارهای داده ابری پیشرو برای پشتیبانی بهتر از این بارهای کاری به چرخش خود ادامه خواهند داد، اما همچنین ممکن است شاهد ظهور یک معماری پایگاه داده جدید بهینه سازی شده برای این سناریو باشیم. چندین موتور پایگاه داده جدید از دنیای آکادمیک وجود دارد که نقطه جدیدی را در فضای طراحی کشف می کند که از نظر تئوری برای پرس و جوهای تحلیلی و عملیاتی و همه چیز بین آنها بهینه شده است. نمونه های قابل توجه Umbra از دانشگاه فنی مونیخ و NoisePage از Carnegie Mellon.
پیشبینی تکامل فناوری دشوار است و بسیار وابسته به مسیر است. ده سال پیش، بسیاری از مفسران هوشمند انتظار داشتند که Hadoop جایگزین انبار داده سنتی SQL شود، اما این روند با ظهور انبار داده بومی ابری به طور ناگهانی معکوس شد. اکوسیستم Hadoop بسیار کند تکامل یافت و سیستمهای پایگاه داده تجاری جدید توانستند از ویژگیهای منحصربهفرد ابر استفاده کنند تا تجربه کاربری بسیار بهتری را ارائه دهند. در ده سال آینده، رشد حجم کار عملیاتی-تحلیلی یا باعث تکامل انبار دادههای ابری فعلی میشود—یا انقلابی خواهد شد.
جرج فریزر مدیر عامل Fivetran است.
—
New Tech Forum مکانی برای کاوش و بحث در مورد فناوری سازمانی نوظهور در عمق و وسعت بی سابقه ای فراهم می کند. انتخاب ذهنی است، بر اساس انتخاب ما از فناوری هایی که معتقدیم مهم هستند و برای خوانندگان InfoWorld بیشترین علاقه را دارند. InfoWorld وثیقه بازاریابی را برای انتشار نمی پذیرد و حق ویرایش تمام محتوای ارائه شده را برای خود محفوظ می دارد. همه سوالات را به newtechforum@infoworld.com ارسال کنید.
پست های مرتبط
آینده انبار داده عملیاتی
آینده انبار داده عملیاتی
آینده انبار داده عملیاتی