سرویس جدید lakehouse که برای بارگیری و جستجوی سریع تا ۴۰۰ ترابایت داده طراحی شده است، با پیشنهادات رقبای اوراکل که از مفهوم lakehouse نیز استفاده کرده اند، از جمله Snowflake، Google، AWS و Microsoft Azure رقابت خواهد کرد.
در تلاشی برای رقابت با رقبای خود در خدمات ابری و کمک به شرکتها برای ایجاد ارزش تجاری بیشتر از دادههای انباشتهشده خود، اوراکل روز سهشنبه با ارائه سرویس MySQL HeatWave Lakehouse به گروه داده lakehouse ملحق شد.
MySQL HeatWave Lakehouse که در کنفرانس Oracle CloudWorld معرفی شد، در حال حاضر به صورت بتا در دسترس است و انتظار می رود در نیمه اول سال ۲۰۲۳ به طور کلی در دسترس قرار گیرد. برای بارگیری سریع و جستجوی سریع تا ۴۰۰ ترابایت داده طراحی شده است، در حالی که خوشه HeatWave Oracle گفت که می تواند تا ۵۱۲ گره را مقیاس کند.
همانطور که از نام پیداست، یک data lakehouse یک معماری است که مزایای یک انبار داده را ترکیب میکند – مانند مدیریت ساختار دادهها و عملکرد پردازش، از جمله پشتیبانی از قالبهای جدول، مدیریت ابرداده، و تراکنشی. بهروزرسانیها و حذفها — با مزایای کم هزینه و چابکی دریاچه داده.
مت آسلت، معاون پژوهشی در Ventana Research گفت: مفهوم معماری lakehouse محبوبیت پیدا کرده است، به ویژه در بین شرکت هایی که در یک دریاچه داده سرمایه گذاری کرده اند.
آسلت گفت: “تا سال ۲۰۲۴، بیش از سه چهارم از پذیرندگان فعلی دریاچه های داده در فناوری های خانه دریاچه داده سرمایه گذاری خواهند کرد.”
رقبای Oracle از جمله Snowflake، Databricks، Teradata، Dremio، Google، AWS و Microsoft Azure دارای همه نوعی از مفهوم lakehouse داده را معرفی کردند.
بر اساس گزارشی از Ventana، دریاچههای داده خود به بخش مهمی از دادههای تحلیلی برای بسیاری از شرکتها تبدیل شدهاند.
دریاچههای داده از زمانی که فروشندگان شروع به ارائه یک ذخیرهسازی شی ابری بهعنوان مخزن دادههای زیربنایی کردند، اهمیت پیدا کردند، که مفهوم دریاچه را به روشی نسبتاً ارزان برای ذخیره حجم زیادی از دادهها از برنامهها و بارهای کاری متعدد سازمانی تبدیل میکند. آسلت توضیح داد که این موضوع برای داده های نیمه ساختاریافته و بدون ساختار که برای ذخیره و پردازش در یک انبار داده مناسب نیستند، بیشتر مرتبط است.
شرکت تحقیقات بازار گفت که بیش از نیمی (۵۳٪) از شرکت کنندگان در نظرسنجی Analytics & Data Benchmark’s Ventana Research گفتند که از ذخیره سازی اشیا در تلاش های تحلیلی خود استفاده می کنند و افزود که ۲۹٪ دیگر نیز در حال ارزیابی یا برنامه ریزی هستند. این کار را انجام دهید.
Lakehouse از چندین فرمت فایل پشتیبانی می کند
MySQL HeatWave Lakehouse، جدیدترین افزوده شده به سرویس ابری MySQL HeatWave Oracle برای تجزیه و تحلیل و بارهای کاری ترکیبی، به شرکتها اجازه میدهد تا دادهها را در قالبهای فایل، مانند CSV و Parquet، و همچنین پشتیبانگیری Aurora و Redshift از AWS.
این بدان معناست که شرکتها میتوانند از MySQL HeatWave حتی زمانی که دادههای آنها در پایگاه داده MySQL ذخیره نمیشود استفاده کنند.
سرویس جدید به شرکتها اجازه میدهد تا دادههای پردازش تراکنش آنلاین (OLTP) خود را که در پایگاه داده MySQL ذخیره شده است، پرس و جو کنند و آنها را با دادههای ذخیرهشده در شی ذخیرهسازی با استفاده از نحو استاندارد MySQL ترکیب کنند.
این شرکت در بیانیهای گفت: «هر تغییری که در دادههای OLTP ایجاد شود در زمان واقعی بهروزرسانی میشود و در نتیجه جستجو منعکس میشود».
Oracle گفت: کل مجموعه MySQL HeatWave در چندین ارائه دهنده خدمات ابری از جمله Oracle Cloud Infrastructure (OCI)، AWS و Microsoft Azure نیز در دسترس قرار گرفته است.
اتوماسیون مبتنی بر یادگیری ماشین با MySQL Autopilot
MySQL HeatWave Lakehouse Oracle با پشتیبانی از MySQL Autopilot که در آگوست ۲۰۲۱ به عنوان بخشی از پرتفولیوی HeatWave، و از یادگیری ماشینی برای تسریع عملکرد و مقیاس پذیری پرس و جو استفاده می کند.
شرکت گفت:
برخی از ویژگیهای موجود MySQL Autopilot مانند ارائه خودکار و طرح جستجوی خودکار، برای پشتیبانی از عملکرد بهتر در سرویس lakehouse بهبود یافتهاند.
قابلیتهای جدید MySQL Autopilot طراحیشده برای lakehouse شامل استنتاج طرح خودکار، نمونهگیری تطبیقی داده، بارگذاری خودکار و جریان داده تطبیقی است.
استنتاج طرحواره خودکار بهعنوان یک ویژگی به Autopilot اجازه میدهد تا به طور خودکار نگاشت دادههای فایل را به انواع داده در پایگاه داده استنباط کند—و این بدان معناست که کاربران سازمانی نیازی به تعیین دستی نگاشت برای هر فایل جدید برای جستجو توسط MySQL ندارند. شرکت HeatWave Lakehouse گفت.
برای بهبود عملکرد پرس و جو، Autopilot از نمونهگیری دادههای تطبیقی استفاده میکند و آمار را با حداقل دسترسی به داده جمعآوری میکند. MySQL HeatWave از این آمار برای تولید و بهبود طرحهای پرس و جو، تعیین نقشه بهینه طرحواره و اهداف دیگر استفاده میکند.
Oracle گفت:
جریان داده تطبیقی توسط Autopilot برای ایجاد حداکثر عملکرد موجود از زیرساخت ابر زیرین استفاده میشود که عملکرد کلی و در دسترس بودن را بهبود میبخشد.
پیشرفتهای اضافی در مجموعه MySQL HeatWave شامل پشتیبانی از مدلهای پیشبینی، یک بهینهساز جستجوی جدید و پشتیبانی بهروز از افزونه کد VS است.
“دانشمندان داده اکنون میتوانند بر مراحل مختلف خط لوله آموزش خودکار HeatWave ML، از جمله انتخاب الگوریتم، انتخاب ویژگی، معیار امتیازدهی، و تکنیک توضیح تأثیر بگذارند. اوراکل گفت و اضافه کرد که HeatWave ML بهروزرسانی شده است تا امکان واردات مدلهای یادگیری ماشین به HeatWave را فراهم کند.
آیا اوراکل شهرت ارائه دهنده گران قیمت را از بین خواهد برد؟
تونی بائر، تحلیلگر اصلی در شرکت تحقیقات بازار dbInsight، گفت: اعلان lakehouse را می توان به عنوان استراتژی گسترده تر اوراکل برای معکوس کردن شهرت خود به عنوان یک ارائه دهنده پر هزینه در نظر گرفت.
Baer توضیح داد: «استراتژی Oracle برای معکوس کردن شهرت خود در این زمینه با فناوری me-too نیست، بلکه با موتورهای پایگاه داده بهینهسازی شده است که بهتر از رقبا عمل میکنند.
با این حال، او هشدار داد که اکثر فروشندگان نیز در حال غواصی در فضای دریاچه هستند.
بائر گفت: «تحرک بیشتر در سمت فروشنده است تا مشتری، اما این موردی است که به جایی میرود که توپ هاکی میرود بر خلاف جایی که امروز است. او افزود: «این شرکت تنها در صورتی میتواند مشتری اصلی خود را به سمت دریاچهها بیاورد که پایگاههای اطلاعاتی پرچمدار اوراکل از آن بهره ببرند.»
Oracle ادعا میکند که مشتریانی که از AWS، Google و زیرساختهای داخلی مهاجرت میکنند از MySQL HeatWave برای مجموعه گستردهای از برنامهها از جمله تجزیه و تحلیل بازاریابی، تجزیه و تحلیل زمان واقعی عملکرد کمپین تبلیغاتی و تجزیه و تحلیل دادههای مشتری استفاده میکنند.
مشتریانی که از AWS مهاجرت کردهاند شامل شرکتهایی در صنعت خودرو، ارتباطات راه دور، خردهفروشی، فناوری پیشرفته و مراقبتهای بهداشتی هستند.
به گفته بائر، در همین حال، پدیده افزایش تعداد فروشندگانی که معماری خانههای دریاچه را ارائه میکنند، میتواند به نفع Oracle باشد.
“با توجه به اینکه منبع باز در حال افزایش است، و برای Oracle، MySQL HeatWave در مورد دسترسی به مخاطبان جدید است، پرش به روی bandwagon می تواند HeatWave را در دسترس تر کند، زیرا در سطح جدول، هیچ موردی وجود نخواهد داشت. بائر گفت.
این به عواملی نیز بستگی دارد، مانند اینکه آیا فرمتهای منبع باز، یعنی دریاچه دلتا، آپاچی کوه یخ، یا احتمالاً آپاچی هودی، به عنوان استاندارد واقعی برای Baer اضافه کرد، خانههای دریاچهای مدرن.
پست های مرتبط
اوراکل MySQL HeatWave Lakehouse را برای مقابله با رقبا معرفی کرد
اوراکل MySQL HeatWave Lakehouse را برای مقابله با رقبا معرفی کرد
اوراکل MySQL HeatWave Lakehouse را برای مقابله با رقبا معرفی کرد