سرویس پایگاه داده توزیعشده و مدیریتشده استارتآپ به گونهای طراحی شده است که پرس و جوها را بر اساس دادههای زمان واقعی به روشی مقرونبهصرفهتر از سیستمهای پردازش دستهای اجرا کند.
استارتآپ Materialize مستقر در نیویورک روز دوشنبه از جریان و پایگاه داده توزیعشده بهعنوان یک سرویس مدیریتشده پردهبرداری کرد که نرمافزار را قبل از در دسترس بودن عمومی به مشتریان فعلی ارائه میدهد.
این شرکت نسخه اولیه نرم افزار همنام خود را دو سال پیش به عنوان یک باینری منفرد که برای ورودی داده از کافکا طراحی شده بود، راه اندازی کرد و به کاربران اجازه می داد از SQL استاندارد برای پرس و جو و پرس و جو استفاده کنند. به داده های جریانی بپیوندید.
اکنون این شرکت – که در سال ۲۰۱۹ تأسیس شد و حدود ۱۰۰ میلیون دلار از سرمایهگذارانی مانند Lightspeed، Kleiner Perkins و Redpoint جمعآوری کرده است – میگوید که یک لایه ذخیرهسازی مقیاسپذیر در نرمافزار گنجانده است و آن را در پایگاه داده ارائه میکند. مدل -as-a-service (DBaaS). نرم افزار اصلاح شده در دسترس مشتریان فعلی است. این شرکت هنوز یک چارچوب زمانی برای در دسترس بودن عمومی اعلام نکرده است.
پایگاه داده توزیع شده پایگاهی است که روی چندین خوشه در چندین مرکز داده اجرا می شود، اما به عنوان یک پایگاه داده منطقی عمل می کند.
پایگاه داده جریانی چیست؟
پایگاه داده جریان، طبق Materialize، دادههای جریانی را از منابع مختلف جمعآوری میکند و محاسبات را برای پاسخ به سؤالات مختلف اجرا میکند.
کارل اولوفسون، معاون تحقیقات IDC گفت: ایده این است که Materialize اتصال پایگاه داده را به یک جریان داده یا جریانها برای کاربران سازمانی آسان میکند.
اولوفسون گفت: “پایگاه داده جریانی کمی اشتباه است زیرا خود پایگاه داده پخش نمی شود، اما به اندازه کافی سریع اجرا می شود تا بتواند داده های جریانی را هنگام رسیدن ضبط کند.”
این اعلامیه در زمانی است که شرکتها به دنبال تجزیه و تحلیل دادههای بیشتر و بیشتر در تلاش برای ترسیم استراتژی برای انعطافپذیری در برابر بادهای مخالف اقتصادی و عدم اطمینان ژئوپلیتیک هستند که منجر به افزایش پردازش تحلیلی آنلاین میشود (OLAP) کوئریها، ویژگیای که پایگاه داده شرکت ادعا میکند با هزینه کمتری نسبت به پایگاههای دادهای که سیستمهای پردازش دستهای را ارائه میدهند، پشتیبانی میکند.
ست ویزمن، مدیر مهندسی میدانی در Materialize گفت: کاهش هزینه توسط دو چارچوب محاسباتی در پایگاه داده امکان پذیر است. اینها Timely DataFlow، چارچوبی برای مدیریت و اجرای محاسبات جریان داده موازی، و Differential DataFlow – یکی دیگر از چارچوب های برنامه نویسی موازی داده، طراحی شده برای پردازش کارآمد و پاسخگویی به تغییرات در حجم زیاد داده است.
تاخیر و مزیت هزینه نسبت به پردازش دسته ای
معمولاً، برای ایجاد پاسخ به یک پرس و جو، یک سیستم پردازش دسته ای از طریق تمام داده هایی که به یک سیستم وارد شده است اجرا می شود و از نظر محاسبه گران می شود و همچنین پرس و جو را در زمان واقعی کمتر می کند. فرآیند.
Materialize میگوید که رابط سازگار با PostgreSQL به کاربران امکان میدهد از ابزارهای جستجویی که قبلاً استفاده میکردند استفاده کنند.
در مقابل، Materialize با استفاده از چارچوبهای محاسباتی خود، میتواند یک پرسوجو (یا «نما» در اصطلاح پایگاه داده را اجرا کند، آن را به شکل Materialized Views در حافظه پنهان نگه دارد، هر گونه تغییر تدریجی را در مجموعه داده کاربر تشخیص دهد – به جای تجزیه و تحلیل مجدد ویزمن توضیح داد که کل مجموعه داده – و نتیجه پرس و جو را به روز کنید.
هنگامی که کاربران جداول، منابع، و نماهای واقعی را ایجاد میکنند و دادهها را به آنها معرفی میکنند، نسخه DBaaS Materialize آن دادهها را ضبط و نگهداری میکند، و هم عکسهای فوری و هم جریانهای بهروزرسانی را فوراً در دسترس همه رایانههای مشترک سرویس قرار میدهد. به شرکت.
وایزمن گفت: «کاربران سازمانی ممکن است نتایج را برای خواندن سریع و با همزمانی بالا جستجو کنند، یا مشترک تغییرات معماریهای رویداد محور خالص شوند.
شرکت گفت که سرویس پایگاه داده توزیع شده مدیریت شده، در تکرار فعلی خود، از خدمات وب آمازون (AWS) S3 استفاده می کند و افزود که به زودی انتظار می رود پشتیبانی از ذخیره شی بومی در سراسر ارائه دهندگان ابری بزرگ وجود داشته باشد.
پشتیبانی از PostgreSQL
اینترفیس Materialize، طبق گفته شرکت، PostgreSQLسازگار است و با پشتیبانی کامل ANSI SQL ارائه میشود.
بر خلاف سیستمهای داده عمومی که برای جمعآوری داده نیاز به برنامهنویسی دارند، DBaaS Materialize دارای موتور جریان دادهای است که نیازی به برنامهنویسی کاربردی ندارد.
کاربران سازمانی میتوانند یک جستجوی SQL را بهعنوان یک جریان داده مدلسازی کنند که میتواند جریان ضبط دادهای را تغییر دهد، مجموعهای از تبدیلها را روی آن اعمال کند و سپس نتایج نهایی را نمایش دهد.
به گفته اولوفسون، رایجترین سیستم دادهای که برای جمعآوری دادههای جریانی استفاده میشود، Redis، بار برنامهنویسی را بر دوش کاربر سازمانی قرار میدهد زیرا بدون طرح و زبان یا زبان پرس و جو ارائه میشود.
“دو محصول وجود دارد که باید به عنوان رقبای بالقوه به آنها نگاه کرد: SingleStore (که حافظه ای بهینه سازی شده برای پایگاه های داده رابطه ای است که از جمله موارد دیگر برای جمع آوری داده های جریانی استفاده می شود) و CockroachDB اولوفسون گفت، و افزود که Hazelcast را می توان یک رقیب نیز در نظر گرفت زیرا از یک پلت فرم اشتراک گذاری داده در حافظه استفاده می کند که قابلیت های جستجو را به لیست ویژگی های خود اضافه می کند.
Materialize گفت که از مدل قیمتگذاری Snowflake پیروی میکند: شرکتها اعتبار خریداری میکنند تا هزینه نرمافزار را بر اساس استفاده بپردازند. ویزمن گفت که قیمت اعتبارها براساس مکانی است که کاربران در آن قرار دارند.
پست های مرتبط
Materialize انتشار زودهنگام پایگاه داده جریان خود را به عنوان یک سرویس ارائه می دهد
Materialize انتشار زودهنگام پایگاه داده جریان خود را به عنوان یک سرویس ارائه می دهد
Materialize انتشار زودهنگام پایگاه داده جریان خود را به عنوان یک سرویس ارائه می دهد