۳۰ آذر ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

Materialize انتشار زودهنگام پایگاه داده جریان خود را به عنوان یک سرویس ارائه می دهد

سرویس پایگاه داده توزیع‌شده و مدیریت‌شده استارت‌آپ به گونه‌ای طراحی شده است که پرس و جوها را بر اساس داده‌های زمان واقعی به روشی مقرون‌به‌صرفه‌تر از سیستم‌های پردازش دسته‌ای اجرا کند.

سرویس پایگاه داده توزیع‌شده و مدیریت‌شده استارت‌آپ به گونه‌ای طراحی شده است که پرس و جوها را بر اساس داده‌های زمان واقعی به روشی مقرون‌به‌صرفه‌تر از سیستم‌های پردازش دسته‌ای اجرا کند.

استارت‌آپ Materialize مستقر در نیویورک روز دوشنبه از جریان و پایگاه داده توزیع‌شده به‌عنوان یک سرویس مدیریت‌شده پرده‌برداری کرد که نرم‌افزار را قبل از در دسترس بودن عمومی به مشتریان فعلی ارائه می‌دهد.

این شرکت نسخه اولیه نرم افزار همنام خود را دو سال پیش به عنوان یک باینری منفرد که برای ورودی داده از کافکا طراحی شده بود، راه اندازی کرد و به کاربران اجازه می داد از SQL استاندارد برای پرس و جو و پرس و جو استفاده کنند. به داده های جریانی بپیوندید.

اکنون این شرکت – که در سال ۲۰۱۹ تأسیس شد و حدود ۱۰۰ میلیون دلار از سرمایه‌گذارانی مانند Lightspeed، Kleiner Perkins و Redpoint جمع‌آوری کرده است – می‌گوید که یک لایه ذخیره‌سازی مقیاس‌پذیر در نرم‌افزار گنجانده است و آن را در پایگاه داده ارائه می‌کند. مدل -as-a-service (DBaaS). نرم افزار اصلاح شده در دسترس مشتریان فعلی است. این شرکت هنوز یک چارچوب زمانی برای در دسترس بودن عمومی اعلام نکرده است.

پایگاه داده توزیع شده پایگاهی است که روی چندین خوشه در چندین مرکز داده اجرا می شود، اما به عنوان یک پایگاه داده منطقی عمل می کند.

پایگاه داده جریانی چیست؟

پایگاه داده جریان، طبق Materialize، داده‌های جریانی را از منابع مختلف جمع‌آوری می‌کند و محاسبات را برای پاسخ به سؤالات مختلف اجرا می‌کند.

CockroachDB اکنون از Microsoft Azure، استقرار چند منطقه ای پشتیبانی می کند

کارل اولوفسون، معاون تحقیقات IDC گفت: ایده این است که Materialize اتصال پایگاه داده را به یک جریان داده یا جریان‌ها برای کاربران سازمانی آسان می‌کند.

اولوفسون گفت: “پایگاه داده جریانی کمی اشتباه است زیرا خود پایگاه داده پخش نمی شود، اما به اندازه کافی سریع اجرا می شود تا بتواند داده های جریانی را هنگام رسیدن ضبط کند.”

این اعلامیه در زمانی است که شرکت‌ها به دنبال تجزیه و تحلیل داده‌های بیشتر و بیشتر در تلاش برای ترسیم استراتژی برای انعطاف‌پذیری در برابر بادهای مخالف اقتصادی و عدم اطمینان ژئوپلیتیک هستند که منجر به افزایش پردازش تحلیلی آنلاین می‌شود (OLAP) کوئری‌ها، ویژگی‌ای که پایگاه داده شرکت ادعا می‌کند با هزینه کمتری نسبت به پایگاه‌های داده‌ای که سیستم‌های پردازش دسته‌ای را ارائه می‌دهند، پشتیبانی می‌کند.

ست ویزمن، مدیر مهندسی میدانی در Materialize گفت: کاهش هزینه توسط دو چارچوب محاسباتی در پایگاه داده امکان پذیر است. اینها Timely DataFlow، چارچوبی برای مدیریت و اجرای محاسبات جریان داده موازی، و Differential DataFlow – یکی دیگر از چارچوب های برنامه نویسی موازی داده، طراحی شده برای پردازش کارآمد و پاسخگویی به تغییرات در حجم زیاد داده است.

تاخیر و مزیت هزینه نسبت به پردازش دسته ای

معمولاً، برای ایجاد پاسخ به یک پرس و جو، یک سیستم پردازش دسته ای از طریق تمام داده هایی که به یک سیستم وارد شده است اجرا می شود و از نظر محاسبه گران می شود و همچنین پرس و جو را در زمان واقعی کمتر می کند. فرآیند.

نحوه استفاده از GPT-4 با داده های جریانی برای هوش مصنوعی مولد بلادرنگ

materialize diagram light

Materialize می‌گوید که رابط سازگار با PostgreSQL به کاربران امکان می‌دهد از ابزارهای جستجویی که قبلاً استفاده می‌کردند استفاده کنند.

در مقابل، Materialize با استفاده از چارچوب‌های محاسباتی خود، می‌تواند یک پرس‌وجو (یا «نما» در اصطلاح پایگاه داده را اجرا کند، آن را به شکل Materialized Views در حافظه پنهان نگه دارد، هر گونه تغییر تدریجی را در مجموعه داده کاربر تشخیص دهد – به جای تجزیه و تحلیل مجدد ویزمن توضیح داد که کل مجموعه داده – و نتیجه پرس و جو را به روز کنید.

هنگامی که کاربران جداول، منابع، و نماهای واقعی را ایجاد می‌کنند و داده‌ها را به آنها معرفی می‌کنند، نسخه DBaaS Materialize آن داده‌ها را ضبط و نگهداری می‌کند، و هم عکس‌های فوری و هم جریان‌های به‌روزرسانی را فوراً در دسترس همه رایانه‌های مشترک سرویس قرار می‌دهد. به شرکت.

وایزمن گفت: «کاربران سازمانی ممکن است نتایج را برای خواندن سریع و با همزمانی بالا جستجو کنند، یا مشترک تغییرات معماری‌های رویداد محور خالص شوند.

شرکت گفت که سرویس پایگاه داده توزیع شده مدیریت شده، در تکرار فعلی خود، از خدمات وب آمازون (AWS) S3 استفاده می کند و افزود که به زودی انتظار می رود پشتیبانی از ذخیره شی بومی در سراسر ارائه دهندگان ابری بزرگ وجود داشته باشد.

پشتیبانی از PostgreSQL

اینترفیس Materialize، طبق گفته شرکت، PostgreSQLسازگار است و با پشتیبانی کامل ANSI SQL ارائه می‌شود.

موتور سری زمانی نسل بعدی InfluxDB بر روی Rust ساخته شده است و از SQL پشتیبانی می کند

بر خلاف سیستم‌های داده عمومی که برای جمع‌آوری داده نیاز به برنامه‌نویسی دارند، DBaaS Materialize دارای موتور جریان داده‌ای است که نیازی به برنامه‌نویسی کاربردی ندارد.

کاربران سازمانی می‌توانند یک جستجوی SQL را به‌عنوان یک جریان داده مدل‌سازی کنند که می‌تواند جریان ضبط داده‌ای را تغییر دهد، مجموعه‌ای از تبدیل‌ها را روی آن اعمال کند و سپس نتایج نهایی را نمایش دهد.

به گفته اولوفسون، رایج‌ترین سیستم داده‌ای که برای جمع‌آوری داده‌های جریانی استفاده می‌شود، Redis، بار برنامه‌نویسی را بر دوش کاربر سازمانی قرار می‌دهد زیرا بدون طرح و زبان یا زبان پرس و جو ارائه می‌شود.

“دو محصول وجود دارد که باید به عنوان رقبای بالقوه به آنها نگاه کرد: SingleStore (که حافظه ای بهینه سازی شده برای پایگاه های داده رابطه ای است که از جمله موارد دیگر برای جمع آوری داده های جریانی استفاده می شود) و CockroachDB اولوفسون گفت، و افزود که Hazelcast را می توان یک رقیب نیز در نظر گرفت زیرا از یک پلت فرم اشتراک گذاری داده در حافظه استفاده می کند که قابلیت های جستجو را به لیست ویژگی های خود اضافه می کند.

Materialize گفت که از مدل قیمت‌گذاری Snowflake پیروی می‌کند: شرکت‌ها اعتبار خریداری می‌کنند تا هزینه نرم‌افزار را بر اساس استفاده بپردازند. ویزمن گفت که قیمت اعتبارها براساس مکانی است که کاربران در آن قرار دارند.