۲۹ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

SingleStoreDB به گروه Apache Iceberg می پیوندد

آخرین به روز رسانی شامل ادغام Iceberg، بردارهای سریعتر، جستجوی متن کامل با ارتباط بالا و مقیاس خودکار است.

آخرین به روز رسانی شامل ادغام Iceberg، بردارهای سریعتر، جستجوی متن کامل با ارتباط بالا و مقیاس خودکار است.

به دلیل تقاضای مشتری، SingleStore، شرکتی که پشت پایگاه داده ارتباطی قرار دارد SingleStoreDB، تصمیم گرفته است Apache Iceberg به پیشنهاد خود برای کمک به مشتریان سازمانی خود در استفاده از داده های ذخیره شده در داده خانه های دریاچه.

«با این ادغام جدید، SingleStore قصد دارد داده‌های غیرفعال داخل خانه‌های دریاچه را به یک دارایی با ارزش در زمان واقعی برای برنامه‌های سازمانی تبدیل کند. Dion Hinchcliffe، تحلیلگر ارشد در The Futurum Group گفت: Apache Iceberg، یک استاندارد باز محبوب برای خانه‌های داده، ذخیره‌سازی مقرون‌به‌صرفه و جستجوی مجموعه‌های داده بزرگ را به CIOها ارائه می‌دهد.

Hinchcliffe اشاره کرد که ادغام SingleStore شامل به‌روزرسانی‌هایی است که به مشتریانش کمک می‌کند تا چالش‌هایی را که معمولاً هنگام اتخاذ روش‌های سنتی برای فوری‌تر کردن داده‌ها در جداول Iceberg با آن‌ها مواجه می‌شوند دور بزنند.

این چالش‌ها شامل ETL (استخراج، تبدیل، بارگذاری) پیچیده و گسترده است. ) گردش کار و محاسبات فشرده Spark jobs.

شرکت گفت: برخی از ویژگی‌های کلیدی این ادغام عبارتند از: مصرف کم تأخیر، جریان داده‌های دوطرفه، و عملکرد در زمان واقعی با هزینه‌های کمتر.

OpenAI Rockset را برای بهبود پردازش زمان واقعی داده ChatGPT خریداری می کند

کارل اولوفسون، معاون تحقیقات IDC، در توضیح اینکه چگونه SingleStore به تأخیر کم در جستجوها و به‌روزرسانی‌ها دست می‌یابد، گفت که این شرکت —که قبلاً با نام MemSQL – یک نسخه بهینه سازی شده برای حافظه و با کارایی بالا از سیستم مدیریت پایگاه داده رابطه ای – از ویژگی های حافظه به عنوان یک مرتبه استفاده می کند. حافظه پنهان.

اولوفسون توضیح داد: «با انجام این کار، شرکت می‌تواند به طور چشمگیری سرعت جستجو و به‌روزرسانی جداول Iceberg را بهبود بخشد،» و اضافه کرد که شرکت ممکن است به طور فعال داده‌ها را از Iceberg در قالب بهینه‌سازی حافظه داخلی خود بارگیری کند.

تحلیلگر گفت:

قبل از ادغام Iceberg، SingleStore داده ها را در فرم یا قالبی نگهداری می کرد که برای جابجایی سریع در حافظه بهینه شده است، جایی که تمام پردازش داده ها انجام می شد.

چندین فروشنده پایگاه داده دیگر، به ویژه Databricks، به دلیل محبوبیت روزافزون آن در شرکت ها، تلاش کرده اند قالب جدول Apache Iceberg را اتخاذ کنند.

چرا SQL همچنان حاکم است

در اوایل این ماه، Databricks با خرید Tabular موافقت کرد. a>، فروشنده پلت فرم ذخیره سازی به رهبری سازندگان Apache Iceberg، به منظور ارتقای قابلیت همکاری داده ها در خانه های دریاچه.

یک قالب دیگر داده lakehouse — Delta Live جداول — توسعه یافته توسط Databricks و بعد باز منبع آن از طریق بنیاد لینوکس، با جداول Iceberg رقابت می کند.

در حال حاضر، شرکت در حال کار بر روی قالب دیگری که به شرکت ها امکان می دهد از جداول Iceberg و Delta Live استفاده کنند.

اولوفسون و هینچکلیف هر دو اشاره کردند که چندین فروشنده و پیشنهاد – مانند Google’s BigQuery، Starburst، Watsonx.data IBM، DataSphere SAP، Teradata، Cloudera، Dremio، Presto، Hive، Impala، StarRocks، و Doris — Iceberg را به عنوان یک قالب جدول تجزیه و تحلیل منبع باز برای مجموعه داده های بسیار بزرگ ادغام کرده اند.

ادغام بومی Iceberg در SingleStoreDB در حال حاضر در پیش نمایش عمومی است.

به روز رسانی گزینه های جستجو و استقرار

به عنوان بخشی از به‌روزرسانی‌های SingleStoreDB، این شرکت قابلیت‌های جدیدی را به ویژگی جستجوی متن کامل خود اضافه می‌کند که امتیازدهی مرتبط، شباهت آوایی، تطابق فازی و رتبه‌بندی مبتنی بر مجاورت کلمات کلیدی را بهبود می‌بخشد.

Qdrant از جستجوی ترکیبی مبتنی بر برداری برای RAG پرده برداری کرد

ترکیب این قابلیت‌ها به شرکت‌ها این امکان را می‌دهد که نیاز به پایگاه‌های اطلاعاتی تخصصی اضافی برای ساخت برنامه های مبتنی بر هوش مصنوعی مولد.

علاوه بر این، این شرکت یک ویژگی مقیاس‌پذیری خودکار را در پیش‌نمایش عمومی معرفی کرده است که به شرکت‌ها اجازه می‌دهد تا حجم کاری یا برنامه‌های کاربردی را با مقیاس‌گذاری منابع محاسباتی به بالا یا پایین مدیریت کنند.

همچنین به کاربران اجازه می‌دهد آستانه‌هایی را برای استفاده از CPU و حافظه برای مقیاس‌بندی خودکار تعریف کنند تا از مصرف غیرضروری جلوگیری شود.

علاوه بر این، این شرکت گفت که در حال معرفی یک گزینه استقرار جدید برای پایگاه داده از طریق Helios -BYOC است که یک نسخه مدیریت شده از پایگاه داده از طریق یک ابر خصوصی مجازی است.

این پیشنهاد اکنون به صورت پیش‌نمایش خصوصی در AWS در دسترس است و مشتریان سازمانی می‌توانند همزمان با رعایت سیاست‌های حاکمیتی و اقامت داده، SingleStore را در مستاجران خود اجرا کنند.