Snowflake با برنامه خود برای تبدیل کاتالوگ داده Polaris خود به صورت منبع باز، امیدوار است که این پیشنهاد جدید به عنوان یک فروشنده خنثی دیده شود و جذابیت آن را در مقایسه با Databricks’ Unity Catalog افزایش دهد.
تحلیلگران گفتند که Snowflake می گوید کد منبع را برای کاتالوگ Polaris جدید خود باز می کند، استراتژی که نشان می دهد می خواهد کاربران کاتالوگ داده را از کاتالوگ Unity رقیب Databricks جذب کند و در عین حال جذابیت پیشنهاد خود را تقویت کند. p>
«حرکت راهاندازی کاتالوگ Polaris پاسخی رقابتی به کاتالوگ Unity Databricks ارائه میکند، Jayesh Chaurasia، تحلیلگر در شرکت خدمات مشاوره و تحقیقات Forrester، گفت: در نتیجه ارزش پیشنهادی Snowflake را افزایش میدهد، طیف وسیعتری از مشتریان را جذب میکند، و جامعه پر جنب و جوشی را در اطراف کاتالوگ داده جدید تقویت میکند.
چگونه کاتالوگ Polaris با کاتالوگ Unity Databricks متفاوت است
کاتالوگ Unity Databricks که به طور کلی در ژوئن ۲۰۲۲ در دسترس قرار گرفت و بعدا با قابلیت های Okera در سال بعد به روز شد، یک یکپارچه منبع بسته است. پیشنهادی حاکمیت که قابلیتهای کنترل دسترسی متمرکز، حسابرسی، اصل و نسب و کشف دادهها را در سراسر فضاهای کاری Databricks فراهم میکند.
کاتالوگ Polaris که در طول کنفرانس سالانه Snowflake این هفته منتشر شد، قابلیتهای مشابهی را با Unity Catalog ارائه میکند، اما در قالب جدول داده منبع باز محبوب Apache Iceberg ساخته شده است. . نیاز به دسترسی به یک پیشنهاد فروشنده خنثی است که با قابلیتهای حاکمیت داده همراه باشد و از موتورهای پرس و جوی متقابل پشتیبانی کند.
Snowflake در بیانیه ای گفت: «با کاتالوگ Polaris، کاربران اکنون یک مکان متمرکز و واحد برای هر موتوری برای یافتن و دسترسی به جداول Iceberg سازمان با امنیت ثابت و قابلیت همکاری کامل و باز به دست می آورند. پروتکل منبع باز REST، که استانداردی باز برای کاربران برای دسترسی و بازیابی داده ها از هر موتوری که از Iceberg Rest API پشتیبانی می کند، از جمله Apache Flink، Apache Spark، Dremio، Python و Trino در میان دیگران.
به گفته Chaurasia، پیچیدگی و تنوع سیستمهای داده، همراه با تمایل جهانی سازمانها به استفاده از هوش مصنوعی، استفاده از فهرست دادههای قابل همکاری را ضروری میسازد که احتمالاً طبیعتاً منبع باز است.
“یک کاتالوگ داده منبع باز به قابلیت همکاری و سایر نیازها، مانند مقیاس پذیری، می پردازد، به خصوص اگر بر روی قالب جدول محبوبی مانند Iceberg ساخته شده باشد. Chaurasia گفت: این رویکرد مدیریت داده ها را در پلتفرم های مختلف و محیط های ابری تسهیل می کند.
به طور جداگانه، استوارت باند، معاون تحقیقات شرکت تحقیقات بازار IDC، اشاره کرد که کاتالوگ Polaris ممکن است از کاتالوگهای کوه یخ و قابلیتهای درجه سازمانی به آن اضافه شده است، مانند مدیریت چندین نمونه توزیع شده از مخازن Iceberg، ارائه سلسله دادهها، قابلیت جستجو برای ابزارهای داده، و قابلیتهای توصیف داده در میان سایر موارد.
کاتالوگ Polaris، که Snowflake انتظار دارد در ۹۰ روز آینده منبع باز شود، میتواند در AI Data Cloud اختصاصی خود میزبانی شود یا میتواند در زیرساخت خود یک شرکت با استفاده از کانتینرها مانند Docker یا Kubernetes.
«از آنجایی که پیادهسازی بکاند Polaris کاتالوگ منبع باز خواهد بود، سازمانها میتوانند آزادانه زیرساخت میزبانی را با حفظ تمام کنترلهای امنیتی و حذف قفل فروشندهها، تعویض کنند،» و افزود که کاتالوگ Polaris در درون ابر دادههای هوش مصنوعی Snowflake در حال حاضر در دسترس است. پیش نمایش عمومی.
آیا بلیت Polaris Snowflake برای جلب حسن نیت جامعه است؟
در حالی که کارشناسانی مانند Forrester’s Chaurasia و dbInsight’s Tony Baer فکر می کنند که کاتالوگ Polaris یک استراتژی توسعه یافته برای شرکت برای گسترش دامنه دسترسی به مشتریان جدید است، استیون دیکنز، معاون تحقیقات گروه Futurum فکر می کند که این یک تلاش “ناامیدکننده” است. از مشتریان و جامعه منبع باز “خوبیت” به دست آورید.
طبق گفته دیکنز، کاتالوگ دادهای که به زودی منبع باز میشود، پیامد مستقیم کاستیها و محدودیتهای Snowflake است، از جمله قابلیت همکاری ضعیف، قفل شدن فروشنده، هزینههای گزاف، فقدان نوآوری و وابستگی به مشارکت .
“Snowflake بسیار گران است و ساختار هزینه آن بسیاری از مشتریان را به جستجوی جایگزین سوق داده است. دیکنز گفت: Polaris را می توان به عنوان آخرین تلاش برای حفظ مشتریان با ارائه یک جایگزین بالقوه ارزان تر و منبع باز در نظر گرفت.
علاوه بر این، دیکنز حرکت Snowflake به کاتالوگ منبع باز Polaris را راهی برای مقابله با “سرعت توسعه آهسته تر و جزیره ای” آن می داند.
دیکنز توضیح داد: “Polaris تلاشی برای استفاده از نوآوری خارجی برای جبران رکود داخلی Snowflake است.”
کاتالوگ Polaris دارای رقبای متن باز است
Chaurasia و Dickens همچنین اشاره کردند که کاتالوگ Polaris تنها کاتالوگ داده منبع باز موجود در بازار نیست.
«چندین پروژه منبع باز دیگر در فضای فهرستنویسی داده و مدیریت فراداده وجود دارد، از جمله اطلس آپاچی a>، Amundsen و DataHub LinkedIn. چاوراسیا گفت: هر کدام قابلیتهایی را برای کشف داده، مدیریت و مدیریت ابرداده ارائه میکنند.
در حالی که Apache Atlas برای حاکمیت و انطباق در محیطهای Apache Hadoop طراحی شده است، مدیریت ابرداده مقیاسپذیر، نسل و قابلیتهای حاکمیتی را برای Hadoop و فناوریهای کلان داده مرتبط ارائه میدهد، آموندسن، که از Lyft نشات میگیرد، قصد دارد بهرهوری تحلیلگران داده، دانشمندان را افزایش دهد. و مهندسان را با نمایه سازی منابع داده (فراداده) و تسهیل کشف و کاوش مجموعه داده ها بر اساس استفاده و ارتباط.
یک جایگزین دیگر LinkedIn’s DataHub است که معماری فراداده بلادرنگ را ارائه می کند که از سیستم ها و محیط های داده مختلف از طریق یکپارچه سازی قابل اتصال پشتیبانی می کند.
چاوراسیا گفت: «این بر جذب ابرداده، نمایهسازی، کشف دادهها و مدیریت تمرکز دارد»، و افزود که آموندسن و DataHub به دلیل تأکید بر تجربه کاربر، پشتیبانی از ادغامهای چندگانه (هم در زمان واقعی و هم دستهای) محبوب شدهاند. و قابلیتهای کشف داده در پی تقاضا برای پیشنهادات مدیریت داده کارآمد.
پست های مرتبط
Snowflake استراتژی منبع باز را برای به دست آوردن سهم ذهن کاتالوگ داده اتخاذ می کند
Snowflake استراتژی منبع باز را برای به دست آوردن سهم ذهن کاتالوگ داده اتخاذ می کند
Snowflake استراتژی منبع باز را برای به دست آوردن سهم ذهن کاتالوگ داده اتخاذ می کند