۲۹ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

Snowflake استراتژی منبع باز را برای به دست آوردن سهم ذهن کاتالوگ داده اتخاذ می کند

Snowflake با برنامه خود برای تبدیل کاتالوگ داده Polaris خود به صورت منبع باز، امیدوار است که این پیشنهاد جدید به عنوان یک فروشنده خنثی دیده شود و جذابیت آن را در مقایسه با Databricks' Unity Catalog افزایش دهد.

Snowflake با برنامه خود برای تبدیل کاتالوگ داده Polaris خود به صورت منبع باز، امیدوار است که این پیشنهاد جدید به عنوان یک فروشنده خنثی دیده شود و جذابیت آن را در مقایسه با Databricks’ Unity Catalog افزایش دهد.

تحلیلگران گفتند که Snowflake می گوید کد منبع را برای کاتالوگ Polaris جدید خود باز می کند، استراتژی که نشان می دهد می خواهد کاربران کاتالوگ داده را از کاتالوگ Unity رقیب Databricks جذب کند و در عین حال جذابیت پیشنهاد خود را تقویت کند.

«حرکت راه‌اندازی کاتالوگ Polaris پاسخی رقابتی به کاتالوگ Unity Databricks ارائه می‌کند، Jayesh Chaurasia، تحلیلگر در شرکت خدمات مشاوره و تحقیقات Forrester، گفت: در نتیجه ارزش پیشنهادی Snowflake را افزایش می‌دهد، طیف وسیع‌تری از مشتریان را جذب می‌کند، و جامعه پر جنب و جوشی را در اطراف کاتالوگ داده جدید تقویت می‌کند.

چگونه کاتالوگ Polaris با کاتالوگ Unity Databricks متفاوت است

کاتالوگ Unity Databricks که به طور کلی در ژوئن ۲۰۲۲ در دسترس قرار گرفت و بعدا با قابلیت های Okera در سال بعد به روز شد، یک یکپارچه منبع بسته است. پیشنهادی حاکمیت که قابلیت‌های کنترل دسترسی متمرکز، حسابرسی، اصل و نسب و کشف داده‌ها را در سراسر فضاهای کاری Databricks فراهم می‌کند.

کاتالوگ Polaris که در طول کنفرانس سالانه Snowflake این هفته منتشر شد، قابلیت‌های مشابهی را با Unity Catalog ارائه می‌کند، اما در قالب جدول داده منبع باز محبوب Apache Iceberg ساخته شده است. . نیاز به دسترسی به یک پیشنهاد فروشنده خنثی است که با قابلیت‌های حاکمیت داده همراه باشد و از موتورهای پرس و جوی متقابل پشتیبانی کند.

Snowflake ابزارهای توسعه دهنده را به روز می کند، ویژگی های مشاهده پذیری را اضافه می کند

Snowflake در بیانیه ای گفت: «با کاتالوگ Polaris، کاربران اکنون یک مکان متمرکز و واحد برای هر موتوری برای یافتن و دسترسی به جداول Iceberg سازمان با امنیت ثابت و قابلیت همکاری کامل و باز به دست می آورند. پروتکل منبع باز REST، که استانداردی باز برای کاربران برای دسترسی و بازیابی داده ها از هر موتوری که از Iceberg Rest API پشتیبانی می کند، از جمله Apache Flink، Apache Spark، Dremio، Python و Trino در میان دیگران.

به گفته Chaurasia، پیچیدگی و تنوع سیستم‌های داده، همراه با تمایل جهانی سازمان‌ها به استفاده از هوش مصنوعی، استفاده از فهرست داده‌های قابل همکاری را ضروری می‌سازد که احتمالاً طبیعتاً منبع باز است.

“یک کاتالوگ داده منبع باز به قابلیت همکاری و سایر نیازها، مانند مقیاس پذیری، می پردازد، به خصوص اگر بر روی قالب جدول محبوبی مانند Iceberg ساخته شده باشد. Chaurasia گفت: این رویکرد مدیریت داده ها را در پلتفرم های مختلف و محیط های ابری تسهیل می کند.

به طور جداگانه، استوارت باند، معاون تحقیقات شرکت تحقیقات بازار IDC، اشاره کرد که کاتالوگ Polaris ممکن است از کاتالوگ‌های کوه یخ و قابلیت‌های درجه سازمانی به آن اضافه شده است، مانند مدیریت چندین نمونه توزیع شده از مخازن Iceberg، ارائه سلسله داده‌ها، قابلیت جستجو برای ابزارهای داده، و قابلیت‌های توصیف داده در میان سایر موارد.

کاتالوگ Polaris، که Snowflake انتظار دارد در ۹۰ روز آینده منبع باز شود، می‌تواند در AI Data Cloud اختصاصی خود میزبانی شود یا می‌تواند در زیرساخت خود یک شرکت با استفاده از کانتینرها مانند Docker یا Kubernetes.

5 روش برای استفاده از هوش مصنوعی و یادگیری ماشین در دیتااپ ها

 «از آنجایی که پیاده‌سازی بک‌اند Polaris کاتالوگ منبع باز خواهد بود، سازمان‌ها می‌توانند آزادانه زیرساخت میزبانی را با حفظ تمام کنترل‌های امنیتی و حذف قفل فروشنده‌ها، تعویض کنند،» و افزود که کاتالوگ Polaris در درون ابر داده‌های هوش مصنوعی Snowflake در حال حاضر در دسترس است. پیش نمایش عمومی.

آیا بلیت Polaris Snowflake برای جلب حسن نیت جامعه است؟

در حالی که کارشناسانی مانند Forrester’s Chaurasia و dbInsight’s Tony Baer فکر می کنند که کاتالوگ Polaris یک استراتژی توسعه یافته برای شرکت برای گسترش دامنه دسترسی به مشتریان جدید است، استیون دیکنز، معاون تحقیقات گروه Futurum فکر می کند که این یک تلاش “ناامیدکننده” است. از مشتریان و جامعه منبع باز “خوبیت” به دست آورید.

طبق گفته دیکنز، کاتالوگ داده‌ای که به زودی منبع باز می‌شود، پیامد مستقیم کاستی‌ها و محدودیت‌های Snowflake است، از جمله قابلیت همکاری ضعیف، قفل شدن فروشنده، هزینه‌های گزاف، فقدان نوآوری و وابستگی به مشارکت .

“Snowflake بسیار گران است و ساختار هزینه آن بسیاری از مشتریان را به جستجوی جایگزین سوق داده است. دیکنز گفت: Polaris را می توان به عنوان آخرین تلاش برای حفظ مشتریان با ارائه یک جایگزین بالقوه ارزان تر و منبع باز در نظر گرفت.

علاوه بر این، دیکنز حرکت Snowflake به کاتالوگ منبع باز Polaris را راهی برای مقابله با “سرعت توسعه آهسته تر و جزیره ای” آن می داند.

مایکروسافت فابریک کیت توسعه حجم کار و هوش بی‌درنگ را اضافه می‌کند

دیکنز توضیح داد: “Polaris تلاشی برای استفاده از نوآوری خارجی برای جبران رکود داخلی Snowflake است.”

کاتالوگ Polaris دارای رقبای متن باز است

Chaurasia و Dickens همچنین اشاره کردند که کاتالوگ Polaris تنها کاتالوگ داده منبع باز موجود در بازار نیست.

«چندین پروژه منبع باز دیگر در فضای فهرست‌نویسی داده و مدیریت فراداده وجود دارد، از جمله اطلس آپاچی، Amundsen و DataHub LinkedIn. چاوراسیا گفت: هر کدام قابلیت‌هایی را برای کشف داده، مدیریت و مدیریت ابرداده ارائه می‌کنند.

در حالی که Apache Atlas برای حاکمیت و انطباق در محیط‌های Apache Hadoop طراحی شده است، مدیریت ابرداده مقیاس‌پذیر، نسل و قابلیت‌های حاکمیتی را برای Hadoop و فناوری‌های کلان داده مرتبط ارائه می‌دهد، آموندسن، که از Lyft نشات می‌گیرد، قصد دارد بهره‌وری تحلیلگران داده، دانشمندان را افزایش دهد. و مهندسان را با نمایه سازی منابع داده (فراداده) و تسهیل کشف و کاوش مجموعه داده ها بر اساس استفاده و ارتباط.

یک جایگزین دیگر LinkedIn’s DataHub است که معماری فراداده بلادرنگ را ارائه می کند که از سیستم ها و محیط های داده مختلف از طریق یکپارچه سازی قابل اتصال پشتیبانی می کند.

چاوراسیا گفت: «این بر جذب ابرداده، نمایه‌سازی، کشف داده‌ها و مدیریت تمرکز دارد»، و افزود که آموندسن و DataHub به دلیل تأکید بر تجربه کاربر، پشتیبانی از ادغام‌های چندگانه (هم در زمان واقعی و هم دسته‌ای) محبوب شده‌اند. و قابلیت‌های کشف داده در پی تقاضا برای پیشنهادات مدیریت داده کارآمد.