بهروزرسانیهای Snowflake شامل پشتیبانی از Python در سیستم توسعه برنامه Snowpark، قابلیتهای دسترسی به دادهها و جداول خارجی برای ذخیرهسازی در محل است.
شرکت انبار داده مبتنی بر ابر Snowflake در نشست سالانه Snowflake Summit خود در روز سه شنبه مجموعه جدیدی از ابزارها و ادغام ها را برای مقابله با شرکت های تجزیه و تحلیل و پایگاه داده رقیب مانند Teradata معرفی کرد. و خدماتی مانند Google BigQuery و Amazon Redshift.
قابلیتهای جدید، که شامل ابزارهای دسترسی به دادهها و پشتیبانی از پایتون در سیستم توسعه برنامه Snowpark این شرکت میشود، با هدف دانشمندان داده، مهندسین داده، و توسعه دهندگان، با این هدف تسریع توسعه برنامه ها، به ویژه برای برنامه های یادگیری ماشینی.
Snowpark که یک سال پیش راهاندازی شد، یک محیط توسعه به سبک دیتافریم است که به توسعهدهندگان اجازه میدهد تا ابزارهای دلخواه خود را بدون سرور در موتور محاسباتی انبار مجازی Snowflake مستقر کنند. پشتیبانی از Python در پیش نمایش عمومی است.
کریستین کلاینرمن، معاون ارشد محصولات در Snowflake، میگوید: “Python احتمالاً تنها مورد درخواست ترین قابلیتی است که از مشتریان خود می شنویم.”
تقاضای پایتون منطقی است، زیرا به گفته تحلیلگران، این زبان انتخابی برای دانشمندان داده است.
داگ هنشن، تحلیلگر اصلی در Constellation Research، گفت:
“Snowflake در واقع در حال پیشروی در این جبهه است، زیرا رقبای خود از جمله Teradata، Google BigQuery و Vertica در حال حاضر از پشتیبانی Python برخوردار هستند.
Snowflake همچنین گفت که یکپارچه سازی Streamlit را برای توسعه و تکرار برنامه اضافه می کند. Streamlit که یک چارچوب برنامه منبع باز در پایتون است که هدف آن تیمهای مهندسی علم داده و یادگیری ماشین برای کمک به تجسم، تغییر و اشتراکگذاری دادهها است، در ماه مارس توسط Snowflake خریداری شد.
تونی بائر، تحلیلگر اصلی در dbInsights گفت: این ادغام به کاربران اجازه می دهد تا در محیط Snowflake بمانند، نه تنها به داده ها دسترسی داشته باشند، ایمن باشند، و مدیریت کنند، بلکه برنامه های علم داده را برای مدل سازی و تجزیه و تحلیل داده ها توسعه دهند.
>
Snowflake ادغام های مرتبط با پایتون را راه اندازی کرد
برخی از دیگر ابزارها و ادغامهای مرتبط با پایتون که در این اجلاس رونمایی شدند عبارتند از برگههای کاری Snowflake برای پایتون، انبارهای حافظه بزرگ، و یادگیری ماشینی SQL.
کاربرگهای برفی برای پایتون، که در پیشنمایش خصوصی است، به گونهای طراحی شده است که به شرکتها اجازه میدهد خطوط لوله، مدلهای یادگیری ماشین و برنامههای کاربردی را از طریق رابط مبتنی بر وب این شرکت که Snowsight نامیده میشود، توسعه دهند و افزود که دارای تواناییهایی مانند تکمیل خودکار کد و تولید منطق سفارشی.
به منظور کمک به دانشمندان داده و تیمهای توسعه در اجرای عملیاتهای فشرده حافظه مانند مهندسی ویژگی و آموزش مدل در مجموعههای داده بزرگ، این شرکت گفت که در حال کار بر روی ویژگی به نام انبارهای حافظه بزرگ است.
Snowflake گفت: در حال حاضر در مرحله توسعه، انبارهای حافظه بزرگ از طریق ادغام با پلت فرم علم داده Anaconda از کتابخانه های پایتون پشتیبانی می کنند.
هنشن گفت: “چند رقیب برای پشتیبانی از انبارهای حافظه بزرگ و همچنین توابع پایتون و پشتیبانی از زبان قابل تنظیم هستند، بنابراین این Snowflake مطابق با تقاضاهای بازار است.”
Snowflake همچنین یادگیری ماشینی SQL را با دادههای سری زمانی در پیشنمایش خصوصی ارائه میدهد. این شرکت گفت که این سرویس به شرکت ها کمک می کند تا پیش بینی ها و تجزیه و تحلیل های مبتنی بر یادگیری ماشین را در برنامه های کاربردی هوش تجاری و داشبورد جاسازی کنند.
بسیاری از فروشندگان پایگاه داده تحلیلی، به گفته Henschen، در حال ساخت مدل های یادگیری ماشین برای اجرای درون پایگاه داده بوده اند.
هنشن گفت: «منطقی که در پشت دانهی برف با تجزیه و تحلیل دادههای سری زمانی شروع میشود این است که در میان تحلیلهای محبوبتر یادگیری ماشینی قرار دارد، زیرا در مورد پیشبینی مقادیر آینده بر اساس مقادیر مشاهدهشده قبلی است.» و افزود که سریهای زمانی تجزیه و تحلیل موارد استفاده زیادی در بخش مالی دارد.
بهروزرسانیهای Snowflake دسترسی بیشتر به دادهها را فعال میکنند
با این منطق که دسترسی سریعتر به دادهها میتواند منجر به توسعه سریعتر برنامه شود، Snowflake در روز سهشنبه همچنین قابلیتهای جدیدی از جمله پشتیبانی جریانی داده، جداول Apache Iceberg در Snowflake و جداول خارجی برای ذخیرهسازی در محل را معرفی کرد.
پشتیبانی از دادههای جریانی، که در پیشنمایش خصوصی است، به حذف مرزهای بین جریان و خطوط لوله دستهای با Snowpipe، سرویس دریافت مداوم دادههای شرکت کمک میکند.
طبق گفته Henschen، دلیل راهاندازی این ویژگی، علاقه زیاد به پشتیبانی از گزینههای با تأخیر کم، از جمله جریان تقریباً واقعی و واقعی است، و اکثر فروشندگان در این بازار، کادر پخش را علامت زدهاند.
>
هنشن گفت: «این ویژگی به تیمهای مهندسی روشی داخلی برای تجزیه و تحلیل جریان در کنار دادههای تاریخی میدهد، بنابراین مهندسان داده مجبور نیستند خودشان چیزی را جمعآوری کنند. این یک صرفهجویی در زمان است.
به منظور هماهنگی با تقاضا برای قالبهای جدول منبع باز بیشتر، این شرکت گفت که در حال توسعه Apache Iceberg Tables برای اجرا در محیط خود است.
“Apache Iceberg یک قالب جدول منبع باز بسیار داغ است و به سرعت برای پلتفرم های داده های تحلیلی مورد توجه قرار می گیرد. قالب های جدول مانند Iceberg ابرداده هایی را ارائه می دهند که به عملکرد منسجم و مقیاس پذیر کمک می کند. Iceberg همچنین اخیراً توسط Google برای ارائه Big Lake خود پذیرفته شده است. “هنسشن گفت.
در همین حال، Snowflake در تلاش برای درگیر نگه داشتن مشتریان داخلی خود در حالی که تلاش می کند آنها را به استفاده از پلت فرم داده ابری خود سوق دهد، در حال معرفی External Tables On-Premises Storage است. این شرکت گفت که در حال حاضر در پیشنمایش خصوصی، این ابزار به کاربران اجازه میدهد به دادههای خود در سیستمهای ذخیرهسازی درون محل شرکتهایی از جمله Dell Technologies و Pure Storage دسترسی داشته باشند.
هنشن گفت: «Snowflake برای مدتی یک خط مشی «فقط ابری» داشت، بنابراین آنها به وضوح مشتریان مهم بزرگی داشتند که میخواستند راهی برای تجزیه و تحلیل دادههای داخلی بدون انتقال همه آنها به Snowflake داشته باشند.
>
علاوه بر این، Henschen گفت که رقبای خود از جمله Teradata، Vertica و Yellowbrick در محل و همچنین استقرار ترکیبی و چند ابری ارائه میدهند.
پست های مرتبط
Snowflake برای مقابله با Teradata، Google BigQuery و Amazon Redshift به پایتون ضربه می زند.
Snowflake برای مقابله با Teradata، Google BigQuery و Amazon Redshift به پایتون ضربه می زند.
Snowflake برای مقابله با Teradata، Google BigQuery و Amazon Redshift به پایتون ضربه می زند.