۳۰ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

Snowflake برای مقابله با Teradata، Google BigQuery و Amazon Redshift به پایتون ضربه می زند.

به‌روزرسانی‌های Snowflake شامل پشتیبانی از Python در سیستم توسعه برنامه Snowpark، قابلیت‌های دسترسی به داده‌ها و جداول خارجی برای ذخیره‌سازی در محل است.

به‌روزرسانی‌های Snowflake شامل پشتیبانی از Python در سیستم توسعه برنامه Snowpark، قابلیت‌های دسترسی به داده‌ها و جداول خارجی برای ذخیره‌سازی در محل است.

شرکت انبار داده مبتنی بر ابر Snowflake در نشست سالانه Snowflake Summit خود در روز سه شنبه مجموعه جدیدی از ابزارها و ادغام ها را برای مقابله با شرکت های تجزیه و تحلیل و پایگاه داده رقیب مانند Teradata معرفی کرد. و خدماتی مانند Google BigQuery و Amazon Redshift.

قابلیت‌های جدید، که شامل ابزارهای دسترسی به داده‌ها و پشتیبانی از پایتون در سیستم توسعه برنامه Snowpark این شرکت می‌شود، با هدف دانشمندان داده، مهندسین داده، و توسعه دهندگان، با این هدف تسریع توسعه برنامه ها، به ویژه برای برنامه های یادگیری ماشینی.

Snowpark که یک سال پیش راه‌اندازی شد، یک محیط توسعه به سبک دیتافریم است که به توسعه‌دهندگان اجازه می‌دهد تا ابزارهای دلخواه خود را بدون سرور در موتور محاسباتی انبار مجازی Snowflake مستقر کنند. پشتیبانی از Python در پیش نمایش عمومی است.

کریستین کلاینرمن، معاون ارشد محصولات در Snowflake، می‌گوید: “Python احتمالاً تنها مورد درخواست ترین قابلیتی است که از مشتریان خود می شنویم.”

تقاضای پایتون منطقی است، زیرا به گفته تحلیلگران، این زبان انتخابی برای دانشمندان داده است.

داگ هنشن، تحلیلگر اصلی در Constellation Research، گفت:

Snowflake در واقع در حال پیشروی در این جبهه است، زیرا رقبای خود از جمله Teradata، Google BigQuery و Vertica در حال حاضر از پشتیبانی Python برخوردار هستند.

Snowflake همچنین گفت که یکپارچه سازی Streamlit را برای توسعه و تکرار برنامه اضافه می کند. Streamlit که یک چارچوب برنامه منبع باز در پایتون است که هدف آن تیم‌های مهندسی علم داده و یادگیری ماشین برای کمک به تجسم، تغییر و اشتراک‌گذاری داده‌ها است، در ماه مارس توسط Snowflake خریداری شد.

Oracle Cloud Native Environment 1.5.7 Kubernetes را برجسته می کند

تونی بائر، تحلیلگر اصلی در dbInsights گفت: این ادغام به کاربران اجازه می دهد تا در محیط Snowflake بمانند، نه تنها به داده ها دسترسی داشته باشند، ایمن باشند، و مدیریت کنند، بلکه برنامه های علم داده را برای مدل سازی و تجزیه و تحلیل داده ها توسعه دهند.

>

Snowflake ادغام های مرتبط با پایتون را راه اندازی کرد

برخی از دیگر ابزارها و ادغام‌های مرتبط با پایتون که در این اجلاس رونمایی شدند عبارتند از برگه‌های کاری Snowflake برای پایتون، انبارهای حافظه بزرگ، و یادگیری ماشینی SQL.

کاربرگ‌های برفی برای پایتون، که در پیش‌نمایش خصوصی است، به گونه‌ای طراحی شده است که به شرکت‌ها اجازه می‌دهد خطوط لوله، مدل‌های یادگیری ماشین و برنامه‌های کاربردی را از طریق رابط مبتنی بر وب این شرکت که Snowsight نامیده می‌شود، توسعه دهند و افزود که دارای توانایی‌هایی مانند تکمیل خودکار کد و تولید منطق سفارشی.

به منظور کمک به دانشمندان داده و تیم‌های توسعه در اجرای عملیات‌های فشرده حافظه مانند مهندسی ویژگی و آموزش مدل در مجموعه‌های داده بزرگ، این شرکت گفت که در حال کار بر روی ویژگی به نام انبارهای حافظه بزرگ است.

Snowflake گفت: در حال حاضر در مرحله توسعه، انبارهای حافظه بزرگ از طریق ادغام با پلت فرم علم داده Anaconda از کتابخانه های پایتون پشتیبانی می کنند.

هنشن گفت: “چند رقیب برای پشتیبانی از انبارهای حافظه بزرگ و همچنین توابع پایتون و پشتیبانی از زبان قابل تنظیم هستند، بنابراین این Snowflake مطابق با تقاضاهای بازار است.”

GitHub Actions چیست؟ CI/CD خودکار برای GitHub

Snowflake همچنین یادگیری ماشینی SQL را با داده‌های سری زمانی در پیش‌نمایش خصوصی ارائه می‌دهد. این شرکت گفت که این سرویس به شرکت ها کمک می کند تا پیش بینی ها و تجزیه و تحلیل های مبتنی بر یادگیری ماشین را در برنامه های کاربردی هوش تجاری و داشبورد جاسازی کنند.

بسیاری از فروشندگان پایگاه داده تحلیلی، به گفته Henschen، در حال ساخت مدل های یادگیری ماشین برای اجرای درون پایگاه داده بوده اند.

هنشن گفت: «منطقی که در پشت دانه‌ی برف با تجزیه و تحلیل داده‌های سری زمانی شروع می‌شود این است که در میان تحلیل‌های محبوب‌تر یادگیری ماشینی قرار دارد، زیرا در مورد پیش‌بینی مقادیر آینده بر اساس مقادیر مشاهده‌شده قبلی است.» و افزود که سری‌های زمانی تجزیه و تحلیل موارد استفاده زیادی در بخش مالی دارد.

به‌روزرسانی‌های Snowflake دسترسی بیشتر به داده‌ها را فعال می‌کنند

با این منطق که دسترسی سریع‌تر به داده‌ها می‌تواند منجر به توسعه سریع‌تر برنامه شود، Snowflake در روز سه‌شنبه همچنین قابلیت‌های جدیدی از جمله پشتیبانی جریانی داده، جداول Apache Iceberg در Snowflake و جداول خارجی برای ذخیره‌سازی در محل را معرفی کرد.

پشتیبانی از داده‌های جریانی، که در پیش‌نمایش خصوصی است، به حذف مرزهای بین جریان و خطوط لوله دسته‌ای با Snowpipe، سرویس دریافت مداوم داده‌های شرکت کمک می‌کند.

طبق گفته Henschen، دلیل راه‌اندازی این ویژگی، علاقه زیاد به پشتیبانی از گزینه‌های با تأخیر کم، از جمله جریان تقریباً واقعی و واقعی است، و اکثر فروشندگان در این بازار، کادر پخش را علامت زده‌اند.

4 مرحله برای بهبود تجزیه و تحلیل علت اصلی

>

هنشن گفت: «این ویژگی به تیم‌های مهندسی روشی داخلی برای تجزیه و تحلیل جریان در کنار داده‌های تاریخی می‌دهد، بنابراین مهندسان داده مجبور نیستند خودشان چیزی را جمع‌آوری کنند. این یک صرفه‌جویی در زمان است.

به منظور هماهنگی با تقاضا برای قالب‌های جدول منبع باز بیشتر، این شرکت گفت که در حال توسعه Apache Iceberg Tables برای اجرا در محیط خود است.

“Apache Iceberg یک قالب جدول منبع باز بسیار داغ است و به سرعت برای پلتفرم های داده های تحلیلی مورد توجه قرار می گیرد. قالب های جدول مانند Iceberg ابرداده هایی را ارائه می دهند که به عملکرد منسجم و مقیاس پذیر کمک می کند. Iceberg همچنین اخیراً توسط Google برای ارائه Big Lake خود پذیرفته شده است. “هنسشن گفت.

در همین حال، Snowflake در تلاش برای درگیر نگه داشتن مشتریان داخلی خود در حالی که تلاش می کند آنها را به استفاده از پلت فرم داده ابری خود سوق دهد، در حال معرفی External Tables On-Premises Storage است. این شرکت گفت که در حال حاضر در پیش‌نمایش خصوصی، این ابزار به کاربران اجازه می‌دهد به داده‌های خود در سیستم‌های ذخیره‌سازی درون محل شرکت‌هایی از جمله Dell Technologies و Pure Storage دسترسی داشته باشند.

هنشن گفت: «Snowflake برای مدتی یک خط مشی «فقط ابری» داشت، بنابراین آنها به وضوح مشتریان مهم بزرگی داشتند که می‌خواستند راهی برای تجزیه و تحلیل داده‌های داخلی بدون انتقال همه آن‌ها به Snowflake داشته باشند.

>

علاوه بر این، Henschen گفت که رقبای خود از جمله Teradata، Vertica و Yellowbrick در محل و همچنین استقرار ترکیبی و چند ابری ارائه می‌دهند.