۶ اردیبهشت ۱۴۰۴

Techboy

اخبار و اطلاعات روز تکنولوژی

تجزیه و تحلیل

11 min read

بارهای کاری یادگیری ماشینی به مجموعه داده های بزرگی نیاز دارند، در حالی که جریان های کاری یادگیری ماشینی به توان عملیاتی داده بالایی نیاز دارند. ما می توانیم خط لوله داده را برای دستیابی به هر دو بهینه کنیم.

6 min read

آپاچی کافکا که در ابتدا در لینکدین توسعه یافت، یکی از بالغ‌ترین پلتفرم‌ها برای پخش رویدادها است. کافکا برای خطوط لوله داده با عملکرد بالا، تجزیه و تحلیل جریان، یکپارچه سازی داده ها و برنامه های کاربردی حیاتی استفاده می شود.

9 min read

Dremio Cloud با یک موتور سریع SQL و بهینه‌سازی‌هایی که می‌توانند پرس‌و‌جوها را به‌طور چشمگیری سرعت بخشد، داده‌های بزرگ را در یک کران جهش می‌دهد. به علاوه به شما امکان می دهد از موتورهای دیگر بر روی داده های مشابه استفاده کنید.

1 min read

Tidyr را دوست دارید اما هرگز نمی توانید دقیقاً به یاد بیاورید که pivot_wider و pivot_longer دقیقا چگونه کار می کنند؟ با تکه‌های کد RStudio، می‌توانید یک قطعه یک بار بنویسید و همیشه یک الگوی کد پرکننده را در دست داشته باشید.