مایکروسافت با آخرین بهروزرسانیهای پلتفرم داده خود، فروشگاهی یکجا برای برنامههای کلان داده ارائه میکند.
اطلاعات بزرگ
چگونه Apache Arrow، Apache Parket، Arrow Flight و DataFusion قابلیتهای پردازش دادهها را به حجم زیادی از سریهای زمانی و دادههای دیگر میآورند.
Ahana Cloud for Presto یک دریاچه داده در آمازون S3 را بدون جابجایی هیچ داده ای به یک انبار داده تبدیل می کند. پرس و جوهای SQL حتی در هنگام پیوستن به چندین منبع داده ناهمگن به سرعت اجرا می شوند.
زبان برنامه نویسی منطق منبع باز با پشتیبانی آزمایشی از PostgreSQL و SQLite در SQL کامپایل می شود و در Google BigQuery اجرا می شود.
پایگاه داده اصلی نمودار بومی، به اشتراک گذاری افقی مورد انتظار، امنیت دانه ای و پردازش واکنشی اضافه می کند.
چگونه سرویس کاملاً مدیریت شده کافکا می تواند آرامش و سادگی را به زندگی افرادی که به زیرساخت پخش رویداد وابسته هستند، بیاورد.
پایتون به یک پایگاه اصلی علم داده و یادگیری ماشین تبدیل شده است، در حالی که جولیا از ابتدا برای انجام این کار ساخته شده است.
نحوه استفاده از R برای جستجوی داده ها در Google BigQuery با بسته های bigrquery و dplyr R را ببینید.
از ابزارهای منبع باز برای ساختن سیستم های کلان داده که بر روی محل و فضای ابری پل می شوند، استفاده کنید.
.NET برای Apache Spark 1.0 API های NET با کارایی بالا را برای Apache Spark از جمله Spark SQL، Spark Streaming و MLlib ارائه می کند.
همه چیز درباره ساختارهای داده آرایه و فهرست در جاوا و الگوریتم هایی که می توانید برای جستجو و مرتب کردن داده های موجود در آنها استفاده کنید بیاموزید.
مایکروسافت و دیتابریکس می گویند موتور پرس و جو بردار نوشته شده در C++ بار کاری Apache Spark را تا ۲۰ برابر تسریع می کند.
بازوی ایالات متحده غول تجارت الکترونیک ژاپنی در تلاش برای کاهش هزینه های سخت افزاری و تسهیل مدیریت دارایی خود از Hadoop دور شده است.
با ترکیب یادگیری ماشین و اجرای پرس و جو تطبیقی، بهینه سازی پرس و جو در Presto می تواند در استفاده مکرر هوشمندتر و کارآمدتر شود.
مانند انبارهای داده دیروز، دریاچه های داده امروزی ما را در قالب ها و سیستم های اختصاصی که نوآوری را محدود می کند و هزینه ها را افزایش می دهد تهدید می کند.
یک موتور اجرای پرس و جو فدرال SQL که در فیس بوک ایجاد شده است، Presto پرس و جوی تعاملی را برای همه داده های شما – بدون توجه به جایی که در آن قرار دارند، به ارمغان می آورد.
نسخه اصلی بعدی چارچوب پردازش داده در حافظه از توابع شتابدهنده GPU توسط Nvidia RAPIDS پشتیبانی میکند.
شرکت ها به ابزارهای بهتری برای یادگیری و همکاری پیرامون منابع داده نیاز دارند. کاتالوگ های داده با قابلیت های یادگیری ماشینی پیشگام می توانند به شما کمک کنند تا از داده های ارزشمند خود استفاده کنید
پروژه های محاسباتی با کارایی بالا به مقادیر زیادی از منابع محاسباتی نیاز دارند. جفت کردن شبیه سازی و سخت افزار تخصصی با ابر، پیشرفت های آینده را تقویت می کند.