۲۹ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

موتور سری زمانی نسل بعدی InfluxDB بر روی Rust ساخته شده است و از SQL پشتیبانی می کند

موتور سری زمانی جدید قادر است به پرسش‌ها سریع‌تر پاسخ دهد و از تجزیه و تحلیل داده‌های حجم‌های کاری عظیم پایگاه داده پشتیبانی کند.

موتور سری زمانی جدید قادر است به پرسش‌ها سریع‌تر پاسخ دهد و از تجزیه و تحلیل داده‌های حجم‌های کاری عظیم پایگاه داده پشتیبانی کند.

از آنجایی که شرکت‌ها شاهد افزایش بی‌سابقه در تجزیه و تحلیل داده‌های بلادرنگ هستند، InfluxDB روز چهارشنبه گفت که در حال انتشار یک موتور سری زمانی نسل بعدی برای سرویس پایگاه داده مدیریت‌شده خود InfluxDB Cloud است.

طبق شرکت تحقیقات بازار IDC، داده‌های سری زمانی را می‌توان به عنوان مجموعه‌ای از نقاط داده‌ای تعریف کرد که در بازه‌های زمانی منظم با مهرهای زمانی ثابت جمع‌آوری می‌شوند.

امی ماچادو، مدیر تحقیقات IDC، از این نوع مجموعه داده‌ها بیشتر برای آشکار کردن الگوها یا فصلی بودن در میان سایر گرایش‌ها استفاده می‌شود و می‌تواند به تیم‌های تجزیه و تحلیل سازمانی کمک کند تا آنچه را که با داده‌ها و چرایی اتفاق می‌افتد توصیف و درک کنند تا تصمیمات تجاری بهتری بگیرند. ، در یک گزارش تحقیقاتی نوشت.

ماچادو نوشت: ماچادو نوشت: پایگاه‌های داده سری‌های زمانی یا مجموعه‌های داده اخیراً با ظهور فناوری‌های استریم اهمیت بیشتری پیدا کرده‌اند و اضافه کرد که برخلاف روش قبلی آپلود چنین پایگاه‌داده‌ای در قالب دسته‌ای با تأخیر بالا، فناوری‌های استریم به سری‌های زمانی اجازه می‌دهند. داده ها به صورت بلادرنگ در پایگاه داده جریان پیدا کنند.

ماچادو در گزارش نوشت: «پایگاه‌داده سری زمانی و مجموعه ابزار تجزیه و تحلیل به بهترین وجه کار می‌کنند تا ابتدا هجوم زیادی از داده‌های پیوسته را مدیریت کند و سپس با موفقیت حجم کاری عظیم داده‌ها را برای بینش استخراج کند.

نسل افزوده بازیابی، گام به گام

بر روی Rust برای عملکرد، مقیاس طراحی شده است

شرکت در بیانیه‌ای گفت: موتور جدید، که بر اساس پروژه منبع باز IOx این شرکت در سال ۲۰۲۰ معرفی شد، بر روی زبان برنامه‌نویسی Rust توسعه یافته است تا مقیاس و عملکرد را افزایش دهد.< /p>

به منظور پشتیبانی از عملکرد از نظر ذخیره سازی سریعتر، این شرکت ادعا می کند که ذخیره سازی ستونی گرا خود را مجدد مهندسی کرده است و موتور را قادر می سازد تا داده ها را در حجم های بالا با کاردینالیتی نامحدود دریافت کند.

به طور معمول، پایگاه داده ستون محور سریعتر از پایگاه داده ردیف گرا است زیرا از حافظه کمتری برای ذخیره داده ها استفاده می کند. این همچنین سرعت خروجی پرس و جو را افزایش می دهد زیرا سیستم برای پردازش آن نیاز به دسترسی به بخش کوچکتری از پایگاه داده دارد.

Cardinality در یک سیستم مدیریت پایگاه داده را می توان به عنوان تعداد مجموعه های منحصر به فرد داده ذخیره شده در یک پایگاه داده تعریف کرد. هرچه کاردینالیته بیشتر مجاز باشد، پایگاه داده بهتر می تواند مقیاس شود.

شرکت گفت

موتور جدید می‌تواند پرس‌وجوها را در اکثر داده‌های سری زمانی در چند میلی ثانیه پردازش کند و افزود که از فایل‌های Apache Parquet در ذخیره‌سازی دیسک و Apache Arrow برای داده‌ها استفاده می‌کند. عملیات درون حافظه در بین اجزاء.

نحوه استفاده از GPT به عنوان یک زبان طبیعی برای موتور جستجوی SQL

نوشتن پرس و جو در SQL

با معرفی موتور جدید، این شرکت گفت که در نهایت در حال اضافه کردن پشتیبانی است تا به توسعه دهندگان اجازه دهد تا درخواست های خود را در SQL بنویسند.

SQL محبوب ترین زبان عامل پایگاه داده است زیرا در اکثر پایگاه های داده رابطه ای سنتی استفاده می شود.

تونی بائر، تحلیلگر اصلی گفت: «قابلیت SQL که InfluxDB به تازگی به آن افتخار می کند، در واقع از همان ابتدا توسط Timescale ساخته شده است، که همیشه بر اساس PostgreSQL بوده است. در شرکت تحقیقات بازار dbinsight.

پیش از این، InfluxDB به توسعه دهندگان اجازه می داد تا با کمک API، Flux و InfluxQL پرس و جو بنویسند.

شرکت گفت

Flux، که بر روی منبع باز ساخته شده است، یک زبان برنامه نویسی و پرس و جو مستقل است که بر استفاده مجدد از کد متمرکز شده و برای استخراج، تبدیل و بارگذاری (ETL) بهینه شده است.

InfluxQL، از سوی دیگر، یک زبان پرس و جو است که دارای نحوی شبیه به SQL است.

ماچادو گفت که افزودن پشتیبانی برای SQL به طور کلی یک روند رو به رشد برای راه حل های داده بلادرنگ است و اشاره کرد که تعداد توسعه دهندگانی که SQL را می شناسند زیاد است. “پشتیبانی SQL می تواند نرخ پذیرش شما را افزایش دهد. وقتی پشتیبانی SQL را ارائه می‌دهید، می‌توانید از تیم‌های خروجی برای اضافه کردن موارد استفاده جدید استفاده کنید.»

پایگاه داده بدون سرور چیست؟ محاسبه الاستیک برای ردیف داده

به گفته شرکت، همه زبان‌های پرس‌وجو از طریق موتور جستجوی DataFusion قابل دسترسی هستند – که یک چارچوب برنامه‌ریزی، بهینه‌سازی و اجرای پرس و جو قابل توسعه است که در Rust نوشته شده است و از Apache Arrow به عنوان فرمت درون حافظه خود استفاده می‌کند.

به‌علاوه، موتور جدید پشتیبانی از موارد استفاده قابلیت مشاهده را اضافه می‌کند زیرا شرکت‌ها به داده‌های مورد نیاز برای مشاهده، مانند ردیابی، گزارش‌ها و معیارها دسترسی خواهند داشت.

InfluxDB با رقابت مواجه است

بر اساس وب‌سایت توصیه پایگاه داده dbegines.com، InfluxDB در مورد حجم کاری داده‌های سری زمانی بسیار رتبه‌بندی می‌شود و با شرکت‌هایی مانند Graphite، Prometheous، TimeScaleDB، QuestDB، Apache Druid و DolphinDB در میان دیگران رقابت می‌کند.

وقتی از Baer در مورد شتاب InfluxDB در بازار پرسیده شد، Baer گفت: “در خارج از دروازه، InfluxDB به محبوبیت اولیه توسعه دهندگان تبدیل شد، اما آنها فرصت را با چنگال های ناسازگاری که شتاب آنها را کاهش می داد هدر دادند.”

بائر افزود: «در این بین، داده‌های سری زمانی به یک آیتم چک باکس با بسیاری از پایگاه‌های داده عملیاتی و تحلیلی ابری تبدیل شده‌اند.

داده‌های سری زمانی یا حجم کاری با انفجار اینترنت اشیا و طبق IDC، تقاضای زیادی برای موارد استفاده در زمینه عملیات نفت و گاز، لجستیک، زنجیره تامین، حمل و نقل و مراقبت های بهداشتی دارد.