افزایش ظرفیت بدون هزینه اضافی ارائه می شود.
مایکروسافت سرویس جستجوی هوش مصنوعی Azure خود را بهروزرسانی کرده است تا ظرفیت ذخیرهسازی و اندازه شاخص بردار را بدون هزینه اضافی افزایش دهد، اقدامی که به گفته او اجرای برنامههای مبتنی بر هوش مصنوعی را برای شرکتها اقتصادیتر میکند.
سرویس جستجوی هوش مصنوعی Azure که قبلاً به عنوان جستجوی شناختی Azure شناخته میشد، فروشگاههای داده خارجی حاوی دادههای فهرستنشده را به برنامهای متصل میکند که عبارتها یا درخواستها را به فهرست جستجو ارسال میکند. از سه جزء تشکیل شده است – موتور جستجو، شاخصها و موتور نمایهسازی – و بیشتر در بازیابی اطلاعات برای بهبود عملکرد هوش مصنوعی مولد استفاده میشود، فرآیندی که به عنوان تولید تقویتشده بازیابی شناخته میشود. (RAG).
این شرکت گفت که محدودیتهای گسترشیافته رایگان فقط برای خدمات جدیدی که پس از ۳ آوریل ۲۰۲۴ توسعه یافتهاند اعمال میشود، و افزود که راهی برای ارتقای خدمات موجود وجود ندارد، بنابراین شرکتها برای بهرهمندی از ظرفیتهای افزایشیافته باید خدمات جدیدی ایجاد کنند. .
برخلاف سرویسهای توسعهیافته قبل از آن تاریخ، سرویسهای جدید افزایش ۳ برابری تا ۶ برابری در کل فضای ذخیرهسازی در هر پارتیشن، ۵ برابری تا ۱۱ برابری افزایش در اندازه شاخص برداری در هر پارتیشن را دریافت خواهند کرد، و محاسبات اضافی پشتیبان سرویس از بردارهای بیشتری در هر پارتیشن پشتیبانی میکند. عملکرد بالا و تا ۲ برابر بهبود در نمایه سازی و خروجی پرس و جو.
پابلو کاسترو، مهندس Azure AI، در بهروزرسانی، بهطور متوسط، هزینه هر بردار را تا ۸۵ درصد کاهش میدهد و تا ۷۵ درصد در کل هزینههای ذخیرهسازی صرفهجویی میکند. microsoft.com/t5/ai-azure-ai-services-blog/annoncing-fast-effective-rag-at-scale-with-azure-ai-search/ba-p/4104961″ rel=”nofollow”>پست وبلاگ .
طبق گفته کاسترو، طبق گفته کاسترو، سطح اصلی سرویس، ۱۳ گیگابایت فضای ذخیرهسازی اضافی برای هر پارتیشن پس از بهروزرسانی دریافت میکند، در حالی که قبلاً فقط ۲ گیگابایت در هر پارتیشن وجود داشت.
سطوح S1، S2 و S3 سرویس به ترتیب ۱۳۵ گیگابایت، ۲۵۰ گیگابایت و ۵۰۰ گیگابایت فضای ذخیرهسازی اضافی در هر پارتیشن دریافت خواهند کرد.
شرکت گفت که سطوح L1 و L2 تغییری نخواهند دید.
در اندازه شاخص برداری، سطوح پایه، S1، S2، و S3 به ترتیب ظرفیت اندازهگیری ۴ گیگابایتی، ۳۲ گیگابایتی، ۸۸ گیگابایتی و ۱۶۴ گیگابایتی را در هر پارتیشن مشاهده خواهند کرد. مجدداً، سطوح L1 و L2 تغییری نخواهند دید.
پیشنهاد به روز شده در اکثر مناطق ایالات متحده و بریتانیا، در کنار سایر مناطق مانند غرب سوئیس، سوئد مرکزی، لهستان مرکزی، نروژ شرقی، کره جنوبی، کره مرکزی، شرق ژاپن، ژاپن غربی، ایتالیا شمالی، هند مرکزی در دسترس خواهد بود. ، جیو هند غربی، فرانسه مرکزی، اروپای شمالی، کانادا مرکزی، کانادا شرقی، برزیل جنوبی، آسیای شرقی و آسیای جنوب شرقی.
ویژگی های بیشتر برای بهینه سازی ذخیره سازی برداری
بهجز بهروزرسانی اندازههای ذخیرهسازی و شاخص برداری، این شرکت در حال کار بر روی ارائه ویژگیهای بیشتر برای بهینهسازی ذخیرهسازی برداری است.
این ویژگیها، که در حال حاضر در حال پیشنمایش هستند، شامل کوانتیزهسازی و انواع عددی باریک برای بردارها، از جمله ترفندهای دیگر است.
کاسترو گفت که مایکروسافت از کوانتیزهسازی و نمونهبرداری بیش از حد برای فشردهسازی و بهینهسازی ذخیرهسازی دادههای برداری استفاده میکند و افزود که این امر اندازه شاخص برداری را تا ۷۵ درصد و ذخیرهسازی برداری روی دیسک را تا ۲۵ درصد کاهش میدهد.
علاوه بر این، مهندس گفت که شرکتها میتوانند از انواع ابتدایی میدان برداری باریک مانند int8، int16، یا float16 استفاده کنند تا اندازه شاخص برداری و ذخیره برداری بر روی دیسک را تا ۷۵% کاهش دهند.
تکنیکهای دیگر برای بهینهسازی بیشتر شامل تنظیم ویژگی ذخیرهشده در فیلدهای برداری برای کاهش سربار ذخیرهسازی است.
پست های مرتبط
جستجوی هوش مصنوعی Azure مایکروسافت با افزایش فضای ذخیره سازی و اندازه شاخص برداری به روز شد
جستجوی هوش مصنوعی Azure مایکروسافت با افزایش فضای ذخیره سازی و اندازه شاخص برداری به روز شد
جستجوی هوش مصنوعی Azure مایکروسافت با افزایش فضای ذخیره سازی و اندازه شاخص برداری به روز شد