۲۹ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

Google Cloud پشتیبانی وکتور را به همه ارائه های پایگاه داده خود اضافه می کند

ارائه‌دهندگان خدمات ابری، از جمله Google Cloud، در حال رقابت برای اضافه کردن پشتیبانی برداری و سایر ویژگی‌های مرتبط با هوش مصنوعی هستند، زیرا تلاش می‌کنند مزیت حرکت اول را به دست آورند.

ارائه‌دهندگان خدمات ابری، از جمله Google Cloud، در حال رقابت برای اضافه کردن پشتیبانی برداری و سایر ویژگی‌های مرتبط با هوش مصنوعی هستند، زیرا تلاش می‌کنند مزیت حرکت اول را به دست آورند.

Google Cloud روز پنجشنبه اعلام کرد که پشتیبانی بردار را اضافه کرده و LangChain را با همه ارائه‌های پایگاه داده خود در تلاش برای پیشی گرفتن از ارائه‌دهندگان خدمات ابری رقیب، مانند آمازون وب، اضافه می‌کند. خدمات (AWS)، مایکروسافت، و اوراکل.

ارائه‌دهندگان خدمات ابری در رقابتی برای افزودن قابلیت‌های مولد هوش مصنوعی و مرتبط با هوش مصنوعی به ارائه‌های پایگاه داده خود قفل شده‌اند تا اولین مزیت محرک را داشته باشند تا پای بزرگ‌تری از در حال رشد هوش مصنوعی و بازار هوش مصنوعی مولد.

به‌روزرسانی‌های جدید برای ارائه‌های پایگاه داده شامل افزودن پشتیبانی برداری برای پایگاه‌های داده رابطه‌ای، ارزش کلیدی، سند و درون حافظه مانند CloudSQL، Spanner، Firestore، Bigtable و Memorystor for Redis.

جستجوی نزدیکترین همسایه یک تمایز کلیدی است

قابلیت‌های برداری اضافه‌شده به پایگاه‌های داده دارای قابلیت‌های جستجو هستند، از جمله جستجوی تقریبی نزدیک‌ترین همسایه (ANN) و جستجوی دقیق نزدیک‌ترین همسایه (KNN).

دیوید منینگر، مدیر اجرایی پژوهشگاه Ventana در ISG، گفت: در حالی که ANN برای بهینه سازی جستجو، به عبارت دیگر، کاهش تأخیر، برای مجموعه داده های بزرگ استفاده می شود، KNN برای بازگرداندن نتایج جستجوی خاص یا دقیق تر در مجموعه داده های کوچکتر استفاده می شود. p>

مننینگر توضیح داد: «پشتیبانی از ANN و KNN نشان می‌دهد که رویکرد یکسانی برای جستجوی برداری وجود ندارد و موارد استفاده مختلف به الگوریتم‌های نمایه‌سازی متفاوتی برای ارائه سطح مورد نیاز از دقت و عملکرد نیاز دارند». وی افزود که این امر نشان می دهد که توسعه دهندگان وظیفه دارند ماهیت داده ها و برنامه های خود را درک کنند و با پایگاه داده های مختلف آزمایش کنند تا قابلیت هایی را که به بهترین وجه با نیازهای یک پروژه منطبق است شناسایی کنند.

هوش مصنوعی هنوز راه هایی برای بازآفرینی کد دارد

به گفته نوئل یوهانا، تحلیلگر اصلی Forrester، مزیت دیگر از دیدگاه Google این است که اکثر فروشندگان پایگاه داده هم ANN و هم KNN را ارائه نمی دهند.

“برخی از فروشندگان از KNN پشتیبانی می کنند، در حالی که برخی دیگر از رویکرد ANN پشتیبانی می کنند. یوهانا گفت: ANN محبوب تر است زیرا مقیاس پذیر است و برای مجموعه داده های بزرگ و بردارهای با ابعاد بالا عملکرد خوبی دارد.

همه قابلیت‌های برداری اضافه شده به پایگاه داده در حال حاضر در پیش نمایش هستند. در ژوئیه سال گذشته، Google پشتیبانی از پسوند محبوب pgvectorدر AlloyDB و Cloud SQL راه اندازی کرد تا از ساخت برنامه های هوش مصنوعی مولد پشتیبانی کند.

به گفته منینگر، ظاهراً افزودن قابلیت‌های برداری در چندین ارائه پایگاه داده از ژوئیه سال گذشته در فواصل زمانی منظم، Google Cloud را «تهاجمی‌تر» از ابر مقیاس‌کننده‌های رقیب می‌کند.

با این حال، او اشاره کرد که تقریباً همه فروشندگان پایگاه داده پشتیبانی از قابلیت های جستجوی برداری و برداری را اضافه می کنند.

به گفته یوهانا، مایکروسافت، AWS و اوراکل دارای سطحی از قابلیت‌های پشتیبانی بردار در ارائه‌های پایگاه داده مربوطه خود هستند.

یوهانا گفت:

اعلامیه‌های Google Cloud ممکن است آن را نسبت به رقبای خود برتری دهد، زیرا به نظر می‌رسد در این سفر کمی جلوتر از سایرین است تا این قابلیت‌ها را به طور کلی در اختیار شرکت‌ها قرار دهد.

هر دو تحلیلگر همچنین خاطرنشان کردند که افزودن پشتیبانی برای قابلیت‌های برداری به زودی تبدیل به ذخایر جدولی برای فروشندگان پلتفرم داده برای پشتیبانی از توسعه برنامه‌های هوش مصنوعی مولد با تکمیل مدل‌های زبان بزرگ (LLM) خواهد شد. /a> با داده های سازمانی تایید شده برای بهبود دقت و اعتماد.

Google Project IDX: یک IDE ابری امیدوارکننده نسل بعدی

طبق گفته مننینگر، ISG معتقد است که تقریباً همه شرکت‌هایی که برنامه‌های کاربردی مبتنی بر هوش مصنوعی تولیدی را توسعه می‌دهند، استفاده از جستجوی برداری و تولید تقویت‌شده با بازیابی را برای تکمیل مدل‌های پایه با داده‌ها و محتوای اختصاصی تا پایان سال ۲۰۲۶ بررسی خواهند کرد.

رقابت بین پایگاه های داده برداری و پایگاه های داده سنتی

به گفته تحلیلگران، افزودن قابلیت های برداری توسط hyperscalers و سایر فروشندگان پایگاه داده به پیشنهادات آنها منجر به رقابت فزاینده بین پایگاه های داده برداری و پایگاه های داده سنتی شده است.

آنها افزودند، در حالی که پایگاه های داده سنتی قابلیت های برداری را برای ارائه موارد خود به شرکت ها اضافه می کنند، پایگاه های داده برداری قابلیت هایی برای مصرف آسان تر محصولات خود توسط افراد غیر متخصص بوده است.

با این حال، منینگر ISG معتقد است که بیش از ۵۰ درصد از شرکت‌ها با توجه به اتکا به این پایگاه‌های داده سنتی، تا سال ۲۰۲۶ از ارائه پایگاه داده سنتی با پشتیبانی برداری استفاده خواهند کرد.

منینگر گفت: پایگاه‌های داده برداری تخصصی همچنان وجود خواهند داشت، هرچند فقط برای موارد استفاده پیچیده‌تر و پیچیده‌تر. Pinecone، Chroma، Weaviate، Milvus، و Qdrant نمونه‌هایی از پایگاه‌های داده تخصصی هستند.

منینگر در توضیح بیشتر گفت که آیا جستجوی برداری با استفاده از یک پایگاه داده برداری تخصصی یا یک پایگاه داده همه منظوره به بهترین وجه انجام شود به عوامل مختلفی بستگی دارد، از جمله اتکای نسبی یک شرکت به پایگاه داده موجود، مهارت های توسعه دهنده، اندازه مجموعه داده، و الزامات برنامه خاص.

ادغام LangChain با همه پیشنهادات پایگاه داده Google

Google Cloud یکپارچه‌سازی‌های LangChain را برای همه پایگاه‌های داده خود اضافه می‌کند. اندی گاتمنز، معاون مهندسی بخش پایگاه‌های داده Google Cloud، گفت: «ما از سه ادغام LangChain که شامل ذخیره‌های برداری، بارکننده‌های اسناد، و حافظه پیام‌های چت هستند، پشتیبانی خواهیم کرد.

OpenAI از ChatGPT Enterprise رونمایی کرد

Gutmans افزود:

LangChain چارچوبی برای توسعه برنامه‌های کاربردی است که توسط LLM ها پشتیبانی می‌شود و ادغام در پایگاه‌های داده به توسعه‌دهندگان اجازه می‌دهد تا گردش‌های کاری نسل تقویت‌شده (RAG) داخلی را در منبع داده ترجیحی خود داشته باشند.

>

در حالی که ادغام ذخیره‌های برداری LangChain برای AlloyDB، Cloud SQL برای PostgreSQL، Cloud SQL برای MySQL، Memorystore برای Redis، و Spanner در دسترس است، یکپارچه‌سازی حافظه بارکننده‌های سند و پیام‌های چت برای همه پایگاه‌های داده، از جمله Firestore، Bigtable، در دسترس است. و SQL Server.

تحلیل‌گران افزودن ادغام‌های LangChain را به‌عنوان یک حرکت «مطمئنانه» از سوی Google می‌دانند.

«LangChain در حال حاضر محبوب‌ترین چارچوب برای اتصال LLM به منابع خصوصی داده‌های سازمانی است که یکپارچگی خنثی از فروشنده را با پایگاه‌های داده سازمانی و همچنین محیط‌های توسعه و استقرار یادگیری ماشین تجاری، مانند SageMaker Studio و Vertex ارائه می‌کند. AI Studio، مننینگر توضیح داد.

AlloyDB AI به طور کلی در دسترس است

Google پیشنهاد هوش مصنوعی AlloyDB خود را به طور کلی در دسترس قرار داده است. می توان از طریق AlloyDB و AlloyDB Omni استفاده کرد.

AlloyDB AI که سال گذشته در ماه آگوست به پیش‌نمایش منتقل شد، مجموعه‌ای از قابلیت‌های یکپارچه است که به توسعه‌دهندگان اجازه می‌دهد برنامه‌های مبتنی بر هوش مصنوعی را با استفاده از داده‌های زمان واقعی بسازند.

بر اساس پشتیبانی برداری اولیه موجود با PostgreSQL استاندارد ساخته شده است و می تواند یک تابع ساده PostgreSQL را برای ایجاد جاسازی روی داده ها معرفی کند.

شرکت گفت

AlloyDB AI بخشی جدایی ناپذیر از AlloyDB و AlloyDB Omni است و بدون هزینه اضافی در دسترس است.