۳ دی ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

DataStax، شریک Google برای آوردن جستجوی برداری به NoSQL AstraDB

این دو شرکت همچنین برای راه‌اندازی یک پروژه متن‌باز، CassIO، با هدف سازگاری بیشتر Apache Cassandra با هوش مصنوعی و حجم کاری مدل‌های زبانی بزرگ، شریک هستند.

این دو شرکت همچنین برای راه‌اندازی یک پروژه متن‌باز، CassIO، با هدف سازگاری بیشتر Apache Cassandra با هوش مصنوعی و حجم کاری مدل‌های زبانی بزرگ، شریک هستند.

DataStax در تلاش برای سازگارتر کردن Apache Cassandra با AI و AstraDB NoSQL database-as-a-a-service با Google شریک است a>مدل زبان بزرگ (LLM) حجم کاری.

جستجوی برداری، یا برداری، به ویژه در پی تکثیر هوش مصنوعی مولد، به عنوان یک قابلیت کلیدی توسط فروشندگان پایگاه داده تلقی می شود زیرا می تواند زمان مورد نیاز برای آموزش را کاهش دهد. مدل‌سازی هوش مصنوعی با کاهش نیاز به ساختار داده‌ها – عملی که در فناوری‌های جستجوی فعلی رایج است. در مقابل، جستجوهای برداری می توانند ویژگی ویژگی مورد نیاز یا ضروری یک نقطه داده را که در حال جستجو است بخواند.

«جستجوی برداری به توسعه دهندگان این امکان را می دهد که پایگاه داده را بر اساس بافت یا معنی به جای کلمات کلیدی یا مقادیر تحت اللفظی جستجو کنند. DataStax در بیانیه‌ای گفت: این با استفاده از جاسازی‌ها انجام می‌شود، به‌عنوان مثال، Google Cloud’s API برای جاسازی متن، که می‌تواند مفاهیم معنایی را به‌عنوان بردار برای جستجوی مجموعه‌های داده بدون ساختار مانند متن و تصاویر نشان دهد. p>

LLMهای درون پایگاه داده Oracle HeatWave برای کمک به کاهش هزینه های زیرساخت

Datastax گفت، جاسازی‌ها را می‌توان ابزار قدرتمندی دانست که جستجو را به زبان طبیعی در میان مجموعه بزرگی از داده‌ها، در قالب‌های مختلف امکان‌پذیر می‌سازد و مرتبط‌ترین بخش‌های داده را استخراج می‌کند.

پایگاه‌های اطلاعاتی برداری توسط تحلیلگران به‌عنوان یک آیتم «بلیت داغ» برای سال ۲۰۲۳ دیده می‌شود، زیرا شرکت‌ها به دنبال راه‌هایی برای کاهش هزینه‌ها در هنگام ساخت برنامه‌های کاربردی مبتنی بر هوش مصنوعی هستند.

جستجوی برداری AstraDB قابل دسترسی از طریق NoSQL Copilot مبتنی بر Google

شرکت گفت:

جستجوی برداری همراه با سایر به‌روزرسانی‌ها در داخل AstraDB از طریق یک Copilot NoSQL مجهز به Google قابل دسترسی خواهد بود که همچنین به مشتریان DataStax در ساخت برنامه‌های هوش مصنوعی کمک می‌کند.

در زیر کاپوت، کوپایلوت NoSQL جستجوی برداری کاساندرا، راس هوش مصنوعی ژنرال Google Cloud، LangChain و GCP BigQuery.

«DataStax و GCP Copilot NoSQL را به‌عنوان یک جعبه ابزار حافظه LLM طراحی کردند که سپس به LangChain متصل می‌شود و ترکیب سرویس Vertex Gen AI با Cassandra برای ذخیره‌سازی، جستجوی برداری و بازیابی تاریخچه چت را آسان می‌کند. این امر باعث می‌شود شرکت‌ها به راحتی بتوانند Copilot خود را برای برنامه‌های تجاری خود بسازند و از ترکیب خدمات هوش مصنوعی در مجموعه داده‌های خود که در کاساندرا نگهداری می‌شوند، استفاده کنند.»

چگونه هوش مصنوعی مولد را مدیریت کنیم

اتصال به LangChain، یک چارچوب متن باز با هدف ساده سازی توسعه برنامه های کاربردی مبتنی بر هوش مصنوعی با استفاده از مدل های زبان بزرگ، به دلیل یک کتابخانه متن باز که به طور مشترک توسط این دو شرکت ایجاد شده است، امکان پذیر شده است.

این کتابخانه که CassIO نامیده می شود، قصد دارد افزودن پایگاه های داده مبتنی بر Cassandra را به کیت های توسعه نرم افزار هوش مصنوعی مولد آسان کند. (SDK) مانند LangChain.

DataStax گفت: شرکت‌ها می‌توانند از CassIO برای ساخت دستیارهای هوش مصنوعی پیشرفته، ذخیره معنایی برای هوش مصنوعی مولد، مرور تاریخچه چت LLM و مدیریت الگوهای فوری Cassandra استفاده کنند.

ادغام‌های دیگر با Google شامل توانایی شرکت‌هایی است که از Google Cloud برای وارد کردن و صادرات داده‌ها از پایگاه‌های داده مبتنی بر Cassandra به انبار داده BigQuery Google با استفاده از Google Cloud Console برای ایجاد و ارائه ویژگی‌های مبتنی بر یادگیری ماشین.< /p>

RAG چیست؟ LLM های دقیق تر و قابل اعتمادتر

a ادغام دوم < DataStax گفت: /a> با Google به مشترکین AstraDB اجازه می‌دهد تا داده‌های بلادرنگ را به و از کاساندرا به سرویس‌های Google Cloud برای نظارت بر عملکرد مدل هوش مصنوعی مولد ارسال کنند.

DataStax همچنین با SpringML همکاری کرده است تا به سرعت بخشیدن به توسعه برنامه های کاربردی هوش مصنوعی با استفاده از علم داده SpringML و ارائه خدمات هوش مصنوعی کمک کند.

در دسترس بودن جستجوی برداری برای کاساندرا

AstraDB، ساخته شده بر روی Apache Cassandra، مسلماً یکی از اولین کسانی خواهد بود که جستجوی برداری را به پایگاه داده توزیع شده منبع باز می آورد. در حال حاضر، جستجوی برداری برای کاساندرا ، یک پست توسط پایگاه داده انجمنی که DataStax عضو آن است، نشان داده شد.

از نظر در دسترس بودن، جستجوی برداری AstraDB در حال حاضر می تواند در بارهای کاری غیر تولیدی استفاده شود و در پیش نمایش عمومی است، DataStax گفت که جستجو در ابتدا به طور انحصاری در Google Cloud در دسترس خواهد بود و بعداً به سایر ابرهای عمومی گسترش خواهد یافت.< /p>