Kinetica میگوید پرسوجوهای زبان طبیعی ساختهشده به پایگاه داده از طریق API ChatGPT برای تولید یک نحو پرس و جو SQL که میتواند برای تولید نتایج اجرا شود، هدایت میشوند.
Kinetica، ارائهدهنده پایگاه داده رابطهای برای پردازش تحلیلی آنلاین (OLAP) و تجزیه و تحلیل بلادرنگ، از قدرت OpenAI’s ChatGPT برای اینکه توسعه دهندگان از پردازش زبان طبیعی برای انجام پرس و جوهای SQL.
Kinetica که پایگاه داده خود را در انواع مختلفی از جمله میزبانی، SaaS و داخلی ارائه میکند، روز سهشنبه اعلام کرد که ادغام ChatGPT را بدون هیچ هزینهای در نسخه توسعهدهنده رایگان خود ارائه میکند و افزود که نسخه توسعهدهنده را میتوان بر روی هر کسی نصب کرد. لپ تاپ یا رایانه شخصی.
شرکت گفت
اینترفیس ChatGPT که در قسمت جلویی کینتیکا ورکبنچ تعبیه شده است، میتواند به هر سؤالی که به زبان طبیعی درباره مجموعههای داده اختصاصی در پایگاه داده پرسیده میشود پاسخ دهد.
“آنچه ChatGPT به جدول می آورد این است که زبان طبیعی را به زبان جستجوی ساختاریافته (SQL) تبدیل می کند. بنابراین، کاربر میتواند هر درخواستی را تایپ کند و میتواند یک تماس API از ChatGPT ارسال کند. فیلیپ دارینگر، معاون مدیریت محصول در Kinetica، گفت: و در ازای آن، شما آن دستور SQL را دریافت می کنید که می تواند برای ایجاد نتایج اجرا شود.
“بعلاوه، می تواند هدف پرس و جو را درک کند. این بدان معناست که کاربر مجبور نیست نام دقیق ستون ها را برای اجرای یک پرس و جو بداند. موتور AI مولد از پرس و جو استنباط می کند و آن را به ستون صحیح نگاشت می کند. دارینگر گفت: این یک گام بزرگ به جلو است.
مدیران محصول Kinetica به منظور استنتاج از پرسوجوها به زبان طبیعی، برخی اعلانها و زمینهها را بر اساس دانش خود از پایگاههای داده قبلاً مستقر شده در ChatGPT ترکیب کردند.
دارینگر گفت: «ما تعاریف جدول و ابردادههای خاصی را در مورد دادهها به موتور هوش مصنوعی مولد ارسال میکنیم،» و افزود که هیچ داده سازمانی با ChatGPT به اشتراک گذاشته نمیشود.
طبق گفته این شرکت، پایگاه داده همچنین میتواند به درخواستهای تحلیلی بهروز و بیدرنگ پاسخ دهد زیرا به طور مداوم دادههای جریانی را دریافت میکند.
بردارسازی پردازش پرس و جو را سرعت میدهد
Kinetica میگوید که بردارسازی سرعت پردازش پرسوجوها را پایگاه داده رابطهای آن افزایش میدهد.
در یک موتور پرس و جو بردار، داده ها در بلوک های با اندازه ثابت به نام بردار ذخیره می شوند و عملیات پرس و جو بر روی این بردارها به صورت موازی انجام می شود، نه بر روی عناصر داده منفرد، و افزود که این امکان پرس و جو را فراهم می کند. موتوری برای پردازش چندین عنصر داده به طور همزمان، که منجر به اجرای سریعتر پرس و جو در یک ردپای محاسباتی کوچکتر می شود.
در Kinetica، بردارسازی به دلیل استفاده ترکیبی از واحدهای پردازش گرافیکی (GPU) و CPUها امکان پذیر است، این شرکت گفت که پایگاه داده از SQL-92 برای یک زبان پرس و جو استفاده می کند، درست مانند PostgreSQL a> و MySQL، و از جستجوی متن، تجزیه و تحلیل سری های زمانی، هوش موقعیت مکانی و تجزیه و تحلیل نمودار پشتیبانی می کند – که اکنون می توان به همه آنها از طریق زبان طبیعی دسترسی داشت.
Kinetica ادعا می کند که ادغام ChatGPT استفاده از دیتابیس آن را آسان تر می کند، بهره وری را افزایش می دهد و بینش داده ها را بهبود می بخشد.
برادلی شیمین، تحلیلگر ارشد در Omdia Research گفت: «مدیران پایگاه داده، دانشمندان داده و سایر متخصصان از این روش برای تسریع، اصلاح و گسترش رابط خط فرمان و کارهای API که به صورت برنامهریزی انجام میدهند، استفاده خواهند کرد. p>
به گفته Shimmin
Kinetica یکی از اولین شرکتهای پایگاه داده است که ChatGPT یا ویژگیهای هوش مصنوعی تولیدی را در یک پایگاه داده یکپارچه کرده است.
«در خود پایگاههای داده، با این حال، تلاش کمتری برای ادغام پرسوجو به زبان طبیعی (NLQ) صورت گرفته است، زیرا این پلتفرمها توسط مدیران پایگاه داده، توسعهدهندگان و سایر متخصصانی که به کار با SQL، Spark، Python، و شیمین گفت، با اشاره به اینکه فروشندگان در هوش تجاری (BI) بازار در ادغام NLQ پیشرفت بیشتری داشته است.
به گفته Shimmin، استفاده Kinetica از ChatGPT برای پرس و جوی زبان طبیعی، به طور دقیق، جستجوی واقعی پایگاه داده نیست.
«آنچه Kinetica در مورد آن صحبت می کند استفاده نکردن از زبان طبیعی برای پرس و جو از پایگاه داده است. در عوض، Kinetica به همان روشی عمل میکند که Pinecone، Chroma، و دیگر پایگاههای داده برداری، با ایجاد یک فهرست قابل جستجو (نمای برداری) از دادههای شرکتی که میتواند به مدلهای زبان طبیعی مانند ChatGPT داده شود تا روشی طبیعی برای جستجوی دادههای برداری ایجاد کند. شیمین گفت: خیلی نرم است
Shimmin افزود: «یکی از اجرای بسیار محبوب این نوع پرس و جوی مکالمه، ترکیب Chroma، LangChain و ChatGPT است. LangChain یک چارچوب توسعه نرم افزار است.
Shimmin گفت: اگرچه ممکن است رقابت وجود داشته باشد، Kinetica میتواند با ادغام زبان طبیعی به سود خود برسد.
«پایگاههای اطلاعاتی وکتوری در سال ۲۰۲۳ بهترین راه حل خواهند بود، زیرا متخصصان سازمانی شروع به جستجوی راههایی برای قرار دادن مدلهای زبان بزرگ (LLM) در پشت دیوار آتش میکنند، بدون اینکه نیازی به صرف هزینه زیادی برای آموزش LLM یا LLM خود داشته باشند. تنظیم یک LLM موجود با استفاده از داده های شرکت،” Shimmin گفت.
Kinetica گفت که در صورت بروز موارد استفاده جدید، آماده همکاری با سایر ارائه دهندگان LLM است.
چاد میلی، مدیر ارشد بازاریابی در Kinetica، گفت: «ما فکر میکنیم با گذشت زمان، موارد استفاده دیگری وجود خواهد داشت که در آنها منطقی است که مدلها را دقیق تنظیم کنیم یا حتی با مدلهای دیگر کار کنیم.
این شرکت که بیش از نیمی از درآمد خود را از سازمانهای دولتی ایالات متحده مانند NORAD به دست میآورد، مشتریانی در فضای خودروی متصل به همراه مشتریانی در لجستیک، خدمات مالی، مخابرات و بخش سرگرمی دارد.
(این داستان برای روشن شدن اطلاعات در مورد پایگاه مشتریان Kinetic به روز شده است.)
پست های مرتبط
Kinetica روی ChatGPT برای جستجوهای پایگاه داده SQL زبان طبیعی ضربه می زند
Kinetica روی ChatGPT برای جستجوهای پایگاه داده SQL زبان طبیعی ضربه می زند
Kinetica روی ChatGPT برای جستجوهای پایگاه داده SQL زبان طبیعی ضربه می زند