API جدید به گونهای طراحی شده است که فرایند توسعه و آزمون نمایندگان را سرعت بخشد تا نمایندگان بتوانند سریعتر در محیط تولید مستقر شوند.
همزمان با رشد تقاضای شرکتها برای ساخت سامانههای چندعامله، خدمات زیرساخت دادهای ارائهدهنده شرکت Databricks، ماژول ارزیابی عامل Mosaic AI خود را با یک API جدید برای تولید دادههای مصنوعی بهروزرسانی میکند که به شرکتها کمک میکند تا عوامل را سریعتر ارزیابی کنند.
سیستمهای چندعامله، که بهعنوان هوش مصنوعی عامله نیز شناخته میشوند، توجه شرکتها را به خود جلب کردهاند زیرا این عوامل فراتر از صرفاً تولید کد یا محتوا برای بازبینی انسانی میروند. سیستمهای هوش مصنوعی عامله میتوانند دستورات را دنبال کنند، تصمیم بگیرند و اقداماتی انجام دهند همانطور که یک کارگر انسانی انجام میدهد، بدون دخالت انسانی.
API جدید، که در حال حاضر در پیشنمایش عمومی است، برای تسریع فرایند توسعه و آزمون عامل طراحی شده است تا عوامل بتوانند سریعتر در محیط تولید مستقر شوند.
تولید دادههای مصنوعی فرایند ایجاد مجموعههای دادهٔ مصنوعی است که مشابه دادههای واقعی هستند و میتوان از آنها برای آزمایش یا آموزش عوامل یا مدلها استفاده کرد.
API جدید Databricks از دادههای اختصاصی یک شرکت استفاده میکند تا مجموعههای دادهٔ ارزیابی را متناسب با مورد استفادهای که عامل برای آن به کار میرود، تولید کند.
در مقابل، فرایند ساخت دادههای ارزیابی بهصورت دستی زمانبر است و ممکن است همیشه برای آزمون کارکرد عامل دقیق نباشد.
به گفته شرکت، API تولید دادههای مصنوعی همچنین هزینههای توسعه را کاهش میدهد، زیرا به توسعهدهندگان امکان میدهد بهسرعت دادههای ارزیابی را تولید کنند و هفتهها تا ماهها زمان مورد نیاز برای برچسبگذاری دادههای ارزیابی توسط متخصصان موضوعی را کنار بگذارند.
Databricks اعلام کرد که مشتریان شرکتی خود هماکنون از مزایای API جدید بهرهمند میشوند. یکی از این مشتریان، تولیدکنندهٔ قطعات مهندسی Lippert است که از دادههای مصنوعی برای بهبود پاسخ مدل به میزان ۶۰٪ استفاده کرده است.
چگونه کار میکند؟
به طور کلی، API در سه مرحله کار میکند: فراخوانی API، درخواست تولید تعداد سوالها، و سپس تنظیم راهنماییهای زبان طبیعی برای کمک به تولید مصنوعی.
پس از دریافت ورودی، API به تولید مجموعهای از ترکیبهای سوال‑پاسخ‑منبع‑سند مصنوعی بر اساس دادههای شرکتی در طرحواره ارزیابی عامل کمک میکند.
شرکتها میتوانند سپس این مجموعه ارزیابی تولید شده را به mflow.evaluate(…) ارسال کنند، که قضات LLM اختصاصی ارزیابی عامل را اجرا میکند تا کیفیت عامل را ارزیابی کرده و دلیل اصلی هر مشکل کیفیتی را شناسایی کند، به گفته Databricks در یک پست وبلاگی.
برای مرور نتایج تحلیل کیفیت، شرکتها میتوانند از رابط کاربری MLflow Evaluation استفاده کنند و از طریق این رابط تغییراتی در عوامل ایجاد کنند تا کیفیت بهبود یابد، شرکت افزود.
عامل بهبود یافته میتواند با اجرای مجدد mlflow.evaluate(…) دوباره آزمایش شود.
Databricks همچنین به شرکتها این گزینه را میدهد که دادههای مصنوعی تولید شده را برای تجزیه و تحلیل توسط متخصصان موضوعی بررسی کنند.
«رابط کاربری بازبینی متخصصان موضوعی یک ویژگی جدید است که به متخصصان شما امکان میدهد بهسرعت دادههای ارزیابی تولید شدهٔ مصنوعی را برای دقت بررسی کنند و بهصورت اختیاری سوالات بیشتری اضافه نمایند»، Databricks توضیح داد و افزود که این رابطها برای افزایش کارآمدی متخصصان کسبوکار در فرایند بازبینی طراحی شدهاند تا زمان کمی از کارهای روزانه خود بگذرانند.
ویدئوی مرتبط:
پست های مرتبط
Databricks API تولید دادههای مصنوعی را معرفی میکند تا به ارزیابی سریعتر عوامل کمک کند.
Databricks API تولید دادههای مصنوعی را معرفی میکند تا به ارزیابی سریعتر عوامل کمک کند.
Databricks API تولید دادههای مصنوعی را معرفی میکند تا به ارزیابی سریعتر عوامل کمک کند.