۲۹ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

نحوه بهبود عملکرد هوش مصنوعی مولد مبتنی بر ابر

پیدا کردن مشکلات ممکن است سخت باشد اما حل آنها آسان است. با رویکردی فعال و بهترین شیوه‌ها، می‌توانید از کاربران ناراضی و آسیب‌دیدگی اعتبار تجاری جلوگیری کنید.

پیدا کردن مشکلات ممکن است سخت باشد اما حل آنها آسان است. با رویکردی فعال و بهترین شیوه‌ها، می‌توانید از کاربران ناراضی و آسیب‌دیدگی اعتبار تجاری جلوگیری کنید.

دوشنبه است. فقط برای اینکه با ده ها ایمیل از طرف هم تیمی های توسعه سیستم خود که درخواست می کنند فوراً با شما صحبت کنند، وارد دفتر می شوید. به نظر می رسد سیستم مدیریت موجودی مولد مبتنی بر هوش مصنوعی که یک هفته پیش راه اندازی کردید، کاربران جدید خود را ناامید کرده است. چند دقیقه طول می کشد، نه چند ثانیه. در حال حاضر ارسال ها با تاخیر انجام می شود. مشتریان به دلیل اینکه پاسخ دادن به سوالات مشتریان بیش از حد طول می کشد، تماس را با نمایندگان خدمات شما قطع می کنند. فروش وب سایت به دلیل تاخیر در عملکرد ۲۰ درصد کاهش یافته است. اوف شما مشکل عملکرد دارید.

اما شما همه چیز را درست انجام دادید. شما فقط از GPU برای پردازش آموزش و استنتاج استفاده می کنید. شما تمام تست های عملکرد توصیه شده را انجام دادید. شما فضای حافظه را بیش از حد فراهم کرده اید و فقط از سریع ترین ذخیره سازی با بهترین عملکرد ورودی/خروجی استفاده می کنید. در واقع، صورت حساب ابری شما بیش از ۱۰۰ هزار دلار در ماه است. چگونه ممکن است عملکرد ناموفق باشد؟

من این داستان را بیشتر می‌شنوم زیرا اولین پذیرندگان سیستم‌های هوش مصنوعی مولد در فضای ابری به استفاده از اولین یا دومین سیستم خود رسیده‌اند. زمان هیجان انگیزی است زیرا ارائه دهندگان ابر قابلیت های هوش مصنوعی مولد خود را تبلیغ می کنند، و شما اساساً پیکربندی های معماری که دیدید را در آخرین کنفرانس بزرگ با برند ابری کپی می کنید. شما یک پیرو هستید و آنچه را که معتقدید معماری‌ها و بهترین شیوه‌های اثبات شده است دنبال کرده‌اید.

نحوه استفاده از GPT به عنوان یک زبان طبیعی برای موتور جستجوی SQL

مشکلات عملکردی در حال ظهور

تشخیص مشکلات اصلی مدل‌های با عملکرد ضعیف دشوار است، اما راه‌حل معمولاً به راحتی قابل پیاده‌سازی است. مشکلات عملکرد معمولاً از یک مؤلفه منشأ می‌گیرد که عملکرد کلی سیستم هوش مصنوعی را محدود می‌کند: یک دروازه API کند، یک مؤلفه شبکه بد، یا حتی مجموعه بدی از کتابخانه‌های مورد استفاده برای آخرین ساخت. تصحیح آن ساده است، اما یافتن آن بسیار دشوارتر است.

بیایید به اصول اولیه بپردازیم.

تأخیر بالا در سیستم‌های هوش مصنوعی مولد می‌تواند بر برنامه‌های بلادرنگ، مانند پردازش زبان طبیعی یا تولید تصویر تأثیر بگذارد. اتصال شبکه غیربهینه یا تخصیص ناکارآمد منابع می تواند به تأخیر کمک کند. تجربه من می گوید از آنجا شروع کنید.

مدل‌های هوش مصنوعی مولد می‌توانند منابع فشرده باشند. بهینه سازی منابع در ابر عمومی برای اطمینان از عملکرد کارآمد و در عین حال به حداقل رساندن هزینه ها ضروری است. این شامل قابلیت‌های مقیاس‌بندی خودکار و انتخاب انواع نمونه‌های مناسب برای مطابقت با نیازهای حجم کار است. همانطور که آنچه ارائه کرده‌اید را مرور می‌کنید، ببینید آیا آن منابع به اشباع رسیده‌اند یا علائم مشکلات عملکرد را نشان می‌دهند. نظارت بهترین روشی است که بسیاری از سازمان ها آن را نادیده می گیرند. باید یک استراتژی مشاهده پذیری در مورد برنامه ریزی مدیریت سیستم هوش مصنوعی شما وجود داشته باشد و تشخیص بدتر شدن عملکرد هنگام استفاده از این ابزارها نسبتاً آسان است.

مقیاس‌سازی حجم‌های کاری مولد هوش مصنوعی برای پاسخگویی به تقاضای نوسان می‌تواند چالش‌برانگیز باشد و اغلب می‌تواند مشکلاتی ایجاد کند. پیکربندی‌های مقیاس‌بندی خودکار ناکارآمد و متعادل‌سازی بار نامناسب می‌توانند توانایی مقیاس‌سازی کارآمد منابع را مختل کنند.

مدیریت فرآیندهای آموزش و استنتاج مدل‌های هوش مصنوعی مولد نیازمند گردش‌کاری است که آموزش و استنتاج مدل کارآمد را تسهیل می‌کند. البته، این باید در حالی انجام شود که از مقیاس پذیری و انعطاف پذیری ارائه شده توسط ابر عمومی استفاده شود.

Microsoft Azure Fluid Relay تبدیل به GA می شود

مسائل عملکرد استنباط اغلب مقصر هستند، و اگرچه تمایل به صرف منابع و پول برای مشکل است، رویکرد بهتر این است که ابتدا مدل را تنظیم کنید. قابلیت تنظیم بخشی از اکثر ابزارهای هوش مصنوعی هستند. آنها باید بتوانند راهنمایی هایی را در مورد اینکه جداول باید برای مورد خاص شما تنظیم شوند، ارائه دهند.

مشکلات دیگری که باید جستجو کنید

آموزش مدل‌های هوش مصنوعی مولد می‌تواند زمان‌بر و بسیار پرهزینه باشد، به‌ویژه زمانی که با مجموعه‌های داده بزرگ و معماری‌های پیچیده سروکار داریم. استفاده ناکارآمد از قابلیت‌های پردازش موازی و منابع ذخیره‌سازی می‌تواند فرآیند آموزش مدل را طولانی‌تر کند.

به خاطر داشته باشید که ما در بسیاری از موارد از پردازنده‌های گرافیکی استفاده می‌کنیم که خرید یا اجاره آنها ارزان نیستند. آموزش مدل باید تا حد امکان کارآمد باشد و تنها زمانی رخ دهد که مدل ها نیاز به به روز رسانی داشته باشند. شما گزینه های دیگری برای دسترسی به اطلاعات مورد نیاز دارید، مانند تولید تقویت شده بازیابی (RAG).

RAG رویکردی است که در پردازش زبان طبیعی (NLP) استفاده می‌شود که بازیابی اطلاعات را با خلاقیت تولید متن ترکیب می‌کند. این محدودیت‌های مدل‌های زبان سنتی را که اغلب با دقت واقعی مشکل دارند، برطرف می‌کند و دسترسی به دانش خارجی و به‌روز را ارائه می‌دهد.

می توانید پردازش استنتاج را با دسترسی به سایر منابع اطلاعاتی که می توانند اعتبارسنجی کرده و اطلاعات به روز شده را در صورت نیاز به مدل اضافه کنند، تقویت کنید. این بدان معنی است که مدل نیازی به آموزش مجدد یا به روز رسانی به دفعات زیاد ندارد که منجر به کاهش هزینه و عملکرد بهتر می شود.

در نهایت، اطمینان از امنیت و انطباق سیستم‌های هوش مصنوعی مولد در ابرهای عمومی بسیار مهم است. حفظ حریم خصوصی داده ها، کنترل های دسترسی و انطباق با مقررات می تواند بر عملکرد تأثیر بگذارد، اگر به اندازه کافی مورد توجه قرار نگیرد. من اغلب متوجه می شوم که حاکمیت انطباق اغلب در طول آزمایش عملکرد نادیده گرفته می شود.

Balerina: یک زبان برنامه نویسی برای ابر

بهترین شیوه ها برای مدیریت عملکرد هوش مصنوعی

توصیه من در اینجا سرراست است و به اکثر بهترین روش هایی که قبلاً از آنها اطلاع دارید مربوط می شود.

  • آموزش. در مورد آنچه افرادی که از ابزارهای هوش مصنوعی شما پشتیبانی می کنند در مورد مدیریت عملکرد می گویند مطلع باشید. مطمئن شوید که چند نفر از اعضای تیم برای تمرینات مکرر ثبت نام کرده اند.
  • قابلیت مشاهده. من قبلاً به این موضوع اشاره کرده‌ام، اما یک برنامه مشاهده‌پذیری صدا در اختیار دارید. این شامل ابزارهای نظارتی کلیدی می شود که می توانند قبل از اینکه کاربران مشکلات مربوط به عملکرد را تجربه کنند، هشدار دهند. وقتی این اتفاق بیفتد، خیلی دیر است. شما اعتبار خود را از دست داده اید.
  • آزمایش. اکثر سازمان ها تست عملکرد را بر روی سیستم های هوش مصنوعی مبتنی بر ابر خود انجام نمی دهند. ممکن است به شما گفته شده باشد که نیازی نیست زیرا همیشه می توانید منابع بیشتری را اختصاص دهید. این فقط احمقانه است. تست عملکرد را به عنوان بخشی از استقرار انجام دهید. بدون استثنا.
  • عملیات عملکرد. تا زمانی که مشکلی پیش نیاید منتظر رسیدگی به عملکرد نباشید. به طور مداوم آن را مدیریت کنید. اگر به مشکلات عملکرد واکنش نشان می دهید، قبلاً ضرر کرده اید.

این از بین نمی رود. همانطور که سیستم‌های هوش مصنوعی مولدتر ظاهر می‌شوند، چه در فضای ابری و چه داخلی، مشکلات عملکردی بیش‌تری از آنچه که مردم اکنون می‌دانند به وجود می‌آیند. نکته کلیدی در اینجا این است که فعال باشید. منتظر آن سورپرایزهای صبح دوشنبه نباشید. آنها سرگرم کننده نیستند.