۵ قابلیت مدل سازی که بهره وری علم داده را افزایش می دهد

سازمان‌ها دانشمندان داده را برای توسعه مدل‌های ML و آزمایش با هوش مصنوعی استخدام می‌کنند، اما تأثیر کسب‌وکار برای بسیاری از شرکت‌های بزرگ عقب مانده است.

در گزارش وضعیت Modelops 2022، ۵۱٪ شرکت‌های بزرگ آزمایش‌های اولیه یا آزمایش‌هایی را در زمینه هوش مصنوعی انجام داده‌اند، اما هنوز آنها را وارد مرحله تولید نکرده‌اند. تنها ۳۸ درصد گزارش کردند که می توانند به سؤالات اجرایی در مورد بازگشت سرمایه در هوش مصنوعی پاسخ دهند و ۴۳ درصد گفتند که شرکت آنها در یافتن و رفع مشکلات در زمان مناسب ناکارآمد است.

این چالش‌ها این سؤال را مطرح می‌کنند که چگونه می‌توان بهره‌وری توسعه، ارائه و مدیریت مدل‌های ML در تولید را بهبود بخشید.

MLops یا modelops؟ ممکن است به هر دو نیاز داشته باشید

اکنون دانشمندان داده ابزارهای تحلیلی زیادی دارند. برای توسعه مدل‌هایی، از جمله Alteryx، AWS SageMaker، Dataiku، DataRobot، Google Vertex AI، KNIME، Microsoft Azure Machine Learning، SAS و غیره را انتخاب کنید. همچنین پلتفرم‌های Mlops وجود دارد که به تیم‌های علم داده کمک می‌کند ابزارهای تجزیه و تحلیل خود را یکپارچه کنند، آزمایش‌ها را اجرا کنند و مدل‌های ML را در طول فرآیند توسعه به کار گیرند.

روهیت تاندون، مدیر کل ReadyAI و مدیر عامل Deloitte Consulting، نقش Mlops را در استقرار هوش مصنوعی در مقیاس بزرگ توضیح می دهد. از آنجایی که شرکت‌ها به دنبال افزایش ظرفیت توسعه هوش مصنوعی از ده‌ها مدل به صدها یا حتی هزاران مدل ML هستند، می‌توانند از همان رشته مهندسی و عملیاتی بهره ببرند که در توسعه نرم‌افزار ارائه شده است. Mlops می‌تواند به خودکارسازی گردش‌های کاری دستی و ناکارآمد و ساده‌سازی تمام مراحل ساخت و مدیریت مدل کمک کند.”

اگرچه بسیاری از پلتفرم‌های Mlops از مدل‌های استقرار و نظارت در تولیدات پشتیبانی می‌کنند، وظیفه اصلی آنها خدمت به دانشمندان داده در طول توسعه، آزمایش و بهبود فرآیندها است. هدف پلتفرم‌های Modelops و شیوه‌ها پر کردن شکاف با ارائه همکاری، ابزارهای هماهنگ‌سازی و گزارش‌دهی در مورد اینکه چه مدل‌های ML در تولید اجرا می‌شوند و عملکرد آن‌ها از منظر عملیاتی، انطباق، و تجاری چقدر خوب است.

لانگ اسمیت چیست؟ ردیابی و اشکال زدایی برای LLM ها

یک راه برای فکر کردن درباره MLops در مقابل modelops این است که MLops برای علم داده شبیه به ابزارهای devops است، در حالی که modelops راهبری، همکاری و گزارش‌دهی را در اطراف چرخه حیات ML با تمرکز بر عملیات، نظارت و پشتیبانی ارائه می‌کند.

نمونه موارد استفاده از modelops شامل بانک‌هایی است که مدل‌های تأیید اعتبار را توسعه می‌دهند، بیمارستان‌هایی که از ML برای شناسایی ناهنجاری‌های بیمار استفاده می‌کنند، و خرده فروشانی که از ML برای متعادل کردن توان تولید با تقاضای مشتری استفاده می کنند. در این موارد، سهامداران کسب و کار به دنبال ML قابل توضیح هستند و باید به پیش بینی ها اعتماد کنند. در برخی موارد، تنظیم‌کننده‌ها به شفافیت مدل نیاز دارند.

مطمئناً بین Mlops، modelops و حتی dataops همپوشانی گیج‌کننده‌ای در اصطلاح و قابلیت‌ها وجود دارد. در فکر چگونگی کمک به دانشمندان داده در استقرار، مدیریت و ارائه گزارش‌های تجاری در مورد مدل‌های سازگار، پنج قابلیت modelops را برای بهبود بهره‌وری علم داده ارائه می‌دهم.

۱. با استفاده از کاتالوگ مدل‌های یادگیری ماشین

همکاری کنید

آیا تیم‌های علم داده می‌دانند که چه مدل‌های یادگیری ماشینی در حال تولید هستند و چقدر خوب عمل می‌کنند؟ درست مانند حاکمیت داده و دیتاوپ ها از کاتالوگ های داده به عنوان منبعی برای مجموعه داده های موجود استفاده می کنند، مدلوپ ها نیز می توانند شفافیت عملیاتی را برای مدل های ML فراهم کنند.

دیمیتری پتروف، یکی از بنیانگذاران و مدیرعامل Iterative، می‌گوید: «بهره‌وری دانشمندان داده را می‌توان با سرعتی که می‌توانند مدل‌ها را در برنامه‌ها و خدمات سازمان خود به بازار عرضه کنند، اندازه‌گیری کرد. برای انجام این کار، من توصیه می‌کنم دید و همکاری بین تیم‌های علم داده را بهبود ببخشید.”

Petrov پیشنهاد می‌کند که «یک مکان مرکزی برای ذخیره تمام اطلاعات مربوط به مدل، مانند داده‌ها، آزمایش‌ها، معیارها، و فراپارامترها، و اتصال به ابزارهای devops-oriented وجود داشته باشد تا تولید مدل‌ها راحت‌تر انجام شود».

۲. یک مسیر ثابت و خودکار برای تولید ایجاد کنید

ابزارهای devops که پتروف ذکر می‌کند به طور خاص به ابزارهای CI/CD برای کمک به انتقال کد، پارامترها و مصنوعات داده به محیط‌های زمان اجرا اشاره دارد. پیاده‌سازی استقرار مستمر در محیط‌های تولید، ذینفعان بیشتری برای کسب‌وکار دارد، به‌ویژه زمانی که مدل‌های پیش‌بینی نیاز به بررسی انطباق دارند.

زبان Logica گوگل ایرادات SQL را برطرف می کند

Manasi Vartak، بنیانگذار و مدیر عامل Verta، پیشنهاد می‌کند: «مدل‌سازی پلتفرم‌ها با چک‌لیست‌های آمادگی، گردش کار خودکار، و کنترل‌های دسترسی داخلی برای حاکمیت، می‌تواند واگذاری را تسهیل و تسریع کند.» او ادامه می دهد، “تیم های علم داده مدل ها را به مدیریت ریسک مدل، مهندسی ML، SRE، و تیم های توسعه می دهند تا از قابلیت اطمینان عملیاتی، حاکمیت، امنیت و مقیاس پذیری استقرارهای حیاتی و بلادرنگ هوش مصنوعی اطمینان حاصل کنند.” p>

۳. مدل‌های ML را برای عملیات و انطباق نظارت کنید

کمک به دانشمندان داده برای خودکارسازی و استقرار سریع‌تر مدل‌های بیشتر، می‌تواند مشکلات تجاری ایجاد کند، اگر یک مدل عملیاتی مدلops وجود نداشته باشد.

همانطور که Kjell Carlsson، رئیس استراتژی علم داده و تبشیر در آزمایشگاه داده دومینو توضیح می دهد، یک نیاز عملیاتی کلیدی نظارت بر مدل است. با کمک پلتفرم‌های مدلوپ، دانشمندان داده می‌توانند مدل‌ها را سریع‌تر توسعه دهند. در بهترین موارد، این پلتفرم‌ها استقرار و نظارت را ساده می‌کنند، برای مثال، جابجایی مدل در محیط‌های مختلفی که برنامه‌های تجاری در آن قرار دارند، چه در فضای ابری و چه در حالت اولیه.»

جان ویلز، مدیر ارشد فناوری در Alation، تعریفی ساده از دریفت مدل را به اشتراک گذاشت. او می‌گوید: «دریفت مدل توانایی پلتفرم برای اندازه‌گیری وضعیتی است که در آن توزیع ورودی‌های مدل تغییر می‌کند». “شناسایی زودهنگام این تغییر به دانشمندان داده اجازه می دهد تا از مشکلات و اثرات منفی تجاری مرتبط با از دست دادن دقت پیشی بگیرند.”

۴. ارائه گزارش اجرایی در مورد تأثیرات کسب و کار

وقتی دانشمندان داده مدل‌های ML را برای تولید و کاربران تجاری از مزایا استفاده می‌کنند، مدیرانی که از سرمایه‌گذاری‌های هوش مصنوعی حمایت مالی می‌کنند، چگونه متوجه خواهند شد که چه زمانی نتیجه می‌دهند؟

Google API LLM ها را به دستگاه های اندروید و iOS می آورد

کریشنا کالاکوری، مدیر عامل دیوو، می‌گوید: «هدف تصمیم‌گیری‌های سریع و دقیق است، بنابراین شرکت‌ها باید بهره‌وری یک دانشمند داده را همگام با بهره‌وری تحلیلگران و کاربران تجاری که هوش مصنوعی به آنها خدمت می‌کند اندازه‌گیری کنند.»

Petrov از Iterative اضافه می کند که پلتفرم های modelops باید “پیشرفت در مورد ساخت و بهبود مدل را تجسم کنند و آن را بین اعضای تیم و رهبری به اشتراک بگذارند.”

نکته آخر این است که تأثیرات AI و ML تولید همیشه برای مدیران قابل مشاهده نیست. این اغلب جزء یک تجربه مشتری، گردش کار کارمند یا یکپارچه سازی برنامه است که تأثیر را ایجاد می کند. هدف پلتفرم‌های مدلوپ با گزارش‌دهی در سطح اجرایی، رفع این شکاف است.

۵. ارائه قابلیت هایی برای پشتیبانی از چرخه عمر مدل ML

بیایید برخی از قابلیت‌های پلتفرم‌های مدلوپ را که بهره‌وری علم داده را بهبود می‌بخشد، در نظر بگیریم:

مدیریت استقرار تولید با قابلیت‌های نسخه‌سازی و بازگشت مجدد
فعال کردن همکاری با سایر دانشمندان داده، ترویج اشتراک دانش و فعال کردن استفاده مجدد
شناسایی و کمک به اولویت بندی مدل های تولیدی که عملکرد ضعیفی دارند یا نیاز به پشتیبانی دارند
قابلیت شنیدن مدل و گزارش حسابرسی مدل‌ها را بهبود دهید تا دانشمندان داده زمان گرانبهای خود را برای پاسخگویی به تنظیم‌کننده‌ها از دست ندهند
گزارش‌دهی کسب‌وکار را به‌طور خودکار انجام دهید تا دانشمندان داده یک منبع واحد برای به اشتراک گذاشتن با سهامداران و مدیران کسب‌وکار داشته باشند که تأثیرات تجاری مدل‌های آنها را نشان می‌دهد

اینها برخی از قابلیت‌هایی است که رهبران هوش مصنوعی از پلتفرم‌های مدلوپ می‌خواهند – نتایجی که برای سازمان‌هایی که هدفشان ارائه تأثیرات تجاری از سرمایه‌گذاری‌های ML مهم است.

سازمان‌های بیشتری با ML و AI آزمایش خواهند کرد. این سوال باقی می‌ماند که آیا Mlops، modelops، یا دیگر بهترین شیوه‌های نوظهور به دانشمندان داده کمک می‌کند تا نتایج کسب‌وکار را از مدل‌های در حال تولید، استقرار، مدیریت و نشان دهند.

MLops یا modelops؟ ممکن است به هر دو نیاز داشته باشید

۱. با استفاده از کاتالوگ مدل‌های یادگیری ماشین

۲. یک مسیر ثابت و خودکار برای تولید ایجاد کنید

۳. مدل‌های ML را برای عملیات و انطباق نظارت کنید

۴. ارائه گزارش اجرایی در مورد تأثیرات کسب و کار

۵. ارائه قابلیت هایی برای پشتیبانی از چرخه عمر مدل ML

پست های مرتبط

۵ قابلیت مدل سازی که بهره وری علم داده را افزایش می دهد

۵ قابلیت مدل سازی که بهره وری علم داده را افزایش می دهد

۵ قابلیت مدل سازی که بهره وری علم داده را افزایش می دهد

شاید به این مطالب علاقمند باشید

۵ قابلیت مدل سازی که بهره وری علم داده را افزایش می دهد

۵ قابلیت مدل سازی که بهره وری علم داده را افزایش می دهد

۵ قابلیت مدل سازی که بهره وری علم داده را افزایش می دهد

۵ قابلیت مدل سازی که بهره وری علم داده را افزایش می دهد