سازمانها دانشمندان داده را برای توسعه مدلهای ML و آزمایش با هوش مصنوعی استخدام میکنند، اما تأثیر کسبوکار برای بسیاری از شرکتهای بزرگ عقب مانده است.
در گزارش وضعیت Modelops 2022، ۵۱٪ شرکتهای بزرگ آزمایشهای اولیه یا آزمایشهایی را در زمینه هوش مصنوعی انجام دادهاند، اما هنوز آنها را وارد مرحله تولید نکردهاند. تنها ۳۸ درصد گزارش کردند که می توانند به سؤالات اجرایی در مورد بازگشت سرمایه در هوش مصنوعی پاسخ دهند و ۴۳ درصد گفتند که شرکت آنها در یافتن و رفع مشکلات در زمان مناسب ناکارآمد است.
این چالشها این سؤال را مطرح میکنند که چگونه میتوان بهرهوری توسعه، ارائه و مدیریت مدلهای ML در تولید را بهبود بخشید.
MLops یا modelops؟ ممکن است به هر دو نیاز داشته باشید
اکنون دانشمندان داده ابزارهای تحلیلی زیادی دارند. برای توسعه مدلهایی، از جمله Alteryx، AWS SageMaker، Dataiku، DataRobot، Google Vertex AI، KNIME، Microsoft Azure Machine Learning، SAS و غیره را انتخاب کنید. همچنین پلتفرمهای Mlops وجود دارد که به تیمهای علم داده کمک میکند ابزارهای تجزیه و تحلیل خود را یکپارچه کنند، آزمایشها را اجرا کنند و مدلهای ML را در طول فرآیند توسعه به کار گیرند.
روهیت تاندون، مدیر کل ReadyAI و مدیر عامل Deloitte Consulting، نقش Mlops را در استقرار هوش مصنوعی در مقیاس بزرگ توضیح می دهد. از آنجایی که شرکتها به دنبال افزایش ظرفیت توسعه هوش مصنوعی از دهها مدل به صدها یا حتی هزاران مدل ML هستند، میتوانند از همان رشته مهندسی و عملیاتی بهره ببرند که در توسعه نرمافزار ارائه شده است. Mlops میتواند به خودکارسازی گردشهای کاری دستی و ناکارآمد و سادهسازی تمام مراحل ساخت و مدیریت مدل کمک کند.”
اگرچه بسیاری از پلتفرمهای Mlops از مدلهای استقرار و نظارت در تولیدات پشتیبانی میکنند، وظیفه اصلی آنها خدمت به دانشمندان داده در طول توسعه، آزمایش و بهبود فرآیندها است. هدف پلتفرمهای Modelops و شیوهها پر کردن شکاف با ارائه همکاری، ابزارهای هماهنگسازی و گزارشدهی در مورد اینکه چه مدلهای ML در تولید اجرا میشوند و عملکرد آنها از منظر عملیاتی، انطباق، و تجاری چقدر خوب است.
یک راه برای فکر کردن درباره MLops در مقابل modelops این است که MLops برای علم داده شبیه به ابزارهای devops است، در حالی که modelops راهبری، همکاری و گزارشدهی را در اطراف چرخه حیات ML با تمرکز بر عملیات، نظارت و پشتیبانی ارائه میکند.
نمونه موارد استفاده از modelops شامل بانکهایی است که مدلهای تأیید اعتبار را توسعه میدهند، بیمارستانهایی که از ML برای شناسایی ناهنجاریهای بیمار استفاده میکنند، و خرده فروشانی که از ML برای متعادل کردن توان تولید با تقاضای مشتری استفاده می کنند. در این موارد، سهامداران کسب و کار به دنبال ML قابل توضیح هستند و باید به پیش بینی ها اعتماد کنند. در برخی موارد، تنظیمکنندهها به شفافیت مدل نیاز دارند.
مطمئناً بین Mlops، modelops و حتی dataops همپوشانی گیجکنندهای در اصطلاح و قابلیتها وجود دارد. در فکر چگونگی کمک به دانشمندان داده در استقرار، مدیریت و ارائه گزارشهای تجاری در مورد مدلهای سازگار، پنج قابلیت modelops را برای بهبود بهرهوری علم داده ارائه میدهم.
۱. با استفاده از کاتالوگ مدلهای یادگیری ماشین
همکاری کنید
آیا تیمهای علم داده میدانند که چه مدلهای یادگیری ماشینی در حال تولید هستند و چقدر خوب عمل میکنند؟ درست مانند حاکمیت داده و دیتاوپ ها از کاتالوگ های داده به عنوان منبعی برای مجموعه داده های موجود استفاده می کنند، مدلوپ ها نیز می توانند شفافیت عملیاتی را برای مدل های ML فراهم کنند.
دیمیتری پتروف، یکی از بنیانگذاران و مدیرعامل Iterative، میگوید: «بهرهوری دانشمندان داده را میتوان با سرعتی که میتوانند مدلها را در برنامهها و خدمات سازمان خود به بازار عرضه کنند، اندازهگیری کرد. برای انجام این کار، من توصیه میکنم دید و همکاری بین تیمهای علم داده را بهبود ببخشید.”
Petrov پیشنهاد میکند که «یک مکان مرکزی برای ذخیره تمام اطلاعات مربوط به مدل، مانند دادهها، آزمایشها، معیارها، و فراپارامترها، و اتصال به ابزارهای devops-oriented وجود داشته باشد تا تولید مدلها راحتتر انجام شود».
>
۲. یک مسیر ثابت و خودکار برای تولید ایجاد کنید
ابزارهای devops که پتروف ذکر میکند به طور خاص به ابزارهای CI/CD برای کمک به انتقال کد، پارامترها و مصنوعات داده به محیطهای زمان اجرا اشاره دارد. پیادهسازی استقرار مستمر در محیطهای تولید، ذینفعان بیشتری برای کسبوکار دارد، بهویژه زمانی که مدلهای پیشبینی نیاز به بررسی انطباق دارند.
Manasi Vartak، بنیانگذار و مدیر عامل Verta، پیشنهاد میکند: «مدلسازی پلتفرمها با چکلیستهای آمادگی، گردش کار خودکار، و کنترلهای دسترسی داخلی برای حاکمیت، میتواند واگذاری را تسهیل و تسریع کند.» او ادامه می دهد، “تیم های علم داده مدل ها را به مدیریت ریسک مدل، مهندسی ML، SRE، و تیم های توسعه می دهند تا از قابلیت اطمینان عملیاتی، حاکمیت، امنیت و مقیاس پذیری استقرارهای حیاتی و بلادرنگ هوش مصنوعی اطمینان حاصل کنند.” p>
۳. مدلهای ML را برای عملیات و انطباق نظارت کنید
کمک به دانشمندان داده برای خودکارسازی و استقرار سریعتر مدلهای بیشتر، میتواند مشکلات تجاری ایجاد کند، اگر یک مدل عملیاتی مدلops وجود نداشته باشد.
همانطور که Kjell Carlsson، رئیس استراتژی علم داده و تبشیر در آزمایشگاه داده دومینو توضیح می دهد، یک نیاز عملیاتی کلیدی نظارت بر مدل است. با کمک پلتفرمهای مدلوپ، دانشمندان داده میتوانند مدلها را سریعتر توسعه دهند. در بهترین موارد، این پلتفرمها استقرار و نظارت را ساده میکنند، برای مثال، جابجایی مدل در محیطهای مختلفی که برنامههای تجاری در آن قرار دارند، چه در فضای ابری و چه در حالت اولیه.»
جان ویلز، مدیر ارشد فناوری در Alation، تعریفی ساده از دریفت مدل را به اشتراک گذاشت. او میگوید: «دریفت مدل توانایی پلتفرم برای اندازهگیری وضعیتی است که در آن توزیع ورودیهای مدل تغییر میکند». “شناسایی زودهنگام این تغییر به دانشمندان داده اجازه می دهد تا از مشکلات و اثرات منفی تجاری مرتبط با از دست دادن دقت پیشی بگیرند.”
۴. ارائه گزارش اجرایی در مورد تأثیرات کسب و کار
وقتی دانشمندان داده مدلهای ML را برای تولید و کاربران تجاری از مزایا استفاده میکنند، مدیرانی که از سرمایهگذاریهای هوش مصنوعی حمایت مالی میکنند، چگونه متوجه خواهند شد که چه زمانی نتیجه میدهند؟
کریشنا کالاکوری، مدیر عامل دیوو، میگوید: «هدف تصمیمگیریهای سریع و دقیق است، بنابراین شرکتها باید بهرهوری یک دانشمند داده را همگام با بهرهوری تحلیلگران و کاربران تجاری که هوش مصنوعی به آنها خدمت میکند اندازهگیری کنند.»
Petrov از Iterative اضافه می کند که پلتفرم های modelops باید “پیشرفت در مورد ساخت و بهبود مدل را تجسم کنند و آن را بین اعضای تیم و رهبری به اشتراک بگذارند.”
نکته آخر این است که تأثیرات AI و ML تولید همیشه برای مدیران قابل مشاهده نیست. این اغلب جزء یک تجربه مشتری، گردش کار کارمند یا یکپارچه سازی برنامه است که تأثیر را ایجاد می کند. هدف پلتفرمهای مدلوپ با گزارشدهی در سطح اجرایی، رفع این شکاف است.
۵. ارائه قابلیت هایی برای پشتیبانی از چرخه عمر مدل ML
بیایید برخی از قابلیتهای پلتفرمهای مدلوپ را که بهرهوری علم داده را بهبود میبخشد، در نظر بگیریم:
- مدیریت استقرار تولید با قابلیتهای نسخهسازی و بازگشت مجدد
- فعال کردن همکاری با سایر دانشمندان داده، ترویج اشتراک دانش و فعال کردن استفاده مجدد
- شناسایی و کمک به اولویت بندی مدل های تولیدی که عملکرد ضعیفی دارند یا نیاز به پشتیبانی دارند
- قابلیت شنیدن مدل و گزارش حسابرسی مدلها را بهبود دهید تا دانشمندان داده زمان گرانبهای خود را برای پاسخگویی به تنظیمکنندهها از دست ندهند
- گزارشدهی کسبوکار را بهطور خودکار انجام دهید تا دانشمندان داده یک منبع واحد برای به اشتراک گذاشتن با سهامداران و مدیران کسبوکار داشته باشند که تأثیرات تجاری مدلهای آنها را نشان میدهد
اینها برخی از قابلیتهایی است که رهبران هوش مصنوعی از پلتفرمهای مدلوپ میخواهند – نتایجی که برای سازمانهایی که هدفشان ارائه تأثیرات تجاری از سرمایهگذاریهای ML مهم است.
سازمانهای بیشتری با ML و AI آزمایش خواهند کرد. این سوال باقی میماند که آیا Mlops، modelops، یا دیگر بهترین شیوههای نوظهور به دانشمندان داده کمک میکند تا نتایج کسبوکار را از مدلهای در حال تولید، استقرار، مدیریت و نشان دهند.
پست های مرتبط
۵ قابلیت مدل سازی که بهره وری علم داده را افزایش می دهد
۵ قابلیت مدل سازی که بهره وری علم داده را افزایش می دهد
۵ قابلیت مدل سازی که بهره وری علم داده را افزایش می دهد