برای موفقیت تیم های علم داده، رهبران کسب و کار باید اهمیت Mlops، modelops و چرخه زندگی یادگیری ماشین را درک کنند. این قیاس ها و مثال ها را امتحان کنید تا اصطلاحات را از بین ببرید.
اگر دانشمند داده هستید یا با مدلهای یادگیری ماشینی (ML) کار میکنید، ابزارهایی برای برچسبگذاری دادهها، محیطهای فناوری برای آموزش مدلها و درک اساسی از MLops و modelops. اگر مدلهای ML در حال تولید دارید، احتمالاً از نظارت ML برای شناسایی انحراف دادهها و سایر خطرات مدل استفاده میکنید.
تیمهای علم داده از این شیوهها و پلتفرمهای ضروری ML برای همکاری در توسعه مدل، پیکربندی زیرساخت، استقرار مدلهای ML در محیطهای مختلف و نگهداری مدلها در مقیاس استفاده میکنند. دیگرانی که به دنبال افزایش تعداد مدلهای تولید، بهبود کیفیت پیشبینیها و کاهش هزینههای نگهداری مدل ML هستند، احتمالاً به این ابزارهای مدیریت چرخه عمر ML نیز نیاز خواهند داشت.
متأسفانه، توضیح این شیوهها و ابزارها برای سهامداران کسبوکار و تصمیمگیرندگان بودجه کار آسانی نیست. این همه اصطلاحات فنی برای رهبرانی است که میخواهند بازگشت سرمایه و تأثیر تجاری سرمایهگذاریهای یادگیری ماشین و هوش مصنوعی را درک کنند و ترجیح میدهند از علفهای هرز فنی و عملیاتی دور بمانند.
دانشمندان، توسعهدهندگان و رهبران فناوری دادهها تشخیص میدهند که خرید خرید مستلزم تعریف و سادهسازی اصطلاحات است تا ذینفعان اهمیت رشتههای کلیدی را درک کنند. در ادامه مقاله قبلی درباره نحوه توضیح اصطلاحات تخصصی زبان به مدیران کسبوکار، فکر کردم مقاله مشابهی را بنویسم تا چندین روش حیاتی ML را که رهبران کسبوکار باید درک کنند، توضیح دهم.
چرخه زندگی یادگیری ماشین چیست؟
بهعنوان یک توسعهدهنده یا دانشمند داده، شما یک فرآیند مهندسی برای برداشت ایدههای جدید از مفهوم تا ارائه ارزش تجاری دارید. این فرآیند شامل تعریف بیان مسئله، توسعه و آزمایش مدلها، استقرار مدلها در محیطهای تولید، نظارت بر مدلها در تولید، و امکان نگهداری و بهبود است. ما این را یک فرآیند چرخه عمر می نامیم، زیرا می دانیم که استقرار اولین گام برای درک ارزش کسب و کار است و زمانی که مدل ها تولید شوند، ثابت نیستند و به پشتیبانی مداوم نیاز دارند.
ممکن است رهبران کسب و کار اصطلاح چرخه زندگی را درک نکنند. بسیاری هنوز توسعه نرمافزار و کار علم داده را سرمایهگذاریهای یکباره میدانند، این یکی از دلایلی است که بسیاری از سازمانها از مشکلات بدهی فناوری و کیفیت داده.
توضیح چرخه عمر با عبارات فنی در مورد توسعه مدل، آموزش، استقرار و نظارت، چشمان یک مدیر تجاری را خیره می کند. مارکوس مرل، معاون استراتژی فناوری در آزمایشگاههای سس، پیشنهاد میکند که به رهبران یک قیاس دنیای واقعی ارائه دهید.
او میگوید: «یادگیری ماشین تا حدودی مشابه کشاورزی است: محصولاتی که امروز میشناسیم نتیجه ایدهآل نسلهای قبلی است که متوجه الگوها، آزمایش با ترکیبها، و به اشتراک گذاشتن اطلاعات با کشاورزان دیگر برای ایجاد تغییرات بهتر با استفاده از دانش انباشته شدهاند.» “یادگیری ماشین تقریباً همان فرآیند مشاهده، نتیجه گیری آبشاری و ترکیب دانش است که الگوریتم شما آموزش می بیند.”
چیزی که من در مورد این قیاس دوست دارم این است که یادگیری مولد را از یک سال زراعی به سال دیگر نشان می دهد، اما همچنین می تواند در تنظیمات زمان واقعی که ممکن است در طول یک فصل رشد به دلیل آب و هوا، زنجیره تامین یا عوامل دیگر رخ دهد، تأثیر بگذارد. در صورت امکان، یافتن قیاسهایی در صنعت یا حوزهای که رهبران کسبوکار شما میفهمند، ممکن است مفید باشد.
MLops چیست؟
بیشتر توسعه دهندگان و دانشمندان داده، Mlops را معادل devops برای یادگیری ماشین می دانند. خودکارسازی زیرساختها، استقرار و سایر فرآیندهای مهندسی، همکاریها را بهبود میبخشد و به تیمها کمک میکند انرژی بیشتری را به جای انجام دستی وظایف فنی روی اهداف تجاری متمرکز کنند.
اما همه اینها برای مدیران تجاری که نیاز به تعریف ساده ای از Mlops دارند، به ویژه زمانی که تیم ها به بودجه برای ابزارها یا زمان برای ایجاد بهترین شیوه ها نیاز دارند.
Alon Gubkin، مدیر ارشد فناوری، می گوید: «MLops یا عملیات یادگیری ماشینی، تمرین همکاری و ارتباط بین علم داده، فناوری اطلاعات، و کسب و کار برای کمک به مدیریت چرخه عمر نهایی پروژه های یادگیری ماشینی است. یکی از بنیانگذاران Aporia. “MLops در مورد گرد هم آوردن تیم ها و بخش های مختلف در یک سازمان است تا اطمینان حاصل شود که مدل های یادگیری ماشین به طور موثر مستقر شده و نگهداری می شوند.”
Thibaut Gourdel، مدیر بازاریابی محصول فنی در Talend، پیشنهاد میکند جزئیات بیشتری را برای تجارت مبتنی بر داده اضافه کنید. رهبران او میگوید: «MLops استفاده از اصول نرمافزار چابک را که در پروژههای ML اعمال میشود، مانند کنترل نسخه دادهها و مدلها و همچنین اعتبارسنجی مداوم دادهها، آزمایش و استقرار ML برای بهبود تکرارپذیری و قابلیت اطمینان مدلها، علاوه بر تیمهای شما، ترویج میکند. ” بهره وری.”
دریفت داده چیست؟
هر وقت میتوانید از کلماتی استفاده کنید که تصویری را منتقل میکنند، ارتباط این اصطلاح با یک مثال یا داستان بسیار آسانتر است. یک مدیر اجرایی از مثالهایی مانند قایق که به دلیل باد از مسیر خارج میشود، میفهمد، اما ممکن است برای ترجمه آن به دنیای دادهها، توزیعهای آماری، و دقت مدل دچار مشکل شود.
کریشنارام کنتاپادی، افسر ارشد هوش مصنوعی و دانشمند در Fiddler AI. «میتواند ناگهانی باشد، مانند تغییر رفتار خرید ناشی از همهگیری COVID-19. صرف نظر از نحوه رخ دادن این تغییر، شناسایی سریع این تغییرات برای حفظ دقت مدل و کاهش تأثیر کسب و کار بسیار مهم است.»
Gubkin مثال دومی را ارائه میکند از زمانی که جابجایی دادهها تغییر تدریجیتری از دادههایی است که مدل روی آن آموزش داده شده است. “انحراف داده ها مانند این است که محصولات یک شرکت با گذشت زمان کمتر محبوب می شوند زیرا ترجیحات مصرف کنندگان تغییر کرده است.”
دیوید تالبی، مدیر ارشد فناوری آزمایشگاههای جان اسنو، یک تشبیه کلی را به اشتراک گذاشت. او میگوید: «دریفت مدل زمانی اتفاق میافتد که دقت به دلیل تغییر محیط تولیدی که در آن کار میکند کاهش یابد». «مثل اینکه ارزش یک خودروی جدید به محض اینکه شما آن را از بین ببرید، کاهش مییابد، یک مدل نیز همین کار را میکند، زیرا محیط تحقیقاتی قابل پیشبینی که در آن آموزش دیده، در تولید رفتار متفاوتی دارد. صرف نظر از اینکه چقدر خوب کار می کند، یک مدل همیشه به تعمیر و نگهداری نیاز دارد زیرا دنیای اطراف آن تغییر می کند.
پیام مهمی که رهبران علم داده باید منتقل کنند این است که از آنجایی که دادهها ثابت نیستند، مدلها باید از نظر دقت بررسی شوند و بر روی دادههای جدیدتر و مرتبطتر آموزش داده شوند.
نظارت بر ML چیست؟
یک سازنده چگونه کیفیت را قبل از بسته بندی و ارسال به خرده فروشان و مشتریان اندازه گیری می کند؟ سازندگان از ابزارهای مختلفی برای شناسایی عیوب استفاده می کنند، از جمله زمانی که خط مونتاژ شروع به نشان دادن انحراف از کیفیت خروجی قابل قبول می کند. اگر یک مدل ML را به عنوان یک کارخانه تولیدی کوچک در نظر بگیریم که پیشبینیها را تولید میکند، منطقی است که تیمهای علم داده برای بررسی مسائل مربوط به عملکرد و کیفیت به ابزارهای نظارتی ML نیاز دارند. کیتی رابرتز، معمار راه حل های علم داده در Neo4j، می گوید: “نظارت ML مجموعه ای از تکنیک هایی است که در طول تولید برای شناسایی مشکلات استفاده می شود. که ممکن است بر عملکرد مدل تأثیر منفی بگذارد و در نتیجه بینشهایی با کیفیت پایین ایجاد شود.”
تولید و کنترل کیفیت یک قیاس آسان است، و در اینجا دو توصیه برای ارائه مشخصات نظارت بر مدل ML وجود دارد: «از آنجایی که شرکتها سرمایهگذاری در ابتکارات AI/ML را تسریع میکنند، مدلهای هوش مصنوعی از دهها به هزاران افزایش مییابد. هیلاری اشتون، مدیر ارشد محصول در Teradata میگوید، هر کدام باید به طور ایمن ذخیره شده و به طور مداوم نظارت شود تا از دقت اطمینان حاصل شود.
modelops چیست؟
MLops بر تیمهای چند رشتهای که در توسعه، استقرار و نگهداری مدلها همکاری میکنند، تمرکز دارد. اما رهبران چگونه باید تصمیم بگیرند که روی چه مدلهایی سرمایهگذاری کنند، کدام مدلها نیاز به تعمیر و نگهداری دارند، و کجا شفافیت در مورد هزینهها و مزایای هوش مصنوعی و یادگیری ماشین ایجاد کنند؟
اینها نگرانیهای حاکمیتی هستند و بخشی از آن چیزی هستند که رویهها و پلتفرمهای مدلوپ به دنبال آن هستند. رهبران کسبوکار مدلها را میخواهند، اما تا زمانی که به طور جزئی اجرا نشود، نیاز و آنچه را ارائه میکند کاملاً درک نمیکنند.
این یک مشکل است، به خصوص برای شرکت هایی که به دنبال سرمایه گذاری در پلتفرم های مدلوپ هستند. نیتین راکش، مدیرعامل و مدیر عامل Mphasis پیشنهاد میکند مدلوپها را به این شکل توضیح دهید. “سازمانها با تمرکز بر مدلاپها میتوانند اطمینان حاصل کنند که مدلهای یادگیری ماشین برای به حداکثر رساندن ارزش و تضمین حاکمیت نسخههای مختلف به کار گرفته شده و نگهداری میشوند.”
اشتون پیشنهاد میکند که یک نمونه تمرین را در نظر بگیرید. او میگوید: «Modelops به دانشمندان داده اجازه میدهد تا خطرات کیفیت داده را شناسایی و اصلاح کنند، بهطور خودکار زمانی که مدلها کاهش مییابند، و برنامهریزی مجدد مدلها را شناسایی کنند.
هنوز بسیاری از قابلیتها، الگوریتمها و فناوریهای جدید ML و AI با اصطلاحات گیجکننده وجود دارد که در واژگان یک رهبر تجاری نفوذ میکند. وقتی متخصصان داده و فنآوران برای توضیح اصطلاحات زبانی که رهبران کسبوکار میفهمند، زمان میگذارند، احتمال بیشتری دارد که از پشتیبانی مشترک و خرید سرمایهگذاریهای جدید برخوردار شوند.
پست های مرتبط
چگونه چرخه زندگی یادگیری ماشینی را برای مدیران تجاری توضیح دهیم
چگونه چرخه زندگی یادگیری ماشینی را برای مدیران تجاری توضیح دهیم
چگونه چرخه زندگی یادگیری ماشینی را برای مدیران تجاری توضیح دهیم