۲۹ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

چگونه چرخه زندگی یادگیری ماشینی را برای مدیران تجاری توضیح دهیم

برای موفقیت تیم های علم داده، رهبران کسب و کار باید اهمیت Mlops، modelops و چرخه زندگی یادگیری ماشین را درک کنند. این قیاس ها و مثال ها را امتحان کنید تا اصطلاحات را از بین ببرید.

برای موفقیت تیم های علم داده، رهبران کسب و کار باید اهمیت Mlops، modelops و چرخه زندگی یادگیری ماشین را درک کنند. این قیاس ها و مثال ها را امتحان کنید تا اصطلاحات را از بین ببرید.

اگر دانشمند داده هستید یا با مدل‌های یادگیری ماشینی (ML) کار می‌کنید، ابزارهایی برای برچسب‌گذاری داده‌ها، محیط‌های فناوری برای آموزش مدل‌ها و درک اساسی از MLops و modelops. اگر مدل‌های ML در حال تولید دارید، احتمالاً از نظارت ML برای شناسایی انحراف داده‌ها و سایر خطرات مدل استفاده می‌کنید.

تیم‌های علم داده از این شیوه‌ها و پلت‌فرم‌های ضروری ML برای همکاری در توسعه مدل، پیکربندی زیرساخت، استقرار مدل‌های ML در محیط‌های مختلف و نگهداری مدل‌ها در مقیاس استفاده می‌کنند. دیگرانی که به دنبال افزایش تعداد مدل‌های تولید، بهبود کیفیت پیش‌بینی‌ها و کاهش هزینه‌های نگهداری مدل ML هستند، احتمالاً به این ابزارهای مدیریت چرخه عمر ML نیز نیاز خواهند داشت.

متأسفانه، توضیح این شیوه‌ها و ابزارها برای سهامداران کسب‌وکار و تصمیم‌گیرندگان بودجه کار آسانی نیست. این همه اصطلاحات فنی برای رهبرانی است که می‌خواهند بازگشت سرمایه و تأثیر تجاری سرمایه‌گذاری‌های یادگیری ماشین و هوش مصنوعی را درک کنند و ترجیح می‌دهند از علف‌های هرز فنی و عملیاتی دور بمانند.

دانشمندان، توسعه‌دهندگان و رهبران فناوری داده‌ها تشخیص می‌دهند که خرید خرید مستلزم تعریف و ساده‌سازی اصطلاحات است تا ذینفعان اهمیت رشته‌های کلیدی را درک کنند. در ادامه مقاله قبلی درباره نحوه توضیح اصطلاحات تخصصی زبان به مدیران کسب‌وکار، فکر کردم مقاله مشابهی را بنویسم تا چندین روش حیاتی ML را که رهبران کسب‌وکار باید درک کنند، توضیح دهم.

چرخه زندگی یادگیری ماشین چیست؟

به‌عنوان یک توسعه‌دهنده یا دانشمند داده، شما یک فرآیند مهندسی برای برداشت ایده‌های جدید از مفهوم تا ارائه ارزش تجاری دارید. این فرآیند شامل تعریف بیان مسئله، توسعه و آزمایش مدل‌ها، استقرار مدل‌ها در محیط‌های تولید، نظارت بر مدل‌ها در تولید، و امکان نگهداری و بهبود است. ما این را یک فرآیند چرخه عمر می نامیم، زیرا می دانیم که استقرار اولین گام برای درک ارزش کسب و کار است و زمانی که مدل ها تولید شوند، ثابت نیستند و به پشتیبانی مداوم نیاز دارند.

ممکن است رهبران کسب و کار اصطلاح چرخه زندگی را درک نکنند. بسیاری هنوز توسعه نرم‌افزار و کار علم داده را سرمایه‌گذاری‌های یکباره می‌دانند، این یکی از دلایلی است که بسیاری از سازمان‌ها از مشکلات بدهی فناوری و کیفیت داده.

هوش مصنوعی واقعاً آنقدرها هم هوشمند نیست

توضیح چرخه عمر با عبارات فنی در مورد توسعه مدل، آموزش، استقرار و نظارت، چشمان یک مدیر تجاری را خیره می کند. مارکوس مرل، معاون استراتژی فناوری در آزمایشگاه‌های سس، پیشنهاد می‌کند که به رهبران یک قیاس دنیای واقعی ارائه دهید.

او می‌گوید: «یادگیری ماشین تا حدودی مشابه کشاورزی است: محصولاتی که امروز می‌شناسیم نتیجه ایده‌آل نسل‌های قبلی است که متوجه الگوها، آزمایش با ترکیب‌ها، و به اشتراک گذاشتن اطلاعات با کشاورزان دیگر برای ایجاد تغییرات بهتر با استفاده از دانش انباشته شده‌اند.» “یادگیری ماشین تقریباً همان فرآیند مشاهده، نتیجه گیری آبشاری و ترکیب دانش است که الگوریتم شما آموزش می بیند.”

چیزی که من در مورد این قیاس دوست دارم این است که یادگیری مولد را از یک سال زراعی به سال دیگر نشان می دهد، اما همچنین می تواند در تنظیمات زمان واقعی که ممکن است در طول یک فصل رشد به دلیل آب و هوا، زنجیره تامین یا عوامل دیگر رخ دهد، تأثیر بگذارد. در صورت امکان، یافتن قیاس‌هایی در صنعت یا حوزه‌ای که رهبران کسب‌وکار شما می‌فهمند، ممکن است مفید باشد.

MLops چیست؟

بیشتر توسعه دهندگان و دانشمندان داده، Mlops را معادل devops برای یادگیری ماشین می دانند. خودکارسازی زیرساخت‌ها، استقرار و سایر فرآیندهای مهندسی، همکاری‌ها را بهبود می‌بخشد و به تیم‌ها کمک می‌کند انرژی بیشتری را به جای انجام دستی وظایف فنی روی اهداف تجاری متمرکز کنند.

اما همه اینها برای مدیران تجاری که نیاز به تعریف ساده ای از Mlops دارند، به ویژه زمانی که تیم ها به بودجه برای ابزارها یا زمان برای ایجاد بهترین شیوه ها نیاز دارند.

Alon Gubkin، مدیر ارشد فناوری، می گوید: «MLops یا عملیات یادگیری ماشینی، تمرین همکاری و ارتباط بین علم داده، فناوری اطلاعات، و کسب و کار برای کمک به مدیریت چرخه عمر نهایی پروژه های یادگیری ماشینی است. یکی از بنیانگذاران Aporia. “MLops در مورد گرد هم آوردن تیم ها و بخش های مختلف در یک سازمان است تا اطمینان حاصل شود که مدل های یادگیری ماشین به طور موثر مستقر شده و نگهداری می شوند.”

Thibaut Gourdel، مدیر بازاریابی محصول فنی در Talend، پیشنهاد می‌کند جزئیات بیشتری را برای تجارت مبتنی بر داده اضافه کنید. رهبران او می‌گوید: «MLops استفاده از اصول نرم‌افزار چابک را که در پروژه‌های ML اعمال می‌شود، مانند کنترل نسخه داده‌ها و مدل‌ها و همچنین اعتبارسنجی مداوم داده‌ها، آزمایش و استقرار ML برای بهبود تکرارپذیری و قابلیت اطمینان مدل‌ها، علاوه بر تیم‌های شما، ترویج می‌کند. ” بهره وری.”

وقتی ربات ها می آیند

دریفت داده چیست؟

هر وقت می‌توانید از کلماتی استفاده کنید که تصویری را منتقل می‌کنند، ارتباط این اصطلاح با یک مثال یا داستان بسیار آسان‌تر است. یک مدیر اجرایی از مثال‌هایی مانند قایق که به دلیل باد از مسیر خارج می‌شود، می‌فهمد، اما ممکن است برای ترجمه آن به دنیای داده‌ها، توزیع‌های آماری، و دقت مدل دچار مشکل شود.

کریشنارام کنتاپادی، افسر ارشد هوش مصنوعی و دانشمند در Fiddler AI. «می‌تواند ناگهانی باشد، مانند تغییر رفتار خرید ناشی از همه‌گیری COVID-19. صرف نظر از نحوه رخ دادن این تغییر، شناسایی سریع این تغییرات برای حفظ دقت مدل و کاهش تأثیر کسب و کار بسیار مهم است.»

Gubkin مثال دومی را ارائه می‌کند از زمانی که جابجایی داده‌ها تغییر تدریجی‌تری از داده‌هایی است که مدل روی آن آموزش داده شده است. “انحراف داده ها مانند این است که محصولات یک شرکت با گذشت زمان کمتر محبوب می شوند زیرا ترجیحات مصرف کنندگان تغییر کرده است.”

دیوید تالبی، مدیر ارشد فناوری آزمایشگاه‌های جان اسنو، یک تشبیه کلی را به اشتراک گذاشت. او می‌گوید: «دریفت مدل زمانی اتفاق می‌افتد که دقت به دلیل تغییر محیط تولیدی که در آن کار می‌کند کاهش یابد». «مثل اینکه ارزش یک خودروی جدید به محض اینکه شما آن را از بین ببرید، کاهش می‌یابد، یک مدل نیز همین کار را می‌کند، زیرا محیط تحقیقاتی قابل پیش‌بینی که در آن آموزش دیده، در تولید رفتار متفاوتی دارد. صرف نظر از اینکه چقدر خوب کار می کند، یک مدل همیشه به تعمیر و نگهداری نیاز دارد زیرا دنیای اطراف آن تغییر می کند.

پیام مهمی که رهبران علم داده باید منتقل کنند این است که از آنجایی که داده‌ها ثابت نیستند، مدل‌ها باید از نظر دقت بررسی شوند و بر روی داده‌های جدیدتر و مرتبط‌تر آموزش داده شوند.

نظارت بر ML چیست؟

یک سازنده چگونه کیفیت را قبل از بسته بندی و ارسال به خرده فروشان و مشتریان اندازه گیری می کند؟ سازندگان از ابزارهای مختلفی برای شناسایی عیوب استفاده می کنند، از جمله زمانی که خط مونتاژ شروع به نشان دادن انحراف از کیفیت خروجی قابل قبول می کند. اگر یک مدل ML را به عنوان یک کارخانه تولیدی کوچک در نظر بگیریم که پیش‌بینی‌ها را تولید می‌کند، منطقی است که تیم‌های علم داده برای بررسی مسائل مربوط به عملکرد و کیفیت به ابزارهای نظارتی ML نیاز دارند. کیتی رابرتز، معمار راه حل های علم داده در Neo4j، می گوید: “نظارت ML مجموعه ای از تکنیک هایی است که در طول تولید برای شناسایی مشکلات استفاده می شود. که ممکن است بر عملکرد مدل تأثیر منفی بگذارد و در نتیجه بینش‌هایی با کیفیت پایین ایجاد شود.”

ماشین انگلی ChatGPT

تولید و کنترل کیفیت یک قیاس آسان است، و در اینجا دو توصیه برای ارائه مشخصات نظارت بر مدل ML وجود دارد: «از آنجایی که شرکت‌ها سرمایه‌گذاری در ابتکارات AI/ML را تسریع می‌کنند، مدل‌های هوش مصنوعی از ده‌ها به هزاران افزایش می‌یابد. هیلاری اشتون، مدیر ارشد محصول در Teradata می‌گوید، هر کدام باید به طور ایمن ذخیره شده و به طور مداوم نظارت شود تا از دقت اطمینان حاصل شود.

modelops چیست؟

MLops بر تیم‌های چند رشته‌ای که در توسعه، استقرار و نگهداری مدل‌ها همکاری می‌کنند، تمرکز دارد. اما رهبران چگونه باید تصمیم بگیرند که روی چه مدل‌هایی سرمایه‌گذاری کنند، کدام مدل‌ها نیاز به تعمیر و نگهداری دارند، و کجا شفافیت در مورد هزینه‌ها و مزایای هوش مصنوعی و یادگیری ماشین ایجاد کنند؟

اینها نگرانی‌های حاکمیتی هستند و بخشی از آن چیزی هستند که رویه‌ها و پلتفرم‌های مدلوپ به دنبال آن هستند. رهبران کسب‌وکار مدل‌ها را می‌خواهند، اما تا زمانی که به طور جزئی اجرا نشود، نیاز و آنچه را ارائه می‌کند کاملاً درک نمی‌کنند.

این یک مشکل است، به خصوص برای شرکت هایی که به دنبال سرمایه گذاری در پلتفرم های مدلوپ هستند. نیتین راکش، مدیرعامل و مدیر عامل Mphasis پیشنهاد می‌کند مدلوپ‌ها را به این شکل توضیح دهید. “سازمان‌ها با تمرکز بر مدلاپ‌ها می‌توانند اطمینان حاصل کنند که مدل‌های یادگیری ماشین برای به حداکثر رساندن ارزش و تضمین حاکمیت نسخه‌های مختلف به کار گرفته شده و نگهداری می‌شوند.”

اشتون پیشنهاد می‌کند که یک نمونه تمرین را در نظر بگیرید. او می‌گوید: «Modelops به دانشمندان داده اجازه می‌دهد تا خطرات کیفیت داده را شناسایی و اصلاح کنند، به‌طور خودکار زمانی که مدل‌ها کاهش می‌یابند، و برنامه‌ریزی مجدد مدل‌ها را شناسایی کنند.

هنوز بسیاری از قابلیت‌ها، الگوریتم‌ها و فناوری‌های جدید ML و AI با اصطلاحات گیج‌کننده وجود دارد که در واژگان یک رهبر تجاری نفوذ می‌کند. وقتی متخصصان داده و فن‌آوران برای توضیح اصطلاحات زبانی که رهبران کسب‌وکار می‌فهمند، زمان می‌گذارند، احتمال بیشتری دارد که از پشتیبانی مشترک و خرید سرمایه‌گذاری‌های جدید برخوردار شوند.