این جایگزین برای آموزش با مجموعه داده های عظیم، پتانسیلی برای کسب و کار دارد، اما تیم های علم داده باید زمانی را صرف تحقیق و آزمایش کنند.
ممکن است سال ۲۰۲۲ را بهعنوان سالی به یاد بیاوریم که هوش مصنوعی مولد از آزمایشگاهها به استفاده رایج تبدیل شد. ChatGPT، یک هوش مصنوعی مکالمه ای که به سؤالات پاسخ می دهد، از صفر تا یک میلیون کاربر در کمتر از یک هفته. AIهای تولید تصویر DALL-E 2، Midjourney و Stable Diffusion دسترسی عمومی را باز کرد و توجه جهان را به خود جلب کرد با تنوع و کیفیت تصاویر تولید شده از عبارات و جملات کوتاه.
اعتراف میکنم که با DALL-E 2 کمی سرگرم شدم. در اینجا اجرای آن از دو روح گمشده در حال شنا در یک کاسه ماهی و تیم برتون عذاب باز کردن آووکادوی نارس را به تصویر میکشد.
تورستن گرابز، مدیر مدیریت محصول در دانه برف.
بسیاری از مدلهای یادگیری ماشینی از تکنیکهای یادگیری تحت نظارت استفاده میکنند که در آن شبکه عصبی یا مدل دیگری با استفاده از مجموعه داده های برچسب دار آموزش داده می شود. برای مثال، میتوانید با پایگاه دادهای از تصاویر برچسبگذاری شده با عنوان گربه، سگ، و سایر حیوانات خانگی شروع کنید و یک CNN (شبکه عصبی کانولوشنال) را برای طبقه بندی آنها آموزش دهید.
در دنیای واقعی، برچسبگذاری مجموعه دادهها در مقیاس گران و پیچیده است. مراقبت های بهداشتی، تولیدی و سایر صنایع موارد استفاده متفاوت زیادی برای پیش بینی های دقیق دارند. دادههای مصنوعی میتواند به افزایش مجموعه دادهها کمک کند، اما آموزش و حفظ مدلهای یادگیری تحت نظارت هنوز پرهزینه است.
تکنیک های یادگیری تک شات و صفر
برای درک هوش مصنوعی مولد، با درک الگوریتمهای یادگیری که به مجموعه دادههای برچسبگذاری شده متکی نیستند، شروع کنید. الگوریتمهای یادگیری تکشات و صفر، رویکردهای نمونهای هستند که پایه و اساس تکنیکهای هوش مصنوعی مولد هستند.
در اینجا ChatGPT آموزش تکشات و صفر را تعریف میکند:
دیوید تالبی، مدیر ارشد فناوری در آزمایشگاههای جان اسنو، میگوید: «همانطور که از نام آن پیداست، یک ضربه یا هدف یادگیری چند شات طبقه بندی اشیا از یک یا تنها چند مثال است. هدف این است که انسان ها از یک مدل به انگلیسی ساده ترغیب کنند تا یک تصویر، عبارت یا متن را با موفقیت شناسایی کند.”
یادگیری تک شات با یک مثال آموزشی برای هر نمونه انجام میشود، مثلاً یک عکس از یک کارمند جدید. سپس این مدل میتواند امتیاز شباهت بین دو عکس را محاسبه کند، مانند عکسی از شخص که با نمونه مطابقت داده شده است، و امتیاز، مطابقت کافی برای دسترسی را تعیین میکند. یک نمونه از یادگیری تک شات از مجموعه داده Omniglot، مجموعه ای از ۱۶۲۳ کاراکتر دستی از ۵۰ الفبای مختلف.
در یادگیری صفر شات، شبکه بر روی تصاویر و دادههای مرتبط، از جمله زیرنویسها و سایر ابردادههای متنی آموزش داده میشود. یک رویکرد برای یادگیری بدون شات از OpenAI استفاده می کند CLIP (Contrastive Language-Image Pretraining) برای کاهش ابعاد تصاویر به رمزگذاری، ایجاد لیستی از تمام برچسب های ممکن از متن، و سپس محاسبه امتیاز شباهت تطبیق تصویر با برچسب. سپس می توان از این مدل برای طبقه بندی تصاویر جدید به برچسب ها با استفاده از امتیاز شباهت استفاده کرد.
DALL-E OpenAI از CLIP و GAN (شبکه های متخاصم مولد) برای انجام عملکرد معکوس و ایجاد تصاویر از متن.
کاربردهای تکنیک های یادگیری چند شات
یکی از کاربردهای تکنیکهای یادگیری چند شات در مراقبتهای بهداشتی است، که در آن میتوان از تصاویر پزشکی به همراه تشخیصهای آن برای توسعه یک مدل طبقهبندی استفاده کرد. تالبی می گوید: «بیمارستان های مختلف ممکن است شرایط را متفاوت تشخیص دهند. “با یادگیری یک یا چند شات، الگوریتمها میتوانند توسط پزشک، بدون استفاده از کد، برای دستیابی به یک نتیجه خاص، درخواست شوند.”
اما انتظار نداشته باشید که خیلی زود تشخیص های رادیولوژیکی کاملاً خودکار انجام شود. Talby میگوید: «در حالی که توانایی استخراج خودکار اطلاعات بسیار ارزشمند است، یادگیری یک، چند، یا حتی صفر شات به این زودی جایگزین متخصصان پزشکی نخواهد شد.»
Pandurang Kamat، CTO در Persistent، چندین برنامه بالقوه دیگر را به اشتراک می گذارد. «تکنیکهای یادگیری صفر و چند شات فرصتها را در زمینههایی مانند کشف دارو، کشف مولکول، بهرهبرداریهای روز صفر، انحراف کیس برای تیمهای پشتیبانی مشتری، و سایر مواردی که دادههای آموزشی برچسبگذاری شده ممکن است سخت باشد، باز میکند.»
Kamat همچنین در مورد محدودیت های فعلی هشدار می دهد. او میگوید: «در بینایی کامپیوتری، این تکنیکها برای تشخیص، طبقهبندی و ردیابی تصویر به خوبی کار میکنند، اما میتوانند در سناریوهایی با دقت بالا مانند شناسایی سلولهای سرطانی و علامتگذاری خطوط آنها در تصاویر آسیبشناسی، با مشکل مواجه شوند.
تولید همچنین کاربردهای بالقوه ای برای یادگیری چند مرحله ای در شناسایی عیوب دارد. آرجون چاندار، مدیر عامل شرکت ML Industrial.
تصور راه حل های هوش مصنوعی نسل بعدی
دانشمندان داده ممکن است رویکردهای یادگیری تک شات و صفر را برای حل مسائل طبقه بندی با مجموعه داده های بدون برچسب امتحان کنند. برخی از راههای یادگیری الگوریتمها و ابزارها عبارتند از استفاده از Amazon SageMaker برای ایجاد یک سیستم هشدار مبتنی بر اخبار یا با استفاده از یادگیری صفر شات در عوامل مکالمه.
توسعهدهندگان و دانشمندان داده همچنین باید تکنیکهای یادگیری جدید و مدلهای موجود را بهعنوان بلوکهای ساختمانی برای برنامهها و راهحلهای جدید بهجای مدلهای بهینهسازی شده خاص در نظر بگیرند. به عنوان مثال، چانگ لیو، مدیر مهندسی در Moveworks، میگوید توسعهدهندگان میتوانند از NLP در مقیاس بزرگ ( پردازش زبان طبیعی) به جای ساختن خود، مدلسازی میکند.
«با معرفی مدلهای زبان بزرگ، تیمها از این سیستمهای هوشمند برای حل مشکلات در مقیاس استفاده میکنند. لیو می گوید، به جای ساخت یک مدل کاملاً جدید، مدل زبان فقط باید در مورد شرح کار و پاسخ های مناسب آموزش ببیند.
راهحلهای هوش مصنوعی آینده ممکن است شبیه برنامههای نرمافزاری امروزی باشند، با ترکیبی از مدلهای اختصاصی، اجزای تجاری و منبع باز تعبیهشده، و خدمات شخص ثالث. Grabs of Snowflake میگوید: «دستاوردها تقریباً در دسترس هر شرکتی است که مایل است برای تعریف مشکل راهحلهای هوش مصنوعی و اتخاذ ابزارها و شیوههای جدید برای ایجاد پیشرفتهای اولیه و مستمر وقت بگذارد.
احتمالاً در سال ۲۰۲۳ شاهد رویکردهای یادگیری جدید و دستاوردهای هوش مصنوعی خواهیم بود، بنابراین تیمهای علم داده باید به طور مداوم تحقیق، یادگیری و آزمایش کنند.
پست های مرتبط
یادگیری شات صفر و پایه های هوش مصنوعی مولد
یادگیری شات صفر و پایه های هوش مصنوعی مولد
یادگیری شات صفر و پایه های هوش مصنوعی مولد