۳۰ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

یادگیری شات صفر و پایه های هوش مصنوعی مولد

این جایگزین برای آموزش با مجموعه داده های عظیم، پتانسیلی برای کسب و کار دارد، اما تیم های علم داده باید زمانی را صرف تحقیق و آزمایش کنند.

این جایگزین برای آموزش با مجموعه داده های عظیم، پتانسیلی برای کسب و کار دارد، اما تیم های علم داده باید زمانی را صرف تحقیق و آزمایش کنند.

ممکن است سال ۲۰۲۲ را به‌عنوان سالی به یاد بیاوریم که هوش مصنوعی مولد از آزمایشگاه‌ها به استفاده رایج تبدیل شد. ChatGPT، یک هوش مصنوعی مکالمه ای که به سؤالات پاسخ می دهد، از صفر تا یک میلیون کاربر در کمتر از یک هفته. AIهای تولید تصویر DALL-E 2، Midjourney و Stable Diffusion دسترسی عمومی را باز کرد و توجه جهان را به خود جلب کرد با تنوع و کیفیت تصاویر تولید شده از عبارات و جملات کوتاه.

اعتراف می‌کنم که با DALL-E 2 کمی سرگرم شدم. در اینجا اجرای آن از دو روح گمشده در حال شنا در یک کاسه ماهی و تیم برتون عذاب باز کردن آووکادوی نارس را به تصویر می‌کشد.

تورستن گرابز، مدیر مدیریت محصول در دانه برف.

بسیاری از مدل‌های یادگیری ماشینی از تکنیک‌های یادگیری تحت نظارت استفاده می‌کنند که در آن شبکه عصبی یا مدل دیگری با استفاده از مجموعه داده های برچسب دار آموزش داده می شود. برای مثال، می‌توانید با پایگاه داده‌ای از تصاویر برچسب‌گذاری شده با عنوان گربه، سگ، و سایر حیوانات خانگی شروع کنید و یک CNN (شبکه عصبی کانولوشنال) را برای طبقه بندی آنها آموزش دهید.

در دنیای واقعی، برچسب‌گذاری مجموعه داده‌ها در مقیاس گران و پیچیده است. مراقبت های بهداشتی، تولیدی و سایر صنایع موارد استفاده متفاوت زیادی برای پیش بینی های دقیق دارند. داده‌های مصنوعی می‌تواند به افزایش مجموعه داده‌ها کمک کند، اما آموزش و حفظ مدل‌های یادگیری تحت نظارت هنوز پرهزینه است.

GitHub Copilot X روی ChatGPT-4 ضربه خواهد زد

تکنیک های یادگیری تک شات و صفر

برای درک هوش مصنوعی مولد، با درک الگوریتم‌های یادگیری که به مجموعه داده‌های برچسب‌گذاری شده متکی نیستند، شروع کنید. الگوریتم‌های یادگیری تک‌شات و صفر، رویکردهای نمونه‌ای هستند که پایه و اساس تکنیک‌های هوش مصنوعی مولد هستند.

در اینجا ChatGPT آموزش تک‌شات و صفر را تعریف می‌کند:

دیوید تالبی، مدیر ارشد فناوری در آزمایشگاه‌های جان اسنو، می‌گوید: «همانطور که از نام آن پیداست، یک ضربه یا هدف یادگیری چند شات طبقه بندی اشیا از یک یا تنها چند مثال است. هدف این است که انسان ها از یک مدل به انگلیسی ساده ترغیب کنند تا یک تصویر، عبارت یا متن را با موفقیت شناسایی کند.”

یادگیری تک شات با یک مثال آموزشی برای هر نمونه انجام می‌شود، مثلاً یک عکس از یک کارمند جدید. سپس این مدل می‌تواند امتیاز شباهت بین دو عکس را محاسبه کند، مانند عکسی از شخص که با نمونه مطابقت داده شده است، و امتیاز، مطابقت کافی برای دسترسی را تعیین می‌کند. یک نمونه از یادگیری تک شات از مجموعه داده Omniglot، مجموعه ای از ۱۶۲۳ کاراکتر دستی از ۵۰ الفبای مختلف.

در یادگیری صفر شات، شبکه بر روی تصاویر و داده‌های مرتبط، از جمله زیرنویس‌ها و سایر ابرداده‌های متنی آموزش داده می‌شود. یک رویکرد برای یادگیری بدون شات از OpenAI استفاده می کند CLIP (Contrastive Language-Image Pretraining) برای کاهش ابعاد تصاویر به رمزگذاری، ایجاد لیستی از تمام برچسب های ممکن از متن، و سپس محاسبه امتیاز شباهت تطبیق تصویر با برچسب. سپس می توان از این مدل برای طبقه بندی تصاویر جدید به برچسب ها با استفاده از امتیاز شباهت استفاده کرد.

هوش مصنوعی هنوز راه هایی برای بازآفرینی کد دارد

DALL-E OpenAI از CLIP و GAN (شبکه های متخاصم مولد) برای انجام عملکرد معکوس و ایجاد تصاویر از متن.

کاربردهای تکنیک های یادگیری چند شات

یکی از کاربردهای تکنیک‌های یادگیری چند شات در مراقبت‌های بهداشتی است، که در آن می‌توان از تصاویر پزشکی به همراه تشخیص‌های آن برای توسعه یک مدل طبقه‌بندی استفاده کرد. تالبی می گوید: «بیمارستان های مختلف ممکن است شرایط را متفاوت تشخیص دهند. “با یادگیری یک یا چند شات، الگوریتم‌ها می‌توانند توسط پزشک، بدون استفاده از کد، برای دستیابی به یک نتیجه خاص، درخواست شوند.”

اما انتظار نداشته باشید که خیلی زود تشخیص های رادیولوژیکی کاملاً خودکار انجام شود. Talby می‌گوید: «در حالی که توانایی استخراج خودکار اطلاعات بسیار ارزشمند است، یادگیری یک، چند، یا حتی صفر شات به این زودی جایگزین متخصصان پزشکی نخواهد شد.»

Pandurang Kamat، CTO در Persistent، چندین برنامه بالقوه دیگر را به اشتراک می گذارد. «تکنیک‌های یادگیری صفر و چند شات فرصت‌ها را در زمینه‌هایی مانند کشف دارو، کشف مولکول، بهره‌برداری‌های روز صفر، انحراف کیس برای تیم‌های پشتیبانی مشتری، و سایر مواردی که داده‌های آموزشی برچسب‌گذاری شده ممکن است سخت باشد، باز می‌کند.»

Kamat همچنین در مورد محدودیت های فعلی هشدار می دهد. او می‌گوید: «در بینایی کامپیوتری، این تکنیک‌ها برای تشخیص، طبقه‌بندی و ردیابی تصویر به خوبی کار می‌کنند، اما می‌توانند در سناریوهایی با دقت بالا مانند شناسایی سلول‌های سرطانی و علامت‌گذاری خطوط آنها در تصاویر آسیب‌شناسی، با مشکل مواجه شوند.

تولید همچنین کاربردهای بالقوه ای برای یادگیری چند مرحله ای در شناسایی عیوب دارد. آرجون چاندار، مدیر عامل شرکت ML Industrial.

هوش مصنوعی مولد برای شرکت های نرم افزاری به چه معناست؟

تصور راه حل های هوش مصنوعی نسل بعدی

دانشمندان داده ممکن است رویکردهای یادگیری تک شات و صفر را برای حل مسائل طبقه بندی با مجموعه داده های بدون برچسب امتحان کنند. برخی از راه‌های یادگیری الگوریتم‌ها و ابزارها عبارتند از استفاده از Amazon SageMaker برای ایجاد یک سیستم هشدار مبتنی بر اخبار یا با استفاده از یادگیری صفر شات در عوامل مکالمه.

توسعه‌دهندگان و دانشمندان داده همچنین باید تکنیک‌های یادگیری جدید و مدل‌های موجود را به‌عنوان بلوک‌های ساختمانی برای برنامه‌ها و راه‌حل‌های جدید به‌جای مدل‌های بهینه‌سازی شده خاص در نظر بگیرند. به عنوان مثال، چانگ لیو، مدیر مهندسی در Moveworks، می‌گوید توسعه‌دهندگان می‌توانند از NLP در مقیاس بزرگ ( پردازش زبان طبیعی) به جای ساختن خود، مدل‌سازی می‌کند.

«با معرفی مدل‌های زبان بزرگ، تیم‌ها از این سیستم‌های هوشمند برای حل مشکلات در مقیاس استفاده می‌کنند. لیو می گوید، به جای ساخت یک مدل کاملاً جدید، مدل زبان فقط باید در مورد شرح کار و پاسخ های مناسب آموزش ببیند.

راه‌حل‌های هوش مصنوعی آینده ممکن است شبیه برنامه‌های نرم‌افزاری امروزی باشند، با ترکیبی از مدل‌های اختصاصی، اجزای تجاری و منبع باز تعبیه‌شده، و خدمات شخص ثالث. Grabs of Snowflake می‌گوید: «دستاوردها تقریباً در دسترس هر شرکتی است که مایل است برای تعریف مشکل راه‌حل‌های هوش مصنوعی و اتخاذ ابزارها و شیوه‌های جدید برای ایجاد پیشرفت‌های اولیه و مستمر وقت بگذارد.

احتمالاً در سال ۲۰۲۳ شاهد رویکردهای یادگیری جدید و دستاوردهای هوش مصنوعی خواهیم بود، بنابراین تیم‌های علم داده باید به طور مداوم تحقیق، یادگیری و آزمایش کنند.