۳۰ آذر ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

Amazon Bedrock: یک پایه قوی مولد هوش مصنوعی

Amazon Bedrock مسیر ساخت اپلیکیشن‌های هوش مصنوعی مولد را با مهندسی سریع و RAG هموار می‌کند و مجموعه خوبی از مدل‌های متن، چت و مبانی تصویری را ارائه می‌دهد.

Amazon Bedrock مسیر ساخت اپلیکیشن‌های هوش مصنوعی مولد را با مهندسی سریع و RAG هموار می‌کند و مجموعه خوبی از مدل‌های متن، چت و مبانی تصویری را ارائه می‌دهد.

سرویس کاملاً مدیریت شده Amazon Web Services برای ساخت، استقرار و مقیاس‌بندی برنامه‌های هوش مصنوعی مولد، Amazon Bedrock فهرستی از مدل‌های پایه ارائه می‌کند، نسل تقویت‌شده با بازیابی را پیاده‌سازی می‌کند ( RAG) و جاسازی‌های برداری، پایگاه‌های دانش را میزبانی می‌کند، مدل‌های فونداسیون را دقیق تنظیم می‌کند، و امکان پیش‌آموزش مداوم مدل‌های فونداسیون انتخابی را فراهم می‌کند.

Amazon Bedrock مکمل تقریباً ۳۰ سرویس یادگیری ماشینی آمازون موجود است، از جمله Amazon Q، دستیار هوش مصنوعی AWS.

در حال حاضر شش ویژگی اصلی در Amazon Bedrock وجود دارد:

  • آزمایش با مدل‌های مختلف: از API یا GUI در کنسول برای آزمایش فرمان‌ها و پیکربندی‌های مختلف با مدل‌های پایه مختلف استفاده کنید.
  • ادغام منابع داده خارجی: تولید پاسخ را با گنجاندن منابع داده خارجی در پایگاه های دانش، که می تواند برای تقویت پاسخ های مدل های پایه مورد پرس و جو قرار گیرد، بهبود بخشید.
  • برنامه‌های پشتیبانی مشتری را توسعه دهید: برنامه‌هایی بسازید که از مدل‌های پایه، فراخوان‌های API و پایگاه‌های دانش برای استدلال و اجرای وظایف برای مشتریان استفاده می‌کنند.
  • مدل‌ها را سفارشی کنید: با ارائه داده‌های آموزشی برای تنظیم دقیق یا پیش‌آموزش اضافی، یک مدل پایه برای وظایف یا حوزه‌های خاص تنظیم کنید.
  • افزایش کارایی برنامه: عملکرد برنامه های کاربردی مبتنی بر مدل پایه را با خرید توان عملیاتی ارائه شده بهینه کنید.
  • مناسب‌ترین مدل را انتخاب کنید: خروجی‌های مدل‌های مختلف را با استفاده از مجموعه‌های داده استاندارد یا سفارشی مقایسه کنید تا مدلی را انتخاب کنید که به بهترین وجه با الزامات برنامه شما مطابقت دارد.

یکی از رقبای اصلی Amazon Bedrock، Azure AI Studio است، که در حالی که هنوز در حال پیش‌نمایش است و تا حدودی در حال ساخت است، اکثر کادرها را برای سازنده برنامه‌های هوش مصنوعی مولد بررسی می‌کند. Azure AI Studio یک سیستم خوب برای انتخاب مدل‌های هوش مصنوعی مولد، پایه‌گذاری آنها با RAG با استفاده از جاسازی‌های برداری، جستجوی برداری و داده‌ها، و تنظیم دقیق آن‌ها، همه برای ایجاد آنچه که مایکروسافت آن‌ها را copilot یا عامل‌های هوش مصنوعی می‌نامد.

یکی دیگر از رقبای اصلی Google Vertex AI استودیوی هوش مصنوعی مولد است که به شما امکان می دهد تنظیم کنید مدل‌های پایه با داده‌های خودتان، با استفاده از گزینه‌های تنظیم مانند تنظیم آداپتور و یادگیری تقویتی از بازخورد انسانی (RLHF)، یا تنظیم سبک و موضوع برای تولید تصویر. Generative AI Studio مکمل Vertex AI مدل باغ و مدل های پایه به عنوان API ها.

سایر رقبای احتمالی عبارتند از LangChainLangSmithPoe و ChatGPT GPT Builder. LangChain از شما می خواهد که برنامه نویسی کنید.

راه اندازی مدل Amazon Bedrock

دو کار راه‌اندازی برای Bedrock وجود دارد: تنظیم مدل و تنظیم API. قبل از اینکه بتوانید استفاده کنید، باید درخواست دسترسی به مدل‌ها را بدهید آنها اگر می خواهید از AWS استفاده کنید رابط خط فرمان یا هر یک از AWS SDK، همچنین باید CLI یا SDK را نصب و پیکربندی کنید.

من با راه‌اندازی API کاری نداشتم، زیرا تمرکزم را بر استفاده از کنسول برای اهداف این بررسی دارم. تکمیل فرم درخواست دسترسی مدل آسان تر از آنچه به نظر می رسید بود، و سریعتر از آنچه انتظار داشتم به مدل ها دسترسی پیدا کردم.

amazon bedrock 02

تا زمانی که اجازه استفاده از آن را درخواست نکرده و دریافت نکرده باشید، نمی‌توانید از مدلی در Amazon Bedrock استفاده کنید. اکثر فروشندگان فوراً اجازه دسترسی را می دهند. Anthropic چند دقیقه طول می کشد و از شما می خواهد که یک پرسشنامه کوتاه در مورد استفاده برنامه ریزی شده خود پر کنید. این اسکرین شات درست قبل از اعطای درخواست های دسترسی کلود من گرفته شده است.

پارامترهای استنتاج مدل Amazon Bedrock

Amazon Bedrock از پارامترهای کمی متفاوت برای کنترل پاسخ مدل‌ها نسبت به مثلا OpenAI استفاده می‌کند. بستر تصادفی و تنوع را با استفاده از دمای توزیع احتمال، K بالا و P بالا کنترل می‌کند. طول خروجی را با طول پاسخ، جریمه‌ها و توالی توقف کنترل می‌کند.

دما احتمال توکن بعدی را تعدیل می کند. دمای پایین‌تر منجر به پاسخ‌های قطعی‌تر می‌شود و دمای بالاتر منجر به پاسخ‌های تصادفی‌تر می‌شود. به عبارت دیگر، دمای پایین‌تری را برای افزایش احتمال توکن‌های با احتمال بالاتر و کاهش احتمال توکن‌های با احتمال کمتر انتخاب کنید. دمای بالاتری را برای افزایش احتمال توکن‌های با احتمال کمتر و کاهش احتمال توکن‌های با احتمال بالاتر انتخاب کنید. برای مثال، دمای بالا اجازه می‌دهد تا «صدای سم‌ها را می‌شنوم» شامل جانوران غیرمحتملی مانند تک‌شاخ‌ها شود، در حالی که دمای پایین خروجی را برای سونگل‌های احتمالاً اسب‌ها سنگین می‌کند.

Top K تعداد محتمل ترین نامزدهایی است که مدل برای توکن بعدی در نظر می گیرد. مقادیر پایین‌تر گزینه‌ها را به خروجی‌های محتمل‌تری مانند اسب‌ها محدود می‌کند. مقادیر بالاتر به مدل امکان می‌دهد خروجی‌های احتمالی کمتری مانند تکشاخ‌ها را انتخاب کند.

Top P درصد محتمل ترین نامزدهایی است که مدل برای توکن بعدی در نظر می گیرد. همانند K بالا، مقادیر پایین‌تر گزینه‌ها را به خروجی‌های محتمل‌تر محدود می‌کند و مقادیر بالاتر به مدل اجازه می‌دهد خروجی‌های احتمالی کمتری را انتخاب کند.

طول پاسخ تعداد نشانه‌ها را در پاسخ تولید شده کنترل می‌کند. جریمه‌ها می‌توانند برای طول، توکن‌های مکرر، فراوانی توکن‌ها و نوع توکن‌ها در پاسخ اعمال شوند. توالی‌های توقف، دنباله‌ای از کاراکترها هستند که مدل را از تولید نشانه‌های بیشتر باز می‌دارند.

اعلام‌ها، مثال‌ها و زمین‌های بازی Amazon Bedrock

Amazon Bedrock در حال حاضر ۳۳ نمونه از استفاده از مدل هوش مصنوعی مولد را نمایش می دهد و سه زمین بازی ارائه می دهد. زمین‌های بازی یک محیط کنسول را برای آزمایش استنتاج در مدل‌های مختلف و با پیکربندی‌های مختلف فراهم می‌کنند. می توانید با یکی از زمین های بازی (چت، متن یا تصویر) شروع کنید، یک مدل را انتخاب کنید، یک دستور ایجاد کنید و فراپارامترها را تنظیم کنید. یا می توانید با یک مثال شروع کنید و آن را در زمین بازی مناسب با مدل و متاپارامترهای از پیش انتخاب شده و دستور از قبل پر شده باز کنید. توجه داشته باشید که قبل از اینکه بتوانید از آن در زمین بازی استفاده کنید، باید به یک مدل دسترسی داشته باشید.

نمونه‌های Amazon Bedrock اعلان‌ها و پارامترها را برای مدل‌ها و وظایف مختلف پشتیبانی شده نشان می‌دهند. وظایف شامل خلاصه سازی، پاسخ به سؤال، حل مسئله، تولید کد، تولید متن و تولید تصویر است. هر مثال یک مدل، اعلان، پارامترها و پاسخ را نشان می‌دهد و دکمه‌ای را نشان می‌دهد که می‌توانید برای باز کردن مثال در زمین بازی فشار دهید. نتایجی که در زمین بازی به دست می آورید ممکن است با آنچه در مثال نشان داده شده است مطابقت داشته باشد یا نباشد، به خصوص اگر پارامترها به نشانه هایی با احتمال کمتر اجازه دهند.

نمونه اول ما حل مسئله کلمه حسابی را با استفاده از یک دستور زنجیره‌ای از فکر و مدل Llama 2 Chat 70B v1 نشان می‌دهد. چندین نکته جالب در این مثال وجود دارد. اول، با یک مدل چت متن باز نسبتا کوچک کار می کند. (به غیر از این، یک مثال مرتبط وجود دارد که از مدل پارامتر ۷B (میلیارد) به جای مدل پارامتر ۷۰B استفاده شده در اینجا استفاده می‌کند؛ همچنین کار می‌کند.) دوم، عمل زنجیره‌ای از فکر با افزودن ساده به اعلان آغاز می‌شود. “بیایید قدم به قدم فکر کنیم.” توجه داشته باشید که اگر آن خط را حذف کنید، مدل اغلب از ریل خارج می شود و پاسخ اشتباهی ایجاد می کند.

amazon bedrock 03

مثال حل مسئله زنجیره‌ای از فکر از یک مدل چت Llama 2 استفاده می‌کند و یک مسئله معمولی کلمه ریاضی کلاس دوم یا سوم را ارائه می‌کند. به بلوک [INST]شما یک…[/INST] در ابتدای درخواست توجه کنید. به نظر می رسد که این مخصوص لاما باشد. مدل‌های دیگر را برای تعریف دستورالعمل‌ها یا درخواست‌های سیستم به فرمت‌های مختلف پاسخ می‌دهند.

amazon bedrock 04

نمونه حل مسئله زنجیره‌ای از فکر که در زمین بازی آمازون Bedrock Chat اجرا می‌شود. این مجموعه خاص از اعلان‌ها و فراپارامترها معمولاً پاسخ‌های درستی می‌دهند، اگرچه نه هر بار در قالب یکسان. اگر بخش «بیایید گام به گام فکر کنیم» را از دستور حذف کنید، معمولاً پاسخ‌های اشتباهی می‌دهد. تنظیم دما ۰.۵ به دنبال تصادفی متوسط ​​در تابع جرم احتمال است و تنظیم P بالای ۰.۹ به مدل امکان می دهد خروجی های احتمالی کمتری را در نظر بگیرد.

مثال دوم ما استخراج موجودیت قرارداد را با استفاده از مدل تولید متن Cohere’s Command نشان می‌دهد. متن LLMs (مدل های زبان بزرگ) اغلب به بسیاری از عملکردهای مختلف پردازش متن اجازه می دهد.

amazon bedrock 05

نمونه استخراج نهاد قرارداد Amazon Bedrock با استفاده از مدل تولید متن Cohere’s Command. توجه داشته باشید که دستورالعمل اینجا در خط اول و سپس یک کولون است و سپس بدنه قرارداد دنبال می‌شود.

amazon bedrock 06

نمونه استخراج نهاد قراردادی که در زمین بازی متنی Amazon Bedrock اجرا می‌شود. توجه داشته باشید که فرصتی برای تعامل بیشتر در زمین بازی وجود داشت که در مثال نشان داده نشد. در حالی که دمای این اجرا ۰.۹ بود، مدل Cohere’s Command مقادیر دما را تا ۵ می گیرد. مقدار p بالا روی ۱ تنظیم شده است (و در ۰.۹۹ نمایش داده می شود) و پارامتر k بالا تنظیم نشده است. اینها امکان تصادفی بالا در متن تولید شده را فراهم می کند.

مثال پایانی ما نقاشی داخلی تصویر را نشان می‌دهد، برنامه‌ای از تولید تصویر که از یک تصویر مرجع، یک ماسک استفاده می‌کند و از آن برای تولید یک تصویر جدید استفاده می‌کند. تا به حال، من فقط در ادوبی فتوشاپ نقاشی با هوش مصنوعی انجام داده ام، که برای مدتی این قابلیت را داشته است.

amazon bedrock 07

نمونه نقاشی آمازون Bedrock از مدل Titan Image Generator G1 استفاده می‌کند. به تصویر مرجع و تصویر ماسک در پیکربندی تصویر توجه کنید.

amazon bedrock 08

برای اینکه واقعاً گل‌ها را برای رنگ‌آمیزی انتخاب کنم، مجبور شدم ماسک را از انتخاب پیش‌فرض کوله پشتی به ناحیه حاوی گل‌های سفید در تصویر مرجع منتقل کنم. وقتی این کار را نکردم، گل های نارنجی در جلوی کوله پشتی ایجاد شد.

amazon bedrock 09

نقاشی موفق در آمازون بستر. توجه داشته باشید که می‌توانستم از فرمان ماسک برای اصلاح ماسک برای انتخاب‌های پیچیده ماسک در مناطق غیرمرتبط، برای مثال انتخاب گل‌ها و کتاب‌ها استفاده کنم. می توانید از پیوندهای اطلاعات برای مشاهده توضیحات مربوط به فراپارامترهای فردی استفاده کنید.

ارکستراسیون بستر آمازون

سازمان‌دهی Amazon Bedrock در حال حاضر شامل وارد کردن منابع داده به پایگاه‌های دانش است که می‌توانید از آنها برای راه‌اندازی RAG و ایجاد عواملی استفاده کنید که می‌توانند اقدامات را اجرا کنند. اینها دو تا از مهم‌ترین تکنیک‌های موجود برای ساخت برنامه‌های هوش مصنوعی مولد هستند، که بین مهندسی سریع ساده و گران‌قیمت و زمان‌بر ادامه پیش‌آموزش یا تنظیم دقیق قرار می‌گیرند.

استفاده از پایه‌های دانش چندین مرحله را انجام می‌دهد. با وارد کردن منابع داده خود در سطل آمازون S3 شروع کنید. وقتی این کار را انجام می‌دهید، قطعه‌ای را که می‌خواهید برای داده‌هایتان مشخص کنید. پیش فرض تقریباً ۳۰۰ توکن در هر قطعه است، اما شما می توانید اندازه خود را تنظیم کنید. سپس فروشگاه وکتور و مدل جاسازی‌ها را در پایگاه داده‌ای که ترجیح می‌دهید راه‌اندازی کنید یا به AWS اجازه دهید از پیش‌فرض Amazon OpenSearch Serverless خود استفاده کند. سپس پایگاه دانش خود را از کنسول Bedrock ایجاد کنید، منابع داده خود را دریافت کنید، و پایگاه دانش خود را آزمایش کنید. در نهایت، می‌توانید پایگاه دانش خود را به مدلی برای RAG متصل کنید، یا قدم بعدی را بردارید و آن را به یک عامل وصل کنید. یک ویدئوی خوب یک ساعته در این مورد توسط مانی خانوجا وجود دارد که در AWS re:Invent ضبط شده است. ۲۰۲۳.

عامل‌ها تعاملات بین مدل‌های بنیاد، منابع داده، برنامه های نرم افزاری و درخواست ها و فراخوانی API ها برای انجام اقدامات. علاوه بر اجزای RAG، عوامل می‌توانند دستورالعمل‌ها را دنبال کنند، از یک طرحواره OpenAPI برای تعریف APIهایی که عامل می‌تواند فراخوانی کند، استفاده کنند، و/یا یک تابع Lambda را فراخوانی کنند.

amazon bedrock 10

ایجاد و آزمایش پایگاه دانش Amazon Bedrock با این صفحه شروع می شود. چندین مرحله دیگر وجود دارد.

ارزیابی و استقرار مدل Amazon Bedrock

پنل ارزیابی و استقرار در Amazon Bedrock دارای عملکردی برای ارزیابی مدل و توان عملیاتی ارائه شده است.

ارزیابی مدل از ارزیابی خودکار یک واحد پشتیبانی می‌کند مدل، ارزیابی دستی حداکثر دو مدل با استفاده از تیم کاری خودتان، و ارزیابی دستی هر تعداد مدل که بخواهید با استفاده از یک تیم کاری با مدیریت AWS. ارزیابی خودکار از معیارهای پیشنهادی استفاده می‌کند که بسته به نوع کار مورد ارزیابی متفاوت است و می‌تواند از داده‌های درخواستی شما یا مجموعه داده‌های سفارشی داخلی استفاده کند.

توان عملیاتی ارائه شده به شما امکان می دهد ظرفیت اختصاصی را برای استقرار مدل های خود خریداری کنید. قیمت بسته به مدلی که استفاده می‌کنید و میزان تعهدی که انتخاب می‌کنید متفاوت است.

amazon bedrock 11

انتخاب ارزیابی خودکار مدل در Amazon Bedrock. بستر همچنین می تواند ارزیابی های مدل انسانی را تنظیم کند. معیارها و مجموعه داده های مورد استفاده با نوع کار مورد ارزیابی متفاوت است.

amazon bedrock 12

توان عملیاتی تهیه Amazon Bedrock ارزان نیست و برای هر مدلی در دسترس نیست. در اینجا ما هزینه ماهانه تخمینی تهیه پنج واحد مدل از مدل Llama 2 Chat 13B را برای یک ماه می بینیم. ۷۷.۳ هزار دلار است. افزایش این مدت به شش ماه هزینه ماهانه را به ۴۷.۷ هزار دلار کاهش می دهد. پس از خرید توان عملیاتی، نمی‌توانید واحدهای مدل یا اصطلاح ارائه‌شده را ویرایش کنید.

روش های سفارشی سازی مدل

در این مرحله ارزش آن را دارد که درباره راه‌های سفارشی‌سازی مدل‌ها به طور کلی بحث کنیم. در زیر به طور خاص در مورد روش های سفارشی سازی پیاده سازی شده در Amazon Bedrock صحبت خواهیم کرد.

مهندسی سریع، همانطور که در بالا نشان داده شده است، یکی از ساده ترین راه ها برای سفارشی کردن یک مدل هوش مصنوعی مولد است. به طور معمول، مدل ها دو اعلان، یک فرمان کاربر و یک دستور سیستم یا دستورالعمل را می پذیرند و یک خروجی تولید می کنند. شما معمولاً درخواست کاربر را همیشه تغییر می‌دهید و از اعلان سیستم برای تعریف ویژگی‌های کلی که می‌خواهید مدل استفاده کند، استفاده می‌کنید. مهندسی سریع اغلب برای تعریف روشی که می‌خواهید یک مدل برای یک کار کاملاً تعریف شده پاسخ دهد، مانند تولید متن در سبک‌های خاص با ارائه متن نمونه یا جفت‌های پرسش و پاسخ کافی است. شما به راحتی می توانید تصور کنید که یک درخواست برای “Talk Like a Pirate Day” ایجاد کنید. اوه، رفیق.

  • < meta content="4.5" itemprop="ratingValue"/>

    Amazon Bedrock یک رقیب معتبر برای Azure AI Studio است. اگر قبلاً به جای Microsoft Azure یا Google Cloud به AWS متعهد هستید، مطمئناً Bedrock انتخاب خوبی برای ایجاد و مقیاس‌بندی برنامه‌های هوش مصنوعی مولد خواهد بود. اما مراقب هزینه های استقرار باشید.

    مزایا

    • رابط مستقیم برای ساخت برنامه های هوش مصنوعی مولد با مهندسی سریع و تولید تقویت شده با بازیابی
    • مجموعه‌ای از مدل‌های متن، چت، و پایه تصویر را ارائه می‌دهد
    • به شما امکان می دهد بسیاری از مدل های پایه آن را سفارشی کنید
    • یادگیری سخت نیست

    معایب

    • دسترسی به مدل‌های OpenAI ندارد
    • مدل های پایه کمتری نسبت به Azure AI Studio ارائه می کند
    • در حال حاضر از فیلتر محتوا عقب مانده است

Amazon Bedrock یک رقیب معتبر برای Azure AI Studio است. اگر قبلاً به جای Microsoft Azure یا Google Cloud به AWS متعهد هستید، مطمئناً Bedrock انتخاب خوبی برای ایجاد و مقیاس‌بندی برنامه‌های هوش مصنوعی مولد خواهد بود. اما مراقب هزینه های استقرار باشید.

  • رابط مستقیم برای ساخت برنامه های هوش مصنوعی مولد با مهندسی سریع و تولید تقویت شده با بازیابی
  • مجموعه‌ای از مدل‌های متن، چت، و پایه تصویر را ارائه می‌دهد
  • به شما امکان می دهد بسیاری از مدل های پایه آن را سفارشی کنید
  • یادگیری سخت نیست
  • دسترسی به مدل‌های OpenAI ندارد
  • مدل های پایه کمتری نسبت به Azure AI Studio ارائه می کند
  • در حال حاضر از فیلتر محتوا عقب مانده است