۲۸ مهر ۱۴۰۴

Techboy

اخبار و اطلاعات روز تکنولوژی

افزودن هوشمندی به دریاچه‌های داده Azure با عوامل داده Fabric

عاملان داده گفتگویی در بستر داده‌های بزرگ مایکروسافت، داده‌ها و بینش‌های سازمانی را به فرآیندهای تجاری مبتنی بر هوش مصنوعی می‌آورند.

عاملان داده گفتگویی در بستر داده‌های بزرگ مایکروسافت، داده‌ها و بینش‌های سازمانی را به فرآیندهای تجاری مبتنی بر هوش مصنوعی می‌آورند.

کار با Fabric و هوش مصنوعی

هوش مصنوعی سازمانی به یک چیز نیاز دارد تا بتواند محدودیت‌های مدل‌های زبان بزرگ را دور بزند و نتایجی که کسب‌وکارها از عامل‌های خود می‌خواهند ارائه دهد. مهم نیست که شما برنامه‌های تولید تکمیلی با بازیابی (RAG)، تنظیم دقیق یا استفاده از پروتکل زمینه مدل را می‌سازید، آنچه نیاز دارید داده است — و مقدار زیادی از آن.

در نتیجه مایکروسافت پلتفرم دریاچه داده مقیاس بزرگ Fabric را برای کار با پلتفرم توسعه Azure AI Foundry توسعه داده است. در رویداد اخیر FabCon 2025، مایکروسافت ادغام‌های بیشتر بین این دو را اعلام کرد، با استفاده از Fabric برای توسعه عامل‌هایی که با داده کار می‌کنند و سپس می‌توانند سازماندهی شوند و درون برنامه‌های Azure AI Foundry ساخته شوند. با ترکیب تکنیک‌های تجزیه و تحلیل داده‌های شناخته‌شده با ابزارهای هوش مصنوعی، مایکروسافت دسترسی به داده‌ها و بینش‌های سازمانی را آسان‌تر می‌کند و از آن‌ها برای پایه‌گذاری خروجی‌های عامل‌های هوش مصنوعی استفاده می‌نماید.

ساخت پرس‌و‌جوهای مبتنی بر هوش مصنوعی

عامل‌های داده Fabric به‌گونه‌ای طراحی شده‌اند که بتوان آن‌ها را خارج از Azure AI Foundry ساخت و آزمایش کرد. می‌توانید از آن‌ها برای کاوش مکالمه‌ای داده‌های خود استفاده کنید، به‌عنوان رویکردی جایگزین برای ابزارهای تحلیلی سنتی. در اینجا سؤالاتی درباره داده‌های خود می‌پرسید و با استفاده از پاسخ‌ها پرامپت‌ها و پرس‌و‌جوها را تصحیح می‌کنید تا اطمینان حاصل شود که پرامپت داده‌های معقولی باز می‌گرداند که می‌تواند به راهنمایی تصمیم‌های تجاری مؤثر کمک کند وقتی در برنامه‌ای تعبیه شود. با استفاده از دانشمندان داده و تحلیل‌گران تجاری که از تکنیک‌های تکراری برای ارائه پرس‌و‌جوهای پایه‌دار استفاده می‌کنند، هرگونه ریسکی مرتبط با استفاده از یک مدل زبان بزرگ در برنامه تجاری به‌طرز چشمگیری کاهش می‌یابد.

عامل‌های داده Fabric با پیاده‌سازی‌های موجود OneLake کار می‌کنند و مجموعه‌ای پایه‌ای از داده‌ها را برای استفاده به‌عنوان زمینه برای پرس‌و‌جوهای شما فراهم می‌آورند. به‌ همراه داده‌های شما، می‌توان آن‌ها را با استفاده از مثال‌ها تنظیم دقیق کرد یا دستورات خاصی برای ساخت پرس‌و‌جوها ارائه داد.

قبل از ساخت یک عامل داده، پیش‌نیازهایی وجود دارد. کلید اصلی نیاز به یک کلاینت F64 یا بالاتر به‌ همراه یک منبع داده مناسب است. این می‌تواند یک lake house، یک data warehouse، مجموعه‌ای از مدل‌های معنایی Power BI یا یک پایگاه داده KQL باشد. محدود کردن منابع منطقی است، زیرا خطر از دست دادن زمینه مرتبط با یک پرس‌و‌جو را کاهش می‌دهد و هوش مصنوعی را پایه‌دار نگه می‌دارد. این کمک می‌کند تا عامل از مجموعه محدودی از انواع پرس‌و‌جوهای شناخته‌شده استفاده کند و سؤال‌های شما را به پرس‌و‌جو مناسب تبدیل کند.

تنظیم یک عامل با دستورالعمل‌ها و نمونه‌ها

عامل هنگام انجام پرس‌و‌جوها از اعتبارهای کاربر استفاده می‌کند، بنابراین فقط با داده‌هایی که کاربر می‌تواند مشاهده کند کار می‌کند. دسترسی مبتنی بر نقش به‌صورت پیش‌فرض تنظیم شده است تا داده‌های شما تا حد امکان امن بمانند. عملیات عامل باید از نشت اطلاعات محرمانه جلوگیری کند، به‌ ویژه اگر بخواهند در داخل گردش کارهای پیچیده‌تر Azure AI Foundry گنجانده شوند.

عامل‌های داده Fabric بر پایه APIهای Azure OpenAI Assistant ساخته شده‌اند. این تضمین می‌کند که درخواست‌ها از طریق ابزارهای امنیتی هوش مصنوعی Azure عبور می‌کند، از جمله اعمال سیاست‌های هوش مصنوعی مسئولانه و استفاده از فیلترهای پرامپت به‌روزرسانی‌شده برای کاهش خطرات مرتبط با تزریق پرامپت یا دیگر حملات هوش مصنوعی. از آنجا که عامل‌های Fabric فقط‑خواندنی هستند، باید مطمئن شویم که نمی‌توانند برای نشت داده‌های محرمانه استفاده شوند.

پرس‌و‌جوهای تولید شده توسط عامل با استفاده از یکی از سه ابزار مختلف ساخته می‌شوند که زبان طبیعی را به زبان‌های پرس‌و‌جو Fabric ترجمه می‌کنند: SQL برای ذخیره‌سازهای رابطه‌ای، DAX برای Power BI و KQL برای پرس‌و‌جوهای غیررابطه‌ای با استفاده از Kusto. این امکان را به شما می‌دهد تا در صورت لزوم هر پرس‌و‌جویی را تأیید کنید، زیرا به‌گونه‌ای طراحی شده‌اند که به‌درستی ساخته شوند. با این حال، در عمل، عامل‌های داده Fabric برای کاربران تجاری به‌منظور ساخت پرس‌و‌جوهای پیچیده بدون نیاز به نوشتن کد طراحی شده‌اند.

مایکروسافت خود پیشنهاد می‌کند که ساخت یک عامل داده Fabric باید دستیابی به سطح مشابهی از دانش مانند ایجاد یک گزارش Power BI باشد. ساخت یک عامل بیش از انتخاب منابع داده و جدول‌ها است؛ یک عنصر کلیدی از فرآیند وجود دارد که از استفاده LLM از زمینه بهره می‌برد.

با افزودن دستورالعمل‌ها و پرس‌و‌جوهای نمونه به تعریف یک عامل، می‌توانید زمینه‌ای که برای پاسخ به پرس‌و‌جوهای کاربر استفاده می‌کند را بهبود بخشید. دستورالعمل‌ها می‌توانند منابع داده‌ای که برای هر نوع سؤال استفاده می‌شود را تصفیه کنند، همچنین دانش تخصصی اضافی که ممکن است در داده‌های شما گنجانده نشده باشد را فراهم سازند. به‌عنوان مثال، دستورالعمل‌ها می‌توانند اصطلاحات ویژه مورد استفاده در سازمان شما را تعریف کنند. این دقیقاً تنظیم دقیق نیست، زیرا دستورالعمل‌ها بر مدل تأثیری ندارند، اما زمینه‌ای برای بهبود خروجی و کاهش خطر توهم فراهم می‌کند.

داشتن ابزارهای تنظیم در فرآیند ایجاد عامل مهم است. مایکروسافت هدف دارد تا Fabric را به‌عنوان منبع تکانه‌ای برای داده‌های سازمانی معرفی کند، بنابراین نگه داشتن خطر خطاها در حداقل ممکن باید یک الزامات کلیدی برای هر هوش مصنوعی ساخته‌شده بر پایه آن داده باشد.

بر خلاف چارچوب‌های دیگر عامل، شما باید کار لازم را انجام دهید تا ابتدا اطمینان حاصل کنید که منابع مناسب برای عامل خود انتخاب کنید. سپس باید مطمئن شوید که به اندازه کافی زمینه دارد تا پرس‌و‌جوها را به منبع مناسب مسیردهی کند (به‌عنوان مثال، اگر از Fabric برای ذخیره‌سازی اطلاعات نظارتی برنامه‌ها استفاده می‌کنید، عامل شما باید از KQL استفاده کند). نهایتاً، باید مجموعه‌ای از جفت‌های سؤال‑پاسخ را جمع‌آوری کنید که عامل را در انواع پرس‌و‌جوهایی که با آن‌ها کار می‌کند و نحوه پاسخ‌دهی آن آموزش می‌دهد.

اگر یک عامل پاسخ‌های نادرست به پرس‌و‌جوها بدهد، مؤثرترین راه برای بهبود پایه‌گذاری آن، استفاده از مثال‌های بیشتر برای بهبود زمینه است. هرچه مثال‌های کیوریت بیشتری استفاده کنید هنگام ساخت یک عامل داده، نتایج بهتری خواهید داشت.

برای ساخت یک عامل داده Fabric نیازی به مهارت‌های برنامه‌نویسی زیاد ندارید. این فرآیند به‌طور عمده برای متخصصان داده طراحی شده است — رویکردی که با سیاست مایکروسافت برای فراهم کردن ابزارهای هوش مصنوعی در دست متخصصان موضوعی همسو است. اگر ترجیح می‌دهید از کد برای ساخت یک عامل داده استفاده کنید، مایکروسافت یک SDK پایتون برای ایجاد، مدیریت و استفاده از عامل‌های داده Fabric فراهم می‌کند.

ساخت اولین عامل داده Azure شما

شروع کار به‌ اندازه‌ای ساده است. عامل‌های داده Fabric اکنون یک مورد استاندارد در فضای کاری Fabric هستند، بنابراین تمام کاری که باید انجام دهید ایجاد یک عامل جدید است. ابتدا با اختصاص نامی به آن شروع کنید. این می‌تواند هر چیزی باشد، هرچند بهتر است نامی مرتبط با هدف عامل انتخاب کنید — به‌ خصوص اگر قصد انتشار آن به‌عنوان نقطه انتهایی برای برنامه‌های Azure AI Foundry دارید.

پس از اختصاص نام به عامل، می‌توانید تا پنج منبع داده از محیط Fabric خود اضافه کنید. این ابزار به کاتالوگ داده OneLake Fabric دسترسی می‌دهد و پس از انتخاب یک منبع می‌توانید جدول‌ها را به عامل با استفاده از چک‌باکس‌ها نمایش دهید. اگر بعداً نیاز به افزودن منابع دیگر یا تغییر انتخاب جدول داشتید، می‌توانید از رابط Explorer Fabric انجام دهید. نکته مفید این است که اطمینان حاصل کنید جدول‌ها نام‌های توصیفی داشته باشند؛ هرچه این نام‌ها توصیفی‌تر باشند، پرس‌و‌جوهای تولید شده توسط عامل دقیق‌تر خواهند بود.

اکنون می‌توانید عامل را با طرح سؤال تست کنید. مایکروسافت اشاره می‌کند که می‌توانید فقط درباره داده‌ها سؤال کنید؛ مدل قادر به استدلال نیست، بنابراین نمی‌تواند نتایجی را استنتاج کند که داده‌ای وجود نداشته باشد یا به اطلاعاتی که در Fabric ذخیره نشده‌اند دسترسی داشته باشد. این تعجب‌آور نیست، چرا که چیزی که ما می‌سازیم یک برنامه RAG سنتی با اتصال عمیق به داده‌های شماست.

تنظیم و به اشتراک‌گذاری یک عامل داده

عاملی که در این مرحله دارید هیچ دستورالعمل یا تنظیمی ندارد؛ شما فقط در حال آزمایش این هستید که آیا می‌تواند پرس‌و‌جوها را در مقابل منابع شما بسازد و تجزیه کند. پس از داشتن یک عامل پایه، می‌توانید دستورالعمل‌ها و تنظیمات را اعمال کنید. پنل جداگانه‌ای در سطح طراحی به شما امکان می‌دهد تا تا ۱۵٬۰۰۰ کاراکتر دستورالعمل اضافه کنید. این‌ها به زبان انگلیسی هستند و باید توصیف کنند که عامل چگونه باید با منابع داده شما کار کند. می‌توانید از ابزارهای پرامپت عامل برای آزمایش دستورالعمل‌ها همراه با پرس‌و‌جوهای ثابت خود استفاده کنید.

اکنون می‌توانید از پرس‌و‌جوهای نمونه برای تنظیم مدل استفاده کنید، با به‌کارگیری تکنیک یادگیری چند‑نمونه‌ای. با ارائه جفت‌های سؤال و پاسخ مورد انتظار، مجموعه‌ای از وزن‌ها ایجاد می‌کنید که مدل زیربنایی را هدایت می‌کند تا پاسخ‌های مورد انتظار را تولید کند. یادگیری چند‑نمونه‌ای ابزاری مفید برای عامل‌های مبتنی بر داده است زیرا می‌توانید با تعداد بسیار کمی از جفت‌های سؤال‑پاسخ نتایج قابل اعتماد به‌دست آورید. می‌توانید مثال‌ها را برای تمام منابع داده پشتیبانی‌شده، به‌جز مدل‌های معنایی Power BI، فراهم کنید.

پس از تنظیم و تست، یک عامل داده Fabric می‌تواند منتشر و به‌اشتراک گذاشته شود با همکاران یا برنامه‌ها. انتشار دو نسخه از عامل شما ایجاد می‌کند: یک نسخه که می‌توانید ادامه دهید و یک نسخهٔ ثابت که آماده به‌اشتراک‌گذاری است. عامل‌های داده Fabric می‌توانند با Azure AI Foundry به‌عنوان مؤلفه‌ها استفاده شوند، که در اینجا به‌عنوان منابع دانش به کار می‌روند، به‌ همراه یک عامل داده Fabric برای هر عامل Azure AI. نقاط انتهایی می‌توانند از طریق یک API REST دسترسی داشته باشند، با استفاده از جزئیات فضای کاری شما به‌عنوان بخشی از URL فراخوانی.

ابزار عامل مایکروسافت رویکرد جالبی دارد که توسعه را به دست متخصصان موضوع می‌سپارد. در اینجا عامل‌های داده Fabric یک ابزار low-code برای ساخت سرویس‌های هوش مصنوعی تحلیلی، متمرکز بر داده هستند که از OneLake Fabric به‌عنوان منبع داده RAG استفاده می‌کنند. تحلیل‌گران کسب‌وکار و دانشمندان داده می‌توانند قبل از باز کردن به بقیه سازمان، عامل‌ها را بسازند، تست کنند و تنظیم نمایند؛ این کار دسترسی عمیق به بخش‌های کلیدی داده‌های تجاری را فراهم می‌کند و اجازه می‌دهد تا به‌عنوان بخشی از نسل بعدی جریان‌کارهای تجاری مبتنی بر هوش مصنوعی، ادغام شود.