۳۰ آذر ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

چیزهای جدید در خدمات هوش مصنوعی NLP مایکروسافت آزور

مایکروسافت بالاخره به ارائه رابط های کاربری طبیعی که مدت ها وعده آن را داده بود نزدیک می کند. در اینجا نحوه ایجاد آنها در کد خود آورده شده است.

مایکروسافت بالاخره به ارائه رابط های کاربری طبیعی که مدت ها وعده آن را داده بود نزدیک می کند. در اینجا نحوه ایجاد آنها در کد خود آورده شده است.

اگر می‌خواهید از یادگیری ماشین در برنامه‌های خود استفاده کنید، مایکروسافت راه‌های مختلفی را برای شروع سریع توسعه ارائه می‌کند. یکی از فناوری‌های کلیدی، سرویس‌های شناختی Azure مایکروسافت، مجموعه‌ای از خدمات مدیریت شده را ارائه می‌کند. خدمات یادگیری ماشینی با مدل های از پیش آموزش دیده و نقاط پایانی REST API. این مدل‌ها بیشتر موارد استفاده رایج، از کار با متن و زبان، تا تشخیص گفتار و تصاویر را ارائه می‌دهند.

یادگیری ماشین هنوز در حال تکامل است، با عرضه مدل‌های جدید و سخت‌افزار جدید برای کمک به سرعت بخشیدن به استنباط، و بنابراین مایکروسافت مرتباً خدمات شناختی خود را به‌روزرسانی می‌کند. آخرین به روز رسانی بزرگ که در بیلد ۲۰۲۲ معرفی شد، تغییرات زیادی را در ابزارهای خود برای کار با متن ارائه می دهد و سه سرویس مختلف را زیر یک چتر قرار می دهد. در جایی که تجزیه و تحلیل متن، QnA Maker و درک زبان LUIS ابزارهای جداگانه ای بودند، اکنون بخشی از یک مجموعه از ابزارهای پردازش زبان طبیعی هستند که به شما کمک می کنند با داده های ذخیره شده و ورودی های کاربر در زمان واقعی کار کنید.

معرفی خدمات شناختی برای زبان

اکنون به‌عنوان سرویس شناختی زبان علامت‌گذاری شده است. ، ابزارها به شما امکان دسترسی به ویژگی های آشنا (پس از مهاجرت به API های جدید) و خدمات جدید را می دهند. مهاجرت می‌تواند پیچیده باشد، زیرا در اینجا وجود دارد در حال شکستن تغییرات بین دو نسخه برای برخی از خدمات است. در حال حاضر می‌توانید از APIهای قدیمی استفاده کنید، اما ارزش بررسی سرویس جدید برای برنامه‌های کاربردی جدید و به‌روزرسانی‌های کد موجود را دارد.

فایل‌های پیکربندی LUIS می‌توانند پروژه‌های جدید درک زبان مکالمه ایجاد کنند، اگرچه برخی از موجودیت‌ها پشتیبانی نمی‌شوند. این بر مدل هایی که سفارشی شده اند تأثیر می گذارد. اگرچه مایکروسافت پیشنهاد می‌کند که مدل‌های زبان جدیدش به این سفارشی‌سازی‌ها نیازی ندارند، اما اگر مشکلی در سرویس جدید پیدا کردید، ارزش آن را دارد که بر عملکرد برنامه نظارت کنید و با APIهای جدید کار کنید.

اگر از سرویس مدیریت دانش QnA Maker استفاده کرده‌اید، ممکن است بهترین کار را داشته باشید که خدمات سفارشی پاسخ‌گویی به سؤالات را از همان منبع منبع ایجاد کنید. می‌توانید پایگاه‌های دانش را بین سرویس‌ها کپی کنید تا پیشنهادهای قبلاً آموخته‌شده را ارائه دهید، اما در عمل، تغییرات کافی در مدل اساسی وجود دارد که ممکن است شروعی تازه ترجیح داده شود.

API یادگیری عمیق Keras 3.0 از TensorFlow، PyTorch، Jax پشتیبانی می کند

سرویس شناختی زبان دارای چندین ویژگی جدید است که در پلتفرم اصلی نبودند. برخی از اینها به ویژه برای برنامه های سازمانی مفید هستند زیرا به خودکارسازی سناریوهای پیچیده نظارتی کمک می کنند که در آن کاربران متن آزاد را وارد می کنند (مانند چت ها یا ایمیل ها) و شما باید این تعاملات را ذخیره کنید.

به طور خودکار PII را شناسایی و ویرایش کنید

یک ویژگی جدید باید یک برد سریع برای هر برنامه‌ای باشد که با اطلاعات شناسایی شخصی سروکار دارد. PII در اکثر حوزه‌های قضایی به شدت تنظیم می‌شود، اما معمول است که کاربر جزئیات کارت اعتباری یا شماره تامین اجتماعی را در ایمیل یا چت درج کند. اگر در حال آرشیو کردن محتوا هستید، این موارد باید اصلاح شوند و ابزار شناسایی PII در Azure Cognitive Service for Language می تواند به شناسایی این داده ها کمک کند.

کار با ابزارهای تشخیص PII مثل اکثر سرویس‌های Azure، این است که آنها را در گردش کار برنامه خود قرار دهید. با ایجاد یک منبع زبان Azure شروع کنید، که نقطه پایانی سرویس شما را میزبانی می کند و کلیدهای مناسب را برای سرویس ایجاد می کند. اکنون می‌توانید به REST API برای سرویس شناسایی PII دسترسی داشته باشید و مستقیماً با استفاده از تماس‌های آشنای HTTPS با داده‌های JSON به آن آدرس‌دهی کنید. از طرف دیگر، SDKهایی برای اکثر زبان‌ها و پلتفرم‌های متداول وجود دارد که تماس‌های API را به‌عنوان روش‌ها، مدیریت دسترسی، درخواست و پاسخ را برای شما قرار می‌دهند.

اگر از پایتون استفاده می‌کنید، مایکروسافت یک کتابخانه مشتری برای ابزارهای تجزیه و تحلیل متن خود ارائه می‌کند که می‌تواند از طریق پیپ نصب شود. پس از نصب، کتابخانه می‌تواند کلیدهای دسترسی شما را صادر کند و یک شی مشتری ایجاد کند که به نقاط پایانی شناسایی PII دسترسی داشته باشد. شما باید متنی را برای PII که قصد ویرایش آن را دارید ارائه دهید، به عنوان مثال، محتوایی که ممکن است حاوی SSN، شماره کارت اعتباری یا شماره تلفن باشد، و سیستم یک شی متن را با داده‌های ویرایش شده و مجموعه‌ای از امتیازات اطمینان برمی‌گرداند. .

Snowflake's Data Clean Room قول داده است که تجزیه و تحلیل داده های PII را آسان کند

اینها به شما کمک می‌کنند تا اسناد بدون ساختار را به‌طور خودکار ویرایش کنید، و ویرایش را بر اساس اسناد نمونه خود دسته‌بندی کنید. این سرویس می‌تواند مجموعه ای از انواع موجودیت رایج: نام، شماره تلفن، آدرس (فیزیکی و ایمیل)، شناسه های عددی مانند کلید محصول یا شماره حساب بانکی، و جزئیات کارت اعتباری.

اگر از این ابزار برای مکالمات استفاده می‌کنید، برای مثال، به عنوان بخشی از یک ربات چت، می‌توانید از یک API جایگزین برای تجزیه و تحلیل فهرستی از موارد مکالمه برای PII، بازگرداندن داده ها به صورت ناهمزمان این بدان معنی است که شما نمی توانید داده ها را در زمان واقعی ویرایش کنید. در عوض، در نظر گرفته شده است که کل چت ها را قبل از بایگانی پردازش کند و یک مرحله ویرایش را به گردش کار برنامه شما اضافه کند. حتی می‌تواند گفتار شناسایی شده برای PII را پردازش کند، اطمینان حاصل کند که رونوشت‌ها حاوی اطلاعات حساس نیستند و در عین حال کدهای زمانی را برای ویرایش صدا ارائه می‌کند. هر تماس با API PII مکالمه حاوی یک سند با یک مکالمه است. در حال حاضر، شما محدود به استفاده از زبان انگلیسی برای این سرویس هستید.

جریان های کاری را از چت هماهنگ کنید

مایکروسافت همچنان به گسترش ابزارهای موجود در خدمات شناختی خود ادامه می‌دهد، افزودن ویژگی های جدید در یک آهنگ ماهانه با ارائه مدل های جدید. یکی از ابزارهایی که اخیراً در دسترس عموم قرار گرفته است به شما امکان می دهد گردش کار را هماهنگ کنید در چندین سرویس با استفاده از API یادگیری ماشین مکالمه برای استخراج اطلاعات از محتوا و سپس ارسال آن به سرویس‌های صحیح.

این رویکرد به یک مدل سفارشی آموزش داده شده از داده های برچسب گذاری شده نیاز دارد که اهداف و اقدامات را تعریف می کند. شما مدل در Language Studio، یک پورتال Azure که ابزارهایی برای آموزش و آزمایش مدل شما ارائه می دهد. شما با طرحی شروع خواهید کرد که به پروژه درک زبان محاوره ای پیوست شده است. پس از آموزش، مدل ارکستراسیون می تواند برای مسیریابی داده ها از یک ربات گفتگو به سرویس مناسب استفاده شود.

یادگیری ماشینی انسان در حلقه چیست؟ داده های بهتر، مدل های بهتر

به‌عنوان مثال، می‌توانید یک ربات سلف سرویس منابع انسانی داشته باشید که تشخیص دهد آیا سؤالی می‌پرسید که باید به پایگاه دانش منابع انسانی ارسال شود یا درخواست مرخصی می‌دهید، در این صورت تاریخ‌ها را استخراج می‌کند. و آنها را به یک برنامه درخواست تقویم تعطیلات ارسال کنید. گردش‌های کاری مانند این غیررسمی هستند و یک ربات چت که در تیم‌های مایکروسافت اجرا می‌شود به کارکنان اجازه می‌دهد تا به سرعت به سرویس‌ها و بدون ایجاد وقفه در سایر وظایف دسترسی پیدا کنند.

محدودیت‌هایی برای اندازه‌ها وجود دارد اسناد قابل ارسال به سرویس زبان. شما می توانید پنج سند را در یک زمان به API تشخیص PII ارسال کنید، با محدودیت های نرخ تعیین شده توسط سطح اشتراک شما. یک سند می تواند تنها ۵۱۲۰ کاراکتر برای ویرایش همزمان، ۱۲۵۰۰۰ کاراکتر و ۱ مگابایت برای همه اسناد در یک درخواست ناهمزمان داشته باشد. می‌توانید از تماس‌های اطلاعات رشته استاندارد برای دریافت اندازه سند قبل از ارسال آنها به سرویس استفاده کنید و در صورت لزوم محتوا را تکه تکه کنید.

یک رابط زبان طبیعی

برای مایکروسافت منطقی است که سرویس‌های مختلف را که خدمات شناختی جدید برای زبان را تشکیل می‌دهند، با هم ترکیب کند. گنجاندن آنها در یک موتور مسیریابی گردش کار هوشمند به چسباندن خدمات در زمینه مکالمات غیررسمی و بدون ساختار کمک می کند. ربات‌های گفتگو و سایر سرویس‌های مبتنی بر محتوا اغلب تک منظوره و غیرقابل انعطاف بوده‌اند، در حالی که کاربران انتظار دارند یک محیط مکالمه‌ای داشته باشد که بتواند از چندین کار پشتیبانی کند و در عین حال از حریم خصوصی آنها محافظت کند.

از آنجایی که ما بیشتر و بیشتر خدماتی مانند میز کمک را در داخل و خارج سازمان خود خودکار می کنیم، ارائه یک رابط هوشمند برای پایگاه های دانش و برنامه های کاربردی اهمیت فزاینده ای دارد. ما باید انتظارات کاربر را مطابقت دهیم، و ابزارهایی مانند این، داربستی را برای ارائه سیستم‌های خودکاری فراهم می‌کنند که احساس خودکار بودن ندارند و می‌توانند به روش‌های غیررسمی ارتباط ما پاسخ دهند. این یک راه جالب برای نگاه کردن به توسعه رابط کاربری است. این ابزار بسیار نزدیک‌تر به رابط‌های کاربری طبیعی است که مایکروسافت در دهه گذشته از آن دفاع کرده است.