۳۰ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

پاسخگو کردن هوش مصنوعی: بلاک چین، حاکمیت و قابلیت حسابرسی

ثبت فرآیند توسعه مدل در بلاک چین می‌تواند آن فرآیند را ساختارمندتر، شفاف‌تر و تکرارپذیرتر کند و در نتیجه سوگیری کمتر و مسئولیت‌پذیری بیشتری را به همراه داشته باشد.

ثبت فرآیند توسعه مدل در بلاک چین می‌تواند آن فرآیند را ساختارمندتر، شفاف‌تر و تکرارپذیرتر کند و در نتیجه سوگیری کمتر و مسئولیت‌پذیری بیشتری را به همراه داشته باشد.

چند سال گذشته در مورد هوش مصنوعی (AI) دست و پا زدن و تکان دادن دست‌ها را به همراه داشته است، زیرا افراد تجاری و فن‌آوران به طور یکسان نگران قدرت تصمیم‌گیری بزرگی هستند که معتقدند این سیستم‌ها دارند.

به عنوان یک دانشمند داده، من عادت دارم که در مورد امکانات و محدودیت های هوش مصنوعی صدای عقل باشم. در این مقاله توضیح می‌دهم که چگونه شرکت‌ها می‌توانند از فناوری بلاک چین برای حاکمیت توسعه مدل استفاده کنند، پیشرفتی برای درک بهتر هوش مصنوعی، فرآیند توسعه مدل قابل حسابرسی، و شناسایی و تعیین مسئولیت برای تصمیم‌گیری هوش مصنوعی.

استفاده از بلاک چین برای حاکمیت توسعه مدل

در حالی که آگاهی گسترده ای در مورد نیاز به کنترل هوش مصنوعی وجود دارد، بحث در مورد چگونگی انجام این کار اغلب مبهم است، مانند “چگونه مسئولیت پذیری را در هوش مصنوعی خود ایجاد کنیم” در بازبینی کسب و کار هاروارد:

ساختارهای حاکمیتی را ارزیابی کنید. یک اکوسیستم سالم برای مدیریت هوش مصنوعی باید شامل فرآیندها و ساختارهای حاکمیتی باشد… مسئولیت‌پذیری برای هوش مصنوعی به معنای جستجوی شواهد محکمی از حکمرانی در سطح سازمانی است، از جمله اهداف و مقاصد روشن. برای سیستم هوش مصنوعی؛ نقش ها، مسئولیت ها و خطوط اختیارات به خوبی تعریف شده نیروی کار چند رشته ای که قادر به مدیریت سیستم های هوش مصنوعی است. مجموعه گسترده ای از سهامداران؛ و فرآیندهای مدیریت ریسک علاوه بر این، جستجوی عناصر حاکمیتی در سطح سیستم، مانند مشخصات فنی مستند سیستم هوش مصنوعی خاص، انطباق، و دسترسی سهامداران به اطلاعات طراحی و عملیات سیستم، حیاتی است.

این فهرست جامع از الزامات کافی است تا چشم هر خواننده ای را خیره کند. یک سازمان دقیقاً چگونه به دنبال «عناصر حاکمیت در سطح سیستم» و «دسترسی ذینفعان به اطلاعات طراحی و عملیات سیستم» است؟

در اینجا توصیه‌های عملی و واقعی وجود دارد: از فناوری بلاکچین استفاده کنید تا اطمینان حاصل کنید که تمام تصمیمات اتخاذ شده در مورد یک مدل هوش مصنوعی یا یادگیری ماشین ثبت شده و قابل بازرسی هستند. (افشای کامل: در سال ۲۰۱۸ یک درخواست ثبت اختراع ایالات متحده [۱۶/۱۲۸,۳۵۹ ایالات متحده] در مورد استفاده از بلاک چین برای حاکمیت توسعه مدل ثبت کردم.)

چگونه بلاک چین قابلیت حسابرسی ایجاد می کند

توسعه یک مدل تصمیم‌گیری هوش مصنوعی فرآیند پیچیده‌ای است که شامل تصمیمات افزایشی بی‌شماری است – متغیرهای مدل، طراحی مدل، داده‌های آموزشی و آزمایشی مورد استفاده، انتخاب ویژگی‌ها و غیره. همه این تصمیمات را می توان در زنجیره بلوکی ثبت کرد، که همچنین می تواند امکان مشاهده ویژگی های پنهان. همچنین می‌توانید تمام دانشمندانی را که بخش‌های مختلفی از مجموعه‌های متغیر را ساخته‌اند و در ایجاد وزن مدل و آزمایش مدل شرکت کرده‌اند، در بلاک چین ثبت کنید.

حاکمیت مدل و شفافیت در ایجاد فناوری هوش مصنوعی اخلاقی که قابل ممیزی است ضروری است. همانطور که توسط فناوری بلاک چین امکان پذیر است، مجموع و کل رکورد این تصمیمات دید لازم را برای کنترل موثر مدل ها در داخل، نسبت دادن مسئولیت پذیری و برآوردن رگولاتورهایی که قطعاً می آیند برای هوش مصنوعی شما. 

JetBrains ابزار تحلیل کد استاتیک Qodana را ارسال می کند

قبل از بلاک چین: مدل های تحلیلی در حال حرکت هستند

قبل از اینکه بلاک چین به یک کلمه کلیدی تبدیل شود، من شروع به پیاده سازی یک رویکرد مدیریت مدل تحلیلی مشابه در سازمان علم داده خود کردم. در سال ۲۰۱۰ یک فرآیند توسعه را با محوریت سند ردیابی تحلیلی (ATD) ایجاد کردم. این رویکرد به جزئیات طراحی مدل، مجموعه‌های متغیر، دانشمندان اختصاص داده شده، آموزش و آزمایش داده‌ها و معیارهای موفقیت می‌پردازد، و کل فرآیند توسعه را به سه یا چند سرعت چابک تقسیم می‌کند.

من تشخیص دادم که یک رویکرد ساختاریافته با ATD ضروری است، زیرا نتایج منفی بسیار زیادی از آنچه در بسیاری از صنعت مالی به هنجار تبدیل شده بود دیده‌ام: فقدان اعتبار و پاسخگویی. با استفاده از بانکداری به عنوان مثال، یک دهه پیش طول عمر معمول یک مدل تحلیلی به این صورت بود:

  • یک دانشمند داده یک مدل می سازد و متغیرهایی را که در آن موجود است انتخاب می کند. این امر منجر به ایجاد متغیرهای اضافی توسط دانشمندان، عدم استفاده از طراحی متغیر معتبر و ایجاد خطاهای جدید در کد مدل شد. در بدترین موارد، یک دانشمند داده ممکن است با متغیرهایی تصمیم گیری کند که می تواند سوگیری، حساسیت مدل یا نشت هدف را معرفی کند.
  • وقتی همان دانشمند داده سازمان را ترک می‌کند، دایرکتوری‌های توسعه او معمولاً یا حذف می‌شوند یا اگر تعدادی دایرکتوری مختلف وجود داشته باشد، مشخص نمی‌شود که کدام دایرکتوری‌ها مسئول مدل نهایی هستند. بانک اغلب کد منبع مدل را ندارد یا ممکن است فقط قطعاتی از آن داشته باشد. فقط با نگاه کردن به کد، هیچ کس به طور قطعی متوجه نمی شود که مدل چگونه ساخته شده است، داده هایی که بر اساس آن ساخته شده است، و مفروضاتی که در ساخت مدل نقش داشته اند.
  • در نهایت بانک می تواند با این فرض که مدل به درستی ساخته شده است در موقعیت پرریسکی قرار گیرد و رفتار خوبی از خود نشان دهد – اما واقعاً نمی داند. بانک قادر به تایید مدل یا درک این موضوع نیست که در چه شرایطی مدل غیرقابل اعتماد یا غیرقابل اعتماد خواهد بود. این واقعیت‌ها منجر به ریسک غیرضروری یا دور انداختن و بازسازی تعداد زیادی از مدل‌ها می‌شوند که اغلب سفر بالا را تکرار می‌کنند.

یک بلاک چین برای تدوین پاسخگویی

اختراع در انتظار ثبت اختراع من شرح می‌دهد که چگونه می‌توان توسعه مدل تحلیلی و یادگیری ماشینی را با استفاده از فناوری بلاک چین برای مرتبط کردن زنجیره‌ای از موجودیت‌ها، وظایف کاری و الزامات با یک مدل، از جمله آزمایش‌ها و بررسی‌های اعتبارسنجی، تدوین کرد. این بیشتر رویکرد تاریخی را که من برای ساختن مدل‌ها در سازمانم استفاده کردم تکرار می‌کند – ATD اساساً یک قرارداد بین دانشمندان، مدیران و من است که شرح می‌دهد:

  • مدل چیست
  • اهداف مدل
  • چگونه آن مدل را می‌سازیم، از جمله الگوریتم یادگیری ماشین تجویز شده
  • زمینه هایی که مدل باید بر اساس آنها بهبود یابد، به عنوان مثال، بهبود ۳۰ درصدی در کارت موجود نیست (CNP) کلاهبرداری از کارت اعتباری در سطح تراکنش
  • درجات آزادی که دانشمندان برای حل مشکل دارند، و آنهایی که ندارند
  • استفاده مجدد از متغیرهای معتبر و معتبر و کد مدل snip-it
  • الزامات داده های آموزش و آزمون
  • روش‌ها و آزمون‌های

  • هوش مصنوعی اخلاقی
  • آزمایش‌های استحکام و پایداری
  • چک لیست های آزمایش مدل خاص و اعتبارسنجی مدل
  • دانشمندان تحلیلی اختصاص داده شده برای انتخاب متغیرها، ساخت مدل‌ها و آموزش آنها و کسانی که کد را تأیید می‌کنند، نتایج را تأیید می‌کنند، متغیرهای مدل و خروجی مدل را آزمایش می‌کنند
  • معیارهای موفقیت خاص برای مدل و بخش‌های خاص مشتری
  • دوی سرعت تحلیلی خاص، وظایف، و دانشمندان اختصاص داده شده، و بررسی‌ها/تصویب‌های رسمی سرعت در مورد الزامات انجام شده است.

همانطور که می بینید، ATD مجموعه ای از الزامات را ارائه می دهد که بسیار خاص هستند. این تیم شامل مدیر مدل‌سازی مستقیم، گروهی از دانشمندان داده‌ای است که به پروژه اختصاص داده شده‌اند و من به عنوان مالک فرآیند توسعه مدل چابک. همه اعضای تیم پس از مذاکره درباره نقش ها، مسئولیت ها، جدول زمانی و الزامات ساخت، ATD را به عنوان یک قرارداد امضا می کنند. ATD به سندی تبدیل می شود که به وسیله آن کل فرآیند توسعه مدل چابک را تعریف می کنیم. سپس به مجموعه‌ای از نیازمندی‌ها، نقش‌ها و وظایف تقسیم می‌شود که روی بلاک چین قرار می‌گیرد تا به طور رسمی تخصیص داده شود، کار شود، اعتبارسنجی شود و تکمیل شود.

با داشتن افرادی که بر اساس هر یک از الزامات ردیابی می‌شوند، تیم سپس مجموعه‌ای از وثیقه‌های موجود را ارزیابی می‌کند که معمولاً قطعاتی از کدها و مدل‌های متغیر معتبر قبلی هستند. برخی از متغیرها در گذشته تایید شده اند، برخی دیگر تعدیل خواهند شد و برخی دیگر جدید خواهند بود. سپس زنجیره بلوکی هر بار که از متغیر در این مدل استفاده می‌شود، ثبت می‌کند – برای مثال، هر کدی که از فروشگاه‌های کد گرفته شده، جدید نوشته شده است و تغییراتی که ایجاد شده است، چه کسی این کار را انجام داده است، چه آزمایش‌هایی انجام شده است، کدام مدیر مدل‌سازی آن را تایید کرده است. و امضای من

یک بلاک چین ردیابی دانه ای را فعال می کند

نکته مهم این است که بلاک چین مسیری از تصمیم گیری را به نمایش می گذارد. نشان می دهد که آیا یک متغیر قابل قبول است، آیا سوگیری را وارد مدل می کند یا اینکه آیا متغیر به درستی استفاده می شود. بلاک چین فقط یک چک لیست از نتایج مثبت نیست، بلکه ضبطی از سفر ساخت این مدل‌ها است – اشتباهات، اصلاحات و پیشرفت‌ها همگی ثبت می‌شوند. به عنوان مثال، نتایجی مانند آزمایش‌های ناموفق هوش مصنوعی اخلاقی در زنجیره بلاک ادامه می‌یابد، همانطور که مراحل اصلاحی که برای حذف سوگیری استفاده می‌شود، ادامه دارد. ما می‌توانیم سفر را در سطح بسیار دقیق ببینیم:

  • تکه های مدل
  • روش عملکرد مدل
  • روشی که مدل به داده های مورد انتظار پاسخ می دهد، داده های بد را رد می کند یا به یک محیط در حال تغییر شبیه سازی شده پاسخ می دهد

همه این موارد با توجه به اینکه چه کسی روی مدل کار کرده و چه کسی هر اقدام را تایید کرده است، کدگذاری شده است. به عنوان مثال، در پایان پروژه می‌توانیم ببینیم که هر یک از متغیرهای موجود در این مدل حیاتی بررسی شده، روی بلاک چین قرار گرفته و تأیید شده است.

این رویکرد سطح بالایی از اطمینان را فراهم می کند که هیچ کس متغیری را به مدل اضافه نکرده است که عملکرد ضعیفی داشته باشد یا نوعی سوگیری را در مدل وارد کند. این تضمین می کند که هیچ کس از یک فیلد نادرست در مشخصات داده های خود استفاده نکرده است یا متغیرهای معتبر را بدون مجوز و اعتبار تغییر داده است. بدون فرآیند بررسی انتقادی ارائه شده توسط ATD (و اکنون بلاک چین) برای بازرسی سازمان علم داده من، دانشمندان داده من می توانند ناخواسته مدلی با خطا معرفی کنند، به خصوص که این مدل ها و الگوریتم های مرتبط پیچیده تر و پیچیده تر می شوند.

سفرهای توسعه مدل که شفاف هستند منجر به سوگیری کمتری می شود

در مجموع، پوشاندن فرآیند توسعه مدل در بلاک چین به مدل تحلیلی ماهیت، زندگی، ساختار و توضیحات خاص خود را می‌دهد. توسعه مدل به یک فرآیند ساختاریافته تبدیل می‌شود که در پایان آن می‌توان مستندات دقیقی تهیه کرد تا اطمینان حاصل شود که همه عناصر از طریق بررسی مناسب انجام شده‌اند. این عناصر همچنین می توانند در هر زمانی در آینده مورد بازبینی قرار گیرند و دارایی های ضروری را برای استفاده در حکمرانی مدل فراهم کنند. بسیاری از این دارایی‌ها زمانی که مدل در نهایت مورد استفاده قرار می‌گیرد، در مقابل نیاز به کشف یا تخصیص پس از توسعه، بخشی از الزامات مشاهده و نظارت می‌شوند.

به این ترتیب، توسعه و تصمیم‌گیری مدل تحلیلی قابل ممیزی می‌شود، عاملی حیاتی در ایجاد فناوری هوش مصنوعی، و دانشمندان داده‌ای که آن را طراحی می‌کنند، پاسخگو – گامی اساسی در ریشه‌کن کردن سوگیری از مدل‌های تحلیلی مورد استفاده برای تصمیم‌گیری‌هایی که بر روی افراد تأثیر می‌گذارد. زندگی می کند.

اسکات زولدی، مدیر ارشد تجزیه و تحلیل در FICO مسئول توسعه تحلیلی محصول و فناوری FICO است. راه حل ها اسکات در زمان حضور در FICO مسئول تالیف بیش از ۱۱۰ پتنت تحلیلی بوده است که ۷۱ مورد اعطا شده و ۴۶ مورد در حال بررسی است. اسکات به طور فعال در توسعه محصولات تحلیلی جدید و برنامه های کاربردی تجزیه و تحلیل کلان داده شرکت دارد، که بسیاری از آنها از نوآوری های تحلیلی جریانی جدید مانند تجزیه و تحلیل تطبیقی، پروفایل مشارکتی و تجزیه و تحلیل خود کالیبره استفاده می کنند. اسکات اخیراً بر روی کاربردهای جریان تجزیه و تحلیل خودآموز برای تشخیص حملات امنیت سایبری در زمان واقعی متمرکز شده است. اسکات در دو هیئت مدیره، Software San Diego و Cyber ​​Center of Excellence خدمت می کند. اسکات دکترای خود را در فیزیک نظری و محاسباتی از دانشگاه دوک گرفته است.

New Tech Forum مکانی برای کاوش و بحث در مورد فناوری سازمانی نوظهور در عمق و وسعت بی سابقه ای فراهم می کند. انتخاب ذهنی است، بر اساس انتخاب ما از فناوری هایی که معتقدیم مهم هستند و برای خوانندگان InfoWorld بیشترین علاقه را دارند. InfoWorld وثیقه بازاریابی را برای انتشار نمی پذیرد و حق ویرایش تمام محتوای ارائه شده را برای خود محفوظ می دارد. همه سوالات را به newtechforum@infoworld.com ارسال کنید.