ثبت فرآیند توسعه مدل در بلاک چین میتواند آن فرآیند را ساختارمندتر، شفافتر و تکرارپذیرتر کند و در نتیجه سوگیری کمتر و مسئولیتپذیری بیشتری را به همراه داشته باشد.
چند سال گذشته در مورد هوش مصنوعی (AI) دست و پا زدن و تکان دادن دستها را به همراه داشته است، زیرا افراد تجاری و فنآوران به طور یکسان نگران قدرت تصمیمگیری بزرگی هستند که معتقدند این سیستمها دارند.
به عنوان یک دانشمند داده، من عادت دارم که در مورد امکانات و محدودیت های هوش مصنوعی صدای عقل باشم. در این مقاله توضیح میدهم که چگونه شرکتها میتوانند از فناوری بلاک چین برای حاکمیت توسعه مدل استفاده کنند، پیشرفتی برای درک بهتر هوش مصنوعی، فرآیند توسعه مدل قابل حسابرسی، و شناسایی و تعیین مسئولیت برای تصمیمگیری هوش مصنوعی.
استفاده از بلاک چین برای حاکمیت توسعه مدل
در حالی که آگاهی گسترده ای در مورد نیاز به کنترل هوش مصنوعی وجود دارد، بحث در مورد چگونگی انجام این کار اغلب مبهم است، مانند “چگونه مسئولیت پذیری را در هوش مصنوعی خود ایجاد کنیم” در بازبینی کسب و کار هاروارد:
ساختارهای حاکمیتی را ارزیابی کنید. یک اکوسیستم سالم برای مدیریت هوش مصنوعی باید شامل فرآیندها و ساختارهای حاکمیتی باشد… مسئولیتپذیری برای هوش مصنوعی به معنای جستجوی شواهد محکمی از حکمرانی در سطح سازمانی است، از جمله اهداف و مقاصد روشن. برای سیستم هوش مصنوعی؛ نقش ها، مسئولیت ها و خطوط اختیارات به خوبی تعریف شده نیروی کار چند رشته ای که قادر به مدیریت سیستم های هوش مصنوعی است. مجموعه گسترده ای از سهامداران؛ و فرآیندهای مدیریت ریسک علاوه بر این، جستجوی عناصر حاکمیتی در سطح سیستم، مانند مشخصات فنی مستند سیستم هوش مصنوعی خاص، انطباق، و دسترسی سهامداران به اطلاعات طراحی و عملیات سیستم، حیاتی است.
این فهرست جامع از الزامات کافی است تا چشم هر خواننده ای را خیره کند. یک سازمان دقیقاً چگونه به دنبال «عناصر حاکمیت در سطح سیستم» و «دسترسی ذینفعان به اطلاعات طراحی و عملیات سیستم» است؟
در اینجا توصیههای عملی و واقعی وجود دارد: از فناوری بلاکچین استفاده کنید تا اطمینان حاصل کنید که تمام تصمیمات اتخاذ شده در مورد یک مدل هوش مصنوعی یا یادگیری ماشین ثبت شده و قابل بازرسی هستند. (افشای کامل: در سال ۲۰۱۸ یک درخواست ثبت اختراع ایالات متحده [۱۶/۱۲۸,۳۵۹ ایالات متحده] در مورد استفاده از بلاک چین برای حاکمیت توسعه مدل ثبت کردم.)
چگونه بلاک چین قابلیت حسابرسی ایجاد می کند
توسعه یک مدل تصمیمگیری هوش مصنوعی فرآیند پیچیدهای است که شامل تصمیمات افزایشی بیشماری است – متغیرهای مدل، طراحی مدل، دادههای آموزشی و آزمایشی مورد استفاده، انتخاب ویژگیها و غیره. همه این تصمیمات را می توان در زنجیره بلوکی ثبت کرد، که همچنین می تواند امکان مشاهده ویژگی های پنهان. همچنین میتوانید تمام دانشمندانی را که بخشهای مختلفی از مجموعههای متغیر را ساختهاند و در ایجاد وزن مدل و آزمایش مدل شرکت کردهاند، در بلاک چین ثبت کنید.
حاکمیت مدل و شفافیت در ایجاد فناوری هوش مصنوعی اخلاقی که قابل ممیزی است ضروری است. همانطور که توسط فناوری بلاک چین امکان پذیر است، مجموع و کل رکورد این تصمیمات دید لازم را برای کنترل موثر مدل ها در داخل، نسبت دادن مسئولیت پذیری و برآوردن رگولاتورهایی که قطعاً می آیند برای هوش مصنوعی شما.
قبل از بلاک چین: مدل های تحلیلی در حال حرکت هستند
قبل از اینکه بلاک چین به یک کلمه کلیدی تبدیل شود، من شروع به پیاده سازی یک رویکرد مدیریت مدل تحلیلی مشابه در سازمان علم داده خود کردم. در سال ۲۰۱۰ یک فرآیند توسعه را با محوریت سند ردیابی تحلیلی (ATD) ایجاد کردم. این رویکرد به جزئیات طراحی مدل، مجموعههای متغیر، دانشمندان اختصاص داده شده، آموزش و آزمایش دادهها و معیارهای موفقیت میپردازد، و کل فرآیند توسعه را به سه یا چند سرعت چابک تقسیم میکند.
من تشخیص دادم که یک رویکرد ساختاریافته با ATD ضروری است، زیرا نتایج منفی بسیار زیادی از آنچه در بسیاری از صنعت مالی به هنجار تبدیل شده بود دیدهام: فقدان اعتبار و پاسخگویی. با استفاده از بانکداری به عنوان مثال، یک دهه پیش طول عمر معمول یک مدل تحلیلی به این صورت بود:
- یک دانشمند داده یک مدل می سازد و متغیرهایی را که در آن موجود است انتخاب می کند. این امر منجر به ایجاد متغیرهای اضافی توسط دانشمندان، عدم استفاده از طراحی متغیر معتبر و ایجاد خطاهای جدید در کد مدل شد. در بدترین موارد، یک دانشمند داده ممکن است با متغیرهایی تصمیم گیری کند که می تواند سوگیری، حساسیت مدل یا نشت هدف را معرفی کند.
- وقتی همان دانشمند داده سازمان را ترک میکند، دایرکتوریهای توسعه او معمولاً یا حذف میشوند یا اگر تعدادی دایرکتوری مختلف وجود داشته باشد، مشخص نمیشود که کدام دایرکتوریها مسئول مدل نهایی هستند. بانک اغلب کد منبع مدل را ندارد یا ممکن است فقط قطعاتی از آن داشته باشد. فقط با نگاه کردن به کد، هیچ کس به طور قطعی متوجه نمی شود که مدل چگونه ساخته شده است، داده هایی که بر اساس آن ساخته شده است، و مفروضاتی که در ساخت مدل نقش داشته اند.
- در نهایت بانک می تواند با این فرض که مدل به درستی ساخته شده است در موقعیت پرریسکی قرار گیرد و رفتار خوبی از خود نشان دهد – اما واقعاً نمی داند. بانک قادر به تایید مدل یا درک این موضوع نیست که در چه شرایطی مدل غیرقابل اعتماد یا غیرقابل اعتماد خواهد بود. این واقعیتها منجر به ریسک غیرضروری یا دور انداختن و بازسازی تعداد زیادی از مدلها میشوند که اغلب سفر بالا را تکرار میکنند.
یک بلاک چین برای تدوین پاسخگویی
اختراع در انتظار ثبت اختراع من شرح میدهد که چگونه میتوان توسعه مدل تحلیلی و یادگیری ماشینی را با استفاده از فناوری بلاک چین برای مرتبط کردن زنجیرهای از موجودیتها، وظایف کاری و الزامات با یک مدل، از جمله آزمایشها و بررسیهای اعتبارسنجی، تدوین کرد. این بیشتر رویکرد تاریخی را که من برای ساختن مدلها در سازمانم استفاده کردم تکرار میکند – ATD اساساً یک قرارداد بین دانشمندان، مدیران و من است که شرح میدهد:
- مدل چیست
- اهداف مدل
- چگونه آن مدل را میسازیم، از جمله الگوریتم یادگیری ماشین تجویز شده
- زمینه هایی که مدل باید بر اساس آنها بهبود یابد، به عنوان مثال، بهبود ۳۰ درصدی در کارت موجود نیست (CNP) کلاهبرداری از کارت اعتباری در سطح تراکنش
- درجات آزادی که دانشمندان برای حل مشکل دارند، و آنهایی که ندارند
- استفاده مجدد از متغیرهای معتبر و معتبر و کد مدل snip-it
- الزامات داده های آموزش و آزمون
- هوش مصنوعی اخلاقی
- آزمایشهای استحکام و پایداری
- چک لیست های آزمایش مدل خاص و اعتبارسنجی مدل
- دانشمندان تحلیلی اختصاص داده شده برای انتخاب متغیرها، ساخت مدلها و آموزش آنها و کسانی که کد را تأیید میکنند، نتایج را تأیید میکنند، متغیرهای مدل و خروجی مدل را آزمایش میکنند
- معیارهای موفقیت خاص برای مدل و بخشهای خاص مشتری
- دوی سرعت تحلیلی خاص، وظایف، و دانشمندان اختصاص داده شده، و بررسیها/تصویبهای رسمی سرعت در مورد الزامات انجام شده است.
روشها و آزمونهای
همانطور که می بینید، ATD مجموعه ای از الزامات را ارائه می دهد که بسیار خاص هستند. این تیم شامل مدیر مدلسازی مستقیم، گروهی از دانشمندان دادهای است که به پروژه اختصاص داده شدهاند و من به عنوان مالک فرآیند توسعه مدل چابک. همه اعضای تیم پس از مذاکره درباره نقش ها، مسئولیت ها، جدول زمانی و الزامات ساخت، ATD را به عنوان یک قرارداد امضا می کنند. ATD به سندی تبدیل می شود که به وسیله آن کل فرآیند توسعه مدل چابک را تعریف می کنیم. سپس به مجموعهای از نیازمندیها، نقشها و وظایف تقسیم میشود که روی بلاک چین قرار میگیرد تا به طور رسمی تخصیص داده شود، کار شود، اعتبارسنجی شود و تکمیل شود.
با داشتن افرادی که بر اساس هر یک از الزامات ردیابی میشوند، تیم سپس مجموعهای از وثیقههای موجود را ارزیابی میکند که معمولاً قطعاتی از کدها و مدلهای متغیر معتبر قبلی هستند. برخی از متغیرها در گذشته تایید شده اند، برخی دیگر تعدیل خواهند شد و برخی دیگر جدید خواهند بود. سپس زنجیره بلوکی هر بار که از متغیر در این مدل استفاده میشود، ثبت میکند – برای مثال، هر کدی که از فروشگاههای کد گرفته شده، جدید نوشته شده است و تغییراتی که ایجاد شده است، چه کسی این کار را انجام داده است، چه آزمایشهایی انجام شده است، کدام مدیر مدلسازی آن را تایید کرده است. و امضای من
یک بلاک چین ردیابی دانه ای را فعال می کند
نکته مهم این است که بلاک چین مسیری از تصمیم گیری را به نمایش می گذارد. نشان می دهد که آیا یک متغیر قابل قبول است، آیا سوگیری را وارد مدل می کند یا اینکه آیا متغیر به درستی استفاده می شود. بلاک چین فقط یک چک لیست از نتایج مثبت نیست، بلکه ضبطی از سفر ساخت این مدلها است – اشتباهات، اصلاحات و پیشرفتها همگی ثبت میشوند. به عنوان مثال، نتایجی مانند آزمایشهای ناموفق هوش مصنوعی اخلاقی در زنجیره بلاک ادامه مییابد، همانطور که مراحل اصلاحی که برای حذف سوگیری استفاده میشود، ادامه دارد. ما میتوانیم سفر را در سطح بسیار دقیق ببینیم:
- تکه های مدل
- روش عملکرد مدل
- روشی که مدل به داده های مورد انتظار پاسخ می دهد، داده های بد را رد می کند یا به یک محیط در حال تغییر شبیه سازی شده پاسخ می دهد
همه این موارد با توجه به اینکه چه کسی روی مدل کار کرده و چه کسی هر اقدام را تایید کرده است، کدگذاری شده است. به عنوان مثال، در پایان پروژه میتوانیم ببینیم که هر یک از متغیرهای موجود در این مدل حیاتی بررسی شده، روی بلاک چین قرار گرفته و تأیید شده است.
این رویکرد سطح بالایی از اطمینان را فراهم می کند که هیچ کس متغیری را به مدل اضافه نکرده است که عملکرد ضعیفی داشته باشد یا نوعی سوگیری را در مدل وارد کند. این تضمین می کند که هیچ کس از یک فیلد نادرست در مشخصات داده های خود استفاده نکرده است یا متغیرهای معتبر را بدون مجوز و اعتبار تغییر داده است. بدون فرآیند بررسی انتقادی ارائه شده توسط ATD (و اکنون بلاک چین) برای بازرسی سازمان علم داده من، دانشمندان داده من می توانند ناخواسته مدلی با خطا معرفی کنند، به خصوص که این مدل ها و الگوریتم های مرتبط پیچیده تر و پیچیده تر می شوند.
سفرهای توسعه مدل که شفاف هستند منجر به سوگیری کمتری می شود
در مجموع، پوشاندن فرآیند توسعه مدل در بلاک چین به مدل تحلیلی ماهیت، زندگی، ساختار و توضیحات خاص خود را میدهد. توسعه مدل به یک فرآیند ساختاریافته تبدیل میشود که در پایان آن میتوان مستندات دقیقی تهیه کرد تا اطمینان حاصل شود که همه عناصر از طریق بررسی مناسب انجام شدهاند. این عناصر همچنین می توانند در هر زمانی در آینده مورد بازبینی قرار گیرند و دارایی های ضروری را برای استفاده در حکمرانی مدل فراهم کنند. بسیاری از این داراییها زمانی که مدل در نهایت مورد استفاده قرار میگیرد، در مقابل نیاز به کشف یا تخصیص پس از توسعه، بخشی از الزامات مشاهده و نظارت میشوند.
به این ترتیب، توسعه و تصمیمگیری مدل تحلیلی قابل ممیزی میشود، عاملی حیاتی در ایجاد فناوری هوش مصنوعی، و دانشمندان دادهای که آن را طراحی میکنند، پاسخگو – گامی اساسی در ریشهکن کردن سوگیری از مدلهای تحلیلی مورد استفاده برای تصمیمگیریهایی که بر روی افراد تأثیر میگذارد. زندگی می کند.
اسکات زولدی، مدیر ارشد تجزیه و تحلیل در FICO مسئول توسعه تحلیلی محصول و فناوری FICO است. راه حل ها اسکات در زمان حضور در FICO مسئول تالیف بیش از ۱۱۰ پتنت تحلیلی بوده است که ۷۱ مورد اعطا شده و ۴۶ مورد در حال بررسی است. اسکات به طور فعال در توسعه محصولات تحلیلی جدید و برنامه های کاربردی تجزیه و تحلیل کلان داده شرکت دارد، که بسیاری از آنها از نوآوری های تحلیلی جریانی جدید مانند تجزیه و تحلیل تطبیقی، پروفایل مشارکتی و تجزیه و تحلیل خود کالیبره استفاده می کنند. اسکات اخیراً بر روی کاربردهای جریان تجزیه و تحلیل خودآموز برای تشخیص حملات امنیت سایبری در زمان واقعی متمرکز شده است. اسکات در دو هیئت مدیره، Software San Diego و Cyber Center of Excellence خدمت می کند. اسکات دکترای خود را در فیزیک نظری و محاسباتی از دانشگاه دوک گرفته است.
—
New Tech Forum مکانی برای کاوش و بحث در مورد فناوری سازمانی نوظهور در عمق و وسعت بی سابقه ای فراهم می کند. انتخاب ذهنی است، بر اساس انتخاب ما از فناوری هایی که معتقدیم مهم هستند و برای خوانندگان InfoWorld بیشترین علاقه را دارند. InfoWorld وثیقه بازاریابی را برای انتشار نمی پذیرد و حق ویرایش تمام محتوای ارائه شده را برای خود محفوظ می دارد. همه سوالات را به newtechforum@infoworld.com ارسال کنید.
پست های مرتبط
پاسخگو کردن هوش مصنوعی: بلاک چین، حاکمیت و قابلیت حسابرسی
پاسخگو کردن هوش مصنوعی: بلاک چین، حاکمیت و قابلیت حسابرسی
پاسخگو کردن هوش مصنوعی: بلاک چین، حاکمیت و قابلیت حسابرسی