کلید موفقیت هر سازمان بزرگ، حکمرانی مؤثر بر چشم انداز وسیع و توزیع شده از فروشگاه های داده است. هوش مصنوعی می تواند کمک کند.
بیش از هر عامل دیگری، انبوه دادههای قابل دسترسی به افزایش امروزی در پذیرش هوش مصنوعی و قابلیت هوش مصنوعی مولد کمک کرده است. جمعآوری، تمیز کردن، سازماندهی و ایمنسازی آن دادهها برای هوش مصنوعی و یادگیری ماشینی به خودی خود به یک پروژه تبدیل شده است – یک تلاش حاکمیتی که خود ابزارهای هوش مصنوعی نقش مهمی در آن ایفا میکنند. نتیجه می تواند یک پیشرفت عظیم در حاکمیت داده باشد که به نفع کل شرکت است.
پایگاه داده به عنوان مخزن اصلی داده ها باقی می ماند، اما اکوسیستم ابزارهای مدیریت داده مبتنی بر هوش مصنوعی در همه جا وجود دارد، از جمله محصولاتی از استارتاپ هایی که ممکن است فاقد قدرت ماندگار یا تخصص عمیق در پایگاه داده باشند. با گذشت زمان، تعداد فزایندهای از قابلیتهای حاکمیتی احتمالاً با پیشنهادات نرمافزار پایگاه داده و خدمات پایگاه داده ابری ادغام میشوند.
استفاده از هوش مصنوعی برای مدیریت خودکار دادهها بازدهی فوری دارد. هرچه یک سازمان بهتر بر داده های خود نظارت کند، پرسنل MLOps (عملیات یادگیری ماشین) بهتر می توانند از این داده ها برای ساخت برنامه های کاربردی مبتنی بر هوش مصنوعی استفاده کنند. به طور گستردهتر، افزودن هوش مصنوعی به حاکمیت داده تأثیر مثبتی بر تجزیه و تحلیل دادههای هر سازمان، انطباق با مقررات و تلاشهای کیفیت داده دارد.
در اینجا آمده است که چگونه هوش مصنوعی فرآیندهای حاکمیتی را مدرن میکند – و چگونه ابزارهای تقویتشده با هوش مصنوعی میتوانند به اطمینان از موفقیت برنامههای AI/ML و به طور کلی مشاهده دادهها کمک کنند.
فهرست نویسی داده
آیا می دانید داده های شما کجا هستند؟ برای اینکه حکمرانی کار کند، سازمانها به فهرست کاملی از تمام ذخیرههای برجسته داده و درک محتوای آنها نیاز دارند. وظیفه شناسایی، دسترسی، و طبقهبندی دادههای سازمانی سختتر میشود – به لطف تکثیر بیرویه فروشگاههای داده ابری، بدون ذکر گزارشهای نیمه ساختاریافته که برای شناسایی روندها و ناهنجاریهای عملیاتی استفاده میشوند. نرم افزار فهرست نویسی داده ها همه آن مخازن را روی نقشه قرار می دهد.
هوش مصنوعی میتواند در هر مرحله از فهرستنویسی دادههای سازمان، از کشف خودکار هر ذخیرهگاه داده مرتبط با سازمان، کمک کند. دامنه ابزارهای فهرست نویسی متفاوت است، اما برخی از هوش مصنوعی برای سازماندهی سیاست های کنترل دسترسی و/یا فعال کردن جستجوی زبان طبیعی در بافت داده سازمان استفاده می کنند. فهرستنویسی مبتنی بر هوش مصنوعی کار دستی مرتبط با طبقهبندی داراییهای داده را به شدت کاهش میدهد و دودمان دادهها را نشان میدهد که نشان میدهد دادهها از کجا منشأ گرفتهاند و چگونه تغییر کردهاند.
مدیریت فراداده
مدیریت موثر ابرداده ها – یعنی مدیریت اطلاعاتی که داده های شرکت شما را توصیف می کند – برای حکمرانی موفق ضروری است. ابزارهای فهرستنویسی هوش مصنوعی میتوانند ابردادهها را برای دستهبندی مناسب داراییهای داده شناسایی کنند، اما نظارت بر دادهها نیز برای یک داده سالم حیاتی است. بنابراین طیف گستردهای از پیشنهادات از نرمافزار یکپارچهسازی داده تا پلتفرمهای مشاهدهپذیری داده، اکنون قابلیتهای مدیریت ابرداده را ارائه میدهند.
ابزارهای مدیریت فراداده با هوش مصنوعی کسالت طبقهبندی دستی دادهها را کاهش میدهند و به آشتی دادن تفاوتها در توضیحات فراداده کمک میکنند. در گذشته، شرکتها طوری رفتار میکردند که گویی ابردادهها نسبتاً ایستا هستند، اما امروزه ابزارهای هوش مصنوعی میتوانند به طور مداوم ابردادههای پویا در ذخیرهسازی، استفاده و جریان داده را نظارت و جمعآوری کنند. در میان سایر مزایا، ابرداده عمیق پیرامون داراییهای داده میتواند برای توصیههای هوش مصنوعی پلتفرمهای ذخیرهسازی بهینه یا حتی برای پیشنهاد خطوط لوله یکپارچهسازی دادههای بالقوه استفاده شود.
کیفیت داده
بیشترین تأثیر هوش مصنوعی بر حاکمیت داده در کیفیت داده بوده است که دارای شش بعد است: دقت، کامل بودن، سازگاری، منحصر به فرد بودن، به موقع بودن و اعتبار. بدیهی است که دادههایی که فاقد این ویژگیها هستند میتوانند برای عملیات فاجعهبار باشند. ناگفته نماند که دانشمندان و تحلیلگران داده به طور معمول قبل از اینکه بتوانند از داده ها استفاده کنند، در تمیز کردن داده ها تا سر حد خود می یابند.
ابزارهای AI/ML میتوانند بهطور خودکار مقادیر گمشده را استنتاج کنند، قالبهای داده را عادی کنند، ناهنجاریهای داده را پرچمگذاری کنند، و موارد دیگر. انسان ها هنوز نیاز به قضاوت دارند (آیا دو مشتری با نام های یکسان یکسان هستند یا متفاوت؟) اما صرفه جویی در زمان کلی می تواند بسیار زیاد باشد. همانطور که ابزارهای هوش مصنوعی از الگوهای موجود در مقادیر زیادی داده یاد می گیرند، توصیه ها، همبستگی ها و اصلاحات آنها به طور پیوسته بهبود می یابد. این خط پایه می تواند برای نظارت بر کیفیت داده ها در زمان واقعی استفاده شود.
مدل سازی داده
ساختار یک پایگاه داده – یا کل معماری داده – با جمع آوری و تجزیه و تحلیل داده های مورد نیاز و توسعه مدل های منطقی و فیزیکی برای تطبیق با آنها شروع می شود. چندین محصول ارائه شده از هوش مصنوعی استفاده می کنند تا معماران و مهندسان داده را قادر می سازند تا به راحتی نمایش های بصری مدل های داده را تولید کنند.
امروزه، در بسیاری از شرکتها، مدلسازی دادهها برای خدمت به برنامههای کاربردی AI/ML فعال است. تعدادی از ابزارهای داده هوش مصنوعی مهندسی ویژگی های خودکار را ارائه می دهند، که در آن ویژگی های کلیدی داده از مجموعه داده ها در آماده سازی برای آموزش هوش مصنوعی مشتق می شوند. در ارتباط با AutoML (یادگیری ماشین خودکار)، این فعالیت به نوبه خود از نوع متفاوتی از انتخاب مدل پشتیبانی میکند: انتخاب مدل ML مناسب برای تقویت یک برنامه کاربردی یا تجزیه و تحلیل پیشبینیکننده سوخت. اگر دادههای کمی برای آموزش صحیح یک مدل وجود داشته باشد، ابزارهای شبیهسازی دادههای مبتنی بر هوش مصنوعی میتوانند ذخیرهسازی دادههای موجود را افزایش دهند و دادههای مصنوعی تولید کنند که بسیار شبیه به چیز واقعی است.
سیاست داده و مدیریت چرخه عمر
هر سازمانی باید سیاستهایی را در مورد مدیریت دادههای خود ایجاد کند – که براساس قوانین فدرال، ایالتی، صنعتی و بینالمللی و همچنین قوانین داخلی کسبوکار است. در شرکتهای بزرگتر، یک کمیته حاکمیت داده این سیاستها را تنظیم میکند و نحوه پیروی از آنها را در یک سند زنده که با تغییر مقررات و رویهها تکامل مییابد، مشخص میکند. قابلیتهای زبان طبیعی هوش مصنوعی مولد میتواند پیشنویسهای اولیه آن اسناد را بیرون بیاورد و تغییرات بعدی را بسیار سختتر کند.
با تجزیه و تحلیل الگوهای استفاده از داده، الزامات قانونی، و گردشهای کاری داخلی، هوش مصنوعی میتواند به سازمانها در تعریف و اجرای سیاستهای حفظ دادهها کمک کند و بهطور خودکار دادههایی را که به پایان عمر مفید خود رسیدهاند شناسایی کنند. هوش مصنوعی حتی می تواند فرآیند بایگانی یا حذف را آغاز کند. بایگانی خودکار دادهها، همراه با کاهش ریسک و اطمینان از انطباق، به آزادسازی فضای ذخیرهسازی و کاهش هزینههای ذخیرهسازی کمک میکند.
در دسترس بودن داده
سیستمهای بازیابی فاجعه مبتنی بر هوش مصنوعی میتوانند با پیشبینی سناریوهای خرابی احتمالی و ایجاد اقدامات پیشگیرانه برای به حداقل رساندن خرابی و از دست دادن دادهها، به سازمانها کمک کنند تا استراتژیهای بازیابی صحیح را توسعه دهند. سیستمهای پشتیبانگیری حاوی هوش مصنوعی میتوانند از یکپارچگی نسخههای پشتیبان اطمینان حاصل کنند و در هنگام وقوع فاجعه، بهطور خودکار مراحل بازیابی را برای بازیابی دادههای از دست رفته یا خراب آغاز کنند.
سیستمهای مدیریت فضای ذخیرهسازی با هوش مصنوعی میتوانند دادهها را در چندین مکان ذخیرهسازی تکرار و توزیع کنند تا از در دسترس بودن بالا و تأخیر کم اطمینان حاصل شود. در همان زمان، تجزیه و تحلیل پیشبینیکننده مبتنی بر هوش مصنوعی میتواند دادهها را از حسگرها، گزارشهای تجهیزات و سوابق تعمیر و نگهداری برای پیشبینی خرابیها یا خرابیهای احتمالی دریافت کند. در وهله اول هیچ چیز بهتر از تعمیر و نگهداری پیش بینی نشده که از دست دادن دسترسی به داده ها جلوگیری کند.
انسانها هنوز نیاز دارند
حجم بسیار کمی از دادهها برای هوش مصنوعی میوه کم ارزشی است. بسیاری از وظایف مرتبط با حکمرانی، از کشف دادهها گرفته تا پاکسازی دادهها تا مدیریت خطمشی، مملو از کارهای دستی تکراری است که هوش مصنوعی میتواند به راحتی از عهده آنها برآید – و با دقتی بیشتر از انسانها انجام شود. این یک پیروزی بزرگ است، به خصوص که MLOps به دنبال ذخیرهسازی دادههای تمیز و سازمانیافته است که برنامههای کاربردی هوش مصنوعی را میتوان بر اساس آنها ساخته و آموزش داد.
به خاطر داشته باشید که هوش مصنوعی به هیچ معنای معنی دار کلمه هوشمند نیست. حتی حل کردن اختلافات جزئی دادهها ممکن است مستلزم زمینهای باشد که از تجربیات گستردهای که فقط انسانها میتوانند به دست آورند و هضم کنند، نیاز داشته باشد. هیچ کس، مثلاً، ایجاد یک معماری داده سازمانی را به یک ماشین واگذار نمی کند. بله، هوش مصنوعی در حال حاضر بخش بزرگی از کار دستی را از مدیریت داده حذف می کند. اما این فکر را برای شما انجام نمی دهد.
Jozef de Vries مدیر ارشد مهندسی محصول در EDB است.
—
Generative AI Insights مکانی را برای رهبران فناوری – از جمله فروشندگان و سایر مشارکتکنندگان خارجی – فراهم میکند تا چالشها و فرصتهای هوش مصنوعی مولد را بررسی و بحث کنند. این انتخاب گسترده است، از غواصی عمیق فناوری گرفته تا مطالعات موردی گرفته تا نظرات متخصص، اما همچنین ذهنی است، بر اساس قضاوت ما در مورد اینکه کدام موضوعات و درمان ها به بهترین وجه به مخاطبان فنی پیشرفته InfoWorld خدمت می کنند. InfoWorld وثیقه بازاریابی را برای انتشار نمی پذیرد و حق ویرایش تمام محتوای ارائه شده را برای خود محفوظ می دارد. تماس با doug_dineley@foundryco.com a>.
پست های مرتبط
چگونه هوش مصنوعی بر حاکمیت داده ها تأثیر می گذارد
چگونه هوش مصنوعی بر حاکمیت داده ها تأثیر می گذارد
چگونه هوش مصنوعی بر حاکمیت داده ها تأثیر می گذارد