مدل های زبان بزرگ دارای پتانسیل بسیار زیاد، اما همچنین کاستی های عمده هستند. نمودارهای دانش، LLM ها را دقیق تر، شفاف تر و قابل توضیح تر می کند.
موج اولیه هیجان و دلهره پیرامون ChatGPT در حال کاهش است. مشکل این است که کجا از شرکت خارج می شود؟ آیا این یک روند گذرا است که می توان با خیال راحت نادیده گرفت یا ابزار قدرتمندی است که باید از آن استفاده کرد؟ و اگر مورد دوم است، مطمئنترین رویکرد برای پذیرش آن چیست؟
ChatGPT، شکلی از هوش مصنوعی مولد، تنها یک جلوه از مفهوم گستردهتر مدل های زبان بزرگ (LLM). LLMها یک فناوری مهم هستند که میتوانند باقی بمانند، اما راهحلی برای فرآیندهای تجاری شما نیستند. دستیابی به مزایای آنها مستلزم کمی کار از جانب شما است.
این به این دلیل است که، علیرغم پتانسیل بسیار زیاد LLM ها، آنها با طیف وسیعی از چالش ها همراه هستند. این چالشها شامل مسائلی مانند توهم، هزینههای زیاد مرتبط با آموزش و مقیاسبندی، پیچیدگی پرداختن و بهروزرسانی آنها، ناهماهنگی ذاتی آنها، دشواری انجام ممیزی و ارائه توضیحات، و غالب بودن محتوای زبان انگلیسی است.
عوامل دیگری نیز وجود دارد مانند این که LLM ها در استدلال ضعیف هستند و برای پاسخ های صحیح نیاز به تلقین دقیق دارند. همه این مسائل را می توان با پشتیبانی از LLM جدید مبتنی بر پیکره داخلی توسط یک نمودار دانش به حداقل رساند.
نمودارهای قدرت دانش
گراف دانش یک ساختار غنی از اطلاعات است که دیدی از موجودیتها و نحوه ارتباط متقابل آنها ارائه میکند. به عنوان مثال، ریشی سوناک سمت نخست وزیری بریتانیا را بر عهده دارد. ریشی سوناک و بریتانیا یک نهاد هستند، و تصدی پست نخست وزیری نحوه ارتباط آنهاست. ما می توانیم این هویت ها و روابط را به عنوان شبکه ای از حقایق قابل اثبات با نموداری از آنچه می دانیم بیان کنیم.
با ساختن یک نمودار دانش، نه تنها میتوانید الگوهایی مانند «اعضای کابینه ریشی سوناک چه کسانی هستند» را در آن جستجو کنید، بلکه میتوانید با استفاده از الگوریتمهای گراف و علم دادههای گراف روی نمودار محاسبه کنید. با این ابزار اضافی، میتوانید سؤالات پیچیدهای درباره ماهیت کل نمودار میلیاردها عنصر بپرسید، نه فقط یک زیرگراف. اکنون می توانید سؤالاتی مانند “اعضای دولت سوناک که در کابینه نیستند چه کسانی هستند که بیشترین نفوذ را دارند؟” بپرسید؟
بیان این روابط به صورت نمودار می تواند حقایقی را که قبلاً مبهم بوده اند را آشکار کند و به بینش های ارزشمندی منجر شود. حتی میتوانید از این نمودار جاسازیهایی ایجاد کنید (شامل دادهها و ساختار آن) که میتواند در خطوط یادگیری ماشینی یا بهعنوان نقطه ادغام با LLMها استفاده شود.
استفاده از نمودارهای دانش با مدل های زبان بزرگ
اما نمودار دانش تنها نیمی از داستان است. LLM ها نیمه دیگر هستند و ما باید بدانیم که چگونه اینها را با هم کار کنیم. ما شاهد ظهور چهار الگو هستیم:
- از یک LLM برای ایجاد نمودار دانش استفاده کنید.
- از نمودار دانش برای آموزش LLM استفاده کنید.
- از یک نمودار دانش در مسیر تعامل با یک LLM برای غنیسازی پرسشها و پاسخها استفاده کنید.
- از نمودارهای دانش برای ایجاد مدل های بهتر استفاده کنید.
در الگوی اول ما از ویژگیهای پردازش زبان طبیعی LLM برای پردازش مجموعه عظیمی از دادههای متنی (مثلاً از وب یا مجلات) استفاده میکنیم. سپس از LLM (که مات است) می خواهیم که یک نمودار دانش (که شفاف است) تولید کند. نمودار دانش را می توان بررسی کرد، ارزیابی کرد و مدیریت کرد. نکته مهم برای صنایع تحت نظارت مانند داروسازی، نمودار دانش در مورد پاسخهای آن صریح و قطعی است، به گونهای که LLM ها چنین نیستند.
در الگوی دوم برعکس عمل می کنیم. به جای آموزش LLM ها در یک مجموعه کلی بزرگ، ما آنها را منحصراً بر روی نمودار دانش موجود خود آموزش می دهیم. اکنون میتوانیم چتباتهایی بسازیم که در مورد محصولات و خدمات ما بسیار ماهر هستند و بدون توهم پاسخ میدهند.
در الگوی سوم، پیامهایی که به LLM میروند و از آن میروند را رهگیری میکنیم و آنها را با دادههای نمودار دانش خود غنی میکنیم. به عنوان مثال، «پنج فیلم اخیر را با بازیگرانی که دوست دارم به من نشان بده» را نمیتوان به تنهایی توسط LLM پاسخ داد، اما میتواند با کاوش در نمودار دانش فیلم برای فیلمهای محبوب و بازیگران آنها غنیتر شود که سپس میتوان از آن برای غنیسازی دستور داده شده استفاده کرد. به LLM. به طور مشابه، در راه بازگشت از LLM، میتوانیم تعبیههایی را انجام دهیم و آنها را در نمودار دانش حل کنیم تا بینش عمیقتری به تماسگیرنده ارائه کنیم.
الگوی چهارم در مورد ساخت هوش مصنوعی بهتر با نمودارهای دانش است. در اینجا تحقیقات جالب از یجن چوی در دانشگاه واشنگتن بهترین راه را نشان میدهد. در کار تیم او، یک LLM توسط یک هوش مصنوعی ثانویه و کوچکتر به نام “منتقد” غنی می شود. این هوش مصنوعی به دنبال خطاهای استدلالی در پاسخهای LLM میگردد و با انجام این کار یک نمودار دانش برای مصرف پاییندستی توسط فرآیند آموزشی دیگری ایجاد میکند که یک مدل «دانشآموز» ایجاد میکند. در بسیاری از معیارها، مدل دانشجویی کوچکتر و دقیقتر از LLM اصلی است، زیرا هرگز نادرستی واقعی یا پاسخهای متناقض به سؤالات را نمی آموزد.
درک تنوع زیستی زمین با استفاده از نمودارهای دانش
این مهم است که به خود یادآوری کنیم که چرا این کار را با ابزارهای ChatGPT انجام می دهیم. استفاده از هوش مصنوعی مولد می تواند به کارمندان دانش و متخصصان کمک کند تا بدون نیاز به درک و تفسیر زبان پرس و جو یا ساخت API های چند لایه، پرس و جوهای زبان طبیعی را که می خواهند به آنها پاسخ داده شود، اجرا کنند. این پتانسیل افزایش کارایی را دارد و به کارمندان اجازه میدهد زمان و انرژی خود را بر روی وظایف مرتبطتر متمرکز کنند.
Take Basecamp Research، یک شرکت بیوتکنولوژی مستقر در بریتانیا که در حال نقشهبرداری از تنوع زیستی زمین است و تلاش میکند از لحاظ اخلاقی از آوردن راهحلهای جدید از طبیعت به بازار حمایت کند. برای انجام این کار، بزرگترین نمودار دانش تنوع زیستی طبیعی سیاره، BaseGraph را ساخته است که بیش از چهار میلیارد رابطه دارد.
این مجموعه داده پروژههای نوآورانه زیادی را تغذیه میکند. یکی طراحی پروتئین است که در آن تیم از یک مدل زبان بزرگ که توسط یک مدل به سبک ChatGPT برای تولید توالی آنزیمی به نام ZymCtrl استفاده میکند. Basecamp که برای هوش مصنوعی مولد ساخته شده است، اکنون LLM های بیشتری را در کل نمودار دانش خود می پیچد. این شرکت در حال ارتقای BaseGraph به یک نمودار دانش کاملاً تکمیل شده با LLM است، درست همانطور که من توضیح دادم.
قابلیت یافتن، دسترسی و توضیح بیشتر محتوای پیچیده
همانطور که تحقیقات Basecamp پیشگام است، این تنها در کاوش ترکیب نمودار دانش LLM نیست. یک شرکت انرژی جهانی با نام خانوادگی از نمودارهای دانش با ChatGPT در فضای ابری برای مرکز دانش سازمانی خود استفاده می کند. گام بعدی ارائه خدمات شناختی مبتنی بر هوش مصنوعی به هزاران کارمند در بخشهای حقوقی، مهندسی و سایر بخشهای آن است.
برای مثال دیگر، یک ناشر جهانی در حال آماده سازی ابزار هوش مصنوعی مولد آموزش دیده بر روی نمودارهای دانش است که با استفاده از زبان طبیعی خالص، حجم عظیمی از محتوای پیچیده دانشگاهی را برای مشتریان پژوهشی قابل یافتن، در دسترس و قابل توضیح تر می کند.
>
نکته قابل توجه در مورد این پروژه اخیر این است که کاملاً با بحث قبلی ما مطابقت دارد: ترجمه ایده های بسیار پیچیده به زبانی قابل دسترس، شهودی و دنیای واقعی، تعاملات و همکاری ها را امکان پذیر می کند. با انجام این کار، به ما قدرت میدهد تا با چالشهای اساسی با دقت و به روشهایی که مردم به آن اعتماد دارند مقابله کنیم.
بهطور فزایندهای مشخص میشود که با آموزش یک LLM بر روی دادههای سازمانیافته، با کیفیت بالا و ساختار یافته یک نمودار دانش، به طیف وسیعی از چالشهای مرتبط با ChatGPT رسیدگی میشود و جوایزی که از هوش مصنوعی مولد بهدنبال آن هستید آسانتر خواهد بود. . گزارش ژوئن گارتنر، الگوهای طراحی هوش مصنوعی برای نمودارهای دانش و هوش مصنوعی مولد، بر این مفهوم تأکید میکند و تأکید میکند که نمودارهای دانش یک شریک ایدهآل برای یک LLM ارائه میکنند، جایی که سطح بالایی از دقت و صحت الزامی است.
به نظر من ازدواجی است که در بهشت ساخته شده است. شما چطور؟
جیم وبر است دانشمند ارشد پایگاه داده گراف و رهبر تجزیه و تحلیل Neo4j و نویسنده مشترک پایگاههای داده نمودار (نسخه ۱ و ۲، O’Reilly)، پایگاههای اطلاعاتی نمودار برای Dummies (وایلی)، و ساختن نمودارهای دانش (O’Reilly).
—
Generative AI Insights مکانی را برای رهبران فناوری – از جمله فروشندگان و سایر مشارکتکنندگان خارجی – فراهم میکند تا چالشها و فرصتهای هوش مصنوعی مولد را بررسی و بحث کنند. این انتخاب گسترده است، از غواصی عمیق فناوری گرفته تا مطالعات موردی گرفته تا نظرات متخصص، اما همچنین ذهنی است، بر اساس قضاوت ما در مورد اینکه کدام موضوعات و درمانها به بهترین وجه به مخاطبان فنی پیشرفته InfoWorld خدمت میکنند. InfoWorld وثیقه بازاریابی را برای انتشار نمی پذیرد و حق ویرایش تمام محتوای ارائه شده را برای خود محفوظ می دارد. تماس با doug_dineley@foundryco.com a>.
پست های مرتبط
چگونه نمودارهای دانش هوش مصنوعی مولد را بهبود می بخشند
چگونه نمودارهای دانش هوش مصنوعی مولد را بهبود می بخشند
چگونه نمودارهای دانش هوش مصنوعی مولد را بهبود می بخشند