۲۹ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

چگونه نمودارهای دانش هوش مصنوعی مولد را بهبود می بخشند

مدل های زبان بزرگ دارای پتانسیل بسیار زیاد، اما همچنین کاستی های عمده هستند. نمودارهای دانش، LLM ها را دقیق تر، شفاف تر و قابل توضیح تر می کند.

مدل های زبان بزرگ دارای پتانسیل بسیار زیاد، اما همچنین کاستی های عمده هستند. نمودارهای دانش، LLM ها را دقیق تر، شفاف تر و قابل توضیح تر می کند.

موج اولیه هیجان و دلهره پیرامون ChatGPT در حال کاهش است. مشکل این است که کجا از شرکت خارج می شود؟ آیا این یک روند گذرا است که می توان با خیال راحت نادیده گرفت یا ابزار قدرتمندی است که باید از آن استفاده کرد؟ و اگر مورد دوم است، مطمئن‌ترین رویکرد برای پذیرش آن چیست؟

ChatGPT، شکلی از هوش مصنوعی مولد، تنها یک جلوه از مفهوم گسترده‌تر مدل های زبان بزرگ (LLM). LLMها یک فناوری مهم هستند که می‌توانند باقی بمانند، اما راه‌حلی برای فرآیندهای تجاری شما نیستند. دستیابی به مزایای آنها مستلزم کمی کار از جانب شما است.

این به این دلیل است که، علیرغم پتانسیل بسیار زیاد LLM ها، آنها با طیف وسیعی از چالش ها همراه هستند. این چالش‌ها شامل مسائلی مانند توهم، هزینه‌های زیاد مرتبط با آموزش و مقیاس‌بندی، پیچیدگی پرداختن و به‌روزرسانی آن‌ها، ناهماهنگی ذاتی آن‌ها، دشواری انجام ممیزی و ارائه توضیحات، و غالب بودن محتوای زبان انگلیسی است.

عوامل دیگری نیز وجود دارد مانند این که LLM ها در استدلال ضعیف هستند و برای پاسخ های صحیح نیاز به تلقین دقیق دارند. همه این مسائل را می توان با پشتیبانی از LLM جدید مبتنی بر پیکره داخلی توسط یک نمودار دانش به حداقل رساند.

نمودارهای قدرت دانش

گراف دانش یک ساختار غنی از اطلاعات است که دیدی از موجودیت‌ها و نحوه ارتباط متقابل آنها ارائه می‌کند. به عنوان مثال، ریشی سوناک سمت نخست وزیری بریتانیا را بر عهده دارد. ریشی سوناک و بریتانیا یک نهاد هستند، و تصدی پست نخست وزیری نحوه ارتباط آنهاست. ما می توانیم این هویت ها و روابط را به عنوان شبکه ای از حقایق قابل اثبات با نموداری از آنچه می دانیم بیان کنیم.

با ساختن یک نمودار دانش، نه تنها می‌توانید الگوهایی مانند «اعضای کابینه ریشی سوناک چه کسانی هستند» را در آن جستجو کنید، بلکه می‌توانید با استفاده از الگوریتم‌های گراف و علم داده‌های گراف روی نمودار محاسبه کنید. با این ابزار اضافی، می‌توانید سؤالات پیچیده‌ای درباره ماهیت کل نمودار میلیاردها عنصر بپرسید، نه فقط یک زیرگراف. اکنون می توانید سؤالاتی مانند “اعضای دولت سوناک که در کابینه نیستند چه کسانی هستند که بیشترین نفوذ را دارند؟” بپرسید؟

جستجوی برداری چیست؟ جستجوی بهتر از طریق هوش مصنوعی

بیان این روابط به صورت نمودار می تواند حقایقی را که قبلاً مبهم بوده اند را آشکار کند و به بینش های ارزشمندی منجر شود. حتی می‌توانید از این نمودار جاسازی‌هایی ایجاد کنید (شامل داده‌ها و ساختار آن) که می‌تواند در خطوط یادگیری ماشینی یا به‌عنوان نقطه ادغام با LLM‌ها استفاده شود.

استفاده از نمودارهای دانش با مدل های زبان بزرگ

اما نمودار دانش تنها نیمی از داستان است. LLM ها نیمه دیگر هستند و ما باید بدانیم که چگونه اینها را با هم کار کنیم. ما شاهد ظهور چهار الگو هستیم:

  1. از یک LLM برای ایجاد نمودار دانش استفاده کنید.
  2. از نمودار دانش برای آموزش LLM استفاده کنید.
  3. از یک نمودار دانش در مسیر تعامل با یک LLM برای غنی‌سازی پرسش‌ها و پاسخ‌ها استفاده کنید.
  4. از نمودارهای دانش برای ایجاد مدل های بهتر استفاده کنید.

در الگوی اول ما از ویژگی‌های پردازش زبان طبیعی LLM برای پردازش مجموعه عظیمی از داده‌های متنی (مثلاً از وب یا مجلات) استفاده می‌کنیم. سپس از LLM (که مات است) می خواهیم که یک نمودار دانش (که شفاف است) تولید کند. نمودار دانش را می توان بررسی کرد، ارزیابی کرد و مدیریت کرد. نکته مهم برای صنایع تحت نظارت مانند داروسازی، نمودار دانش در مورد پاسخ‌های آن صریح و قطعی است، به گونه‌ای که LLM ها چنین نیستند.

در الگوی دوم برعکس عمل می کنیم. به جای آموزش LLM ها در یک مجموعه کلی بزرگ، ما آنها را منحصراً بر روی نمودار دانش موجود خود آموزش می دهیم. اکنون می‌توانیم چت‌بات‌هایی بسازیم که در مورد محصولات و خدمات ما بسیار ماهر هستند و بدون توهم پاسخ می‌دهند.

در الگوی سوم، پیام‌هایی که به LLM می‌روند و از آن می‌روند را رهگیری می‌کنیم و آنها را با داده‌های نمودار دانش خود غنی می‌کنیم. به عنوان مثال، «پنج فیلم اخیر را با بازیگرانی که دوست دارم به من نشان بده» را نمی‌توان به تنهایی توسط LLM پاسخ داد، اما می‌تواند با کاوش در نمودار دانش فیلم برای فیلم‌های محبوب و بازیگران آن‌ها غنی‌تر شود که سپس می‌توان از آن برای غنی‌سازی دستور داده شده استفاده کرد. به LLM. به طور مشابه، در راه بازگشت از LLM، می‌توانیم تعبیه‌هایی را انجام دهیم و آن‌ها را در نمودار دانش حل کنیم تا بینش عمیق‌تری به تماس‌گیرنده ارائه کنیم.

الگوی چهارم در مورد ساخت هوش مصنوعی بهتر با نمودارهای دانش است. در اینجا تحقیقات جالب از یجن چوی در دانشگاه واشنگتن بهترین راه را نشان می‌دهد. در کار تیم او، یک LLM توسط یک هوش مصنوعی ثانویه و کوچکتر به نام “منتقد” غنی می شود. این هوش مصنوعی به دنبال خطاهای استدلالی در پاسخ‌های LLM می‌گردد و با انجام این کار یک نمودار دانش برای مصرف پایین‌دستی توسط فرآیند آموزشی دیگری ایجاد می‌کند که یک مدل «دانش‌آموز» ایجاد می‌کند. در بسیاری از معیارها، مدل دانشجویی کوچکتر و دقیقتر از LLM اصلی است، زیرا هرگز نادرستی واقعی یا پاسخهای متناقض به سؤالات را نمی آموزد.

وب 3.0 نیازی به انقلاب بلاک چین ندارد

درک تنوع زیستی زمین با استفاده از نمودارهای دانش

این مهم است که به خود یادآوری کنیم که چرا این کار را با ابزارهای ChatGPT انجام می دهیم. استفاده از هوش مصنوعی مولد می تواند به کارمندان دانش و متخصصان کمک کند تا بدون نیاز به درک و تفسیر زبان پرس و جو یا ساخت API های چند لایه، پرس و جوهای زبان طبیعی را که می خواهند به آنها پاسخ داده شود، اجرا کنند. این پتانسیل افزایش کارایی را دارد و به کارمندان اجازه می‌دهد زمان و انرژی خود را بر روی وظایف مرتبط‌تر متمرکز کنند.

Take Basecamp Research، یک شرکت بیوتکنولوژی مستقر در بریتانیا که در حال نقشه‌برداری از تنوع زیستی زمین است و تلاش می‌کند از لحاظ اخلاقی از آوردن راه‌حل‌های جدید از طبیعت به بازار حمایت کند. برای انجام این کار، بزرگترین نمودار دانش تنوع زیستی طبیعی سیاره، BaseGraph را ساخته است که بیش از چهار میلیارد رابطه دارد.

این مجموعه داده پروژه‌های نوآورانه زیادی را تغذیه می‌کند. یکی طراحی پروتئین است که در آن تیم از یک مدل زبان بزرگ که توسط یک مدل به سبک ChatGPT برای تولید توالی آنزیمی به نام ZymCtrl استفاده می‌کند. Basecamp که برای هوش مصنوعی مولد ساخته شده است، اکنون LLM های بیشتری را در کل نمودار دانش خود می پیچد. این شرکت در حال ارتقای BaseGraph به یک نمودار دانش کاملاً تکمیل شده با LLM است، درست همانطور که من توضیح دادم.

قابلیت یافتن، دسترسی و توضیح بیشتر محتوای پیچیده

همانطور که تحقیقات Basecamp پیشگام است، این تنها در کاوش ترکیب نمودار دانش LLM نیست. یک شرکت انرژی جهانی با نام خانوادگی از نمودارهای دانش با ChatGPT در فضای ابری برای مرکز دانش سازمانی خود استفاده می کند. گام بعدی ارائه خدمات شناختی مبتنی بر هوش مصنوعی به هزاران کارمند در بخش‌های حقوقی، مهندسی و سایر بخش‌های آن است.

نظرسنجی O’Reilly می گوید سرعت پذیرش هوش مصنوعی مولد بی سابقه است

برای مثال دیگر، یک ناشر جهانی در حال آماده سازی ابزار هوش مصنوعی مولد آموزش دیده بر روی نمودارهای دانش است که با استفاده از زبان طبیعی خالص، حجم عظیمی از محتوای پیچیده دانشگاهی را برای مشتریان پژوهشی قابل یافتن، در دسترس و قابل توضیح تر می کند.

>

نکته قابل توجه در مورد این پروژه اخیر این است که کاملاً با بحث قبلی ما مطابقت دارد: ترجمه ایده های بسیار پیچیده به زبانی قابل دسترس، شهودی و دنیای واقعی، تعاملات و همکاری ها را امکان پذیر می کند. با انجام این کار، به ما قدرت می‌دهد تا با چالش‌های اساسی با دقت و به روش‌هایی که مردم به آن اعتماد دارند مقابله کنیم.

به‌طور فزاینده‌ای مشخص می‌شود که با آموزش یک LLM بر روی داده‌های سازمان‌یافته، با کیفیت بالا و ساختار یافته یک نمودار دانش، به طیف وسیعی از چالش‌های مرتبط با ChatGPT رسیدگی می‌شود و جوایزی که از هوش مصنوعی مولد به‌دنبال آن هستید آسان‌تر خواهد بود. . گزارش ژوئن گارتنر، الگوهای طراحی هوش مصنوعی برای نمودارهای دانش و هوش مصنوعی مولد، بر این مفهوم تأکید می‌کند و تأکید می‌کند که نمودارهای دانش یک شریک ایده‌آل برای یک LLM ارائه می‌کنند، جایی که سطح بالایی از دقت و صحت الزامی است.

به نظر من ازدواجی است که در بهشت ​​ساخته شده است. شما چطور؟

جیم وبر است دانشمند ارشد پایگاه داده گراف و رهبر تجزیه و تحلیل Neo4j و نویسنده مشترک پایگاه‌های داده نمودار (نسخه ۱ و ۲، O’Reilly)، پایگاه‌های اطلاعاتی نمودار برای Dummies (وایلی)، و ساختن نمودارهای دانش (O’Reilly).

Generative AI Insights مکانی را برای رهبران فناوری – از جمله فروشندگان و سایر مشارکت‌کنندگان خارجی – فراهم می‌کند تا چالش‌ها و فرصت‌های هوش مصنوعی مولد را بررسی و بحث کنند. این انتخاب گسترده است، از غواصی عمیق فناوری گرفته تا مطالعات موردی گرفته تا نظرات متخصص، اما همچنین ذهنی است، بر اساس قضاوت ما در مورد اینکه کدام موضوعات و درمان‌ها به بهترین وجه به مخاطبان فنی پیشرفته InfoWorld خدمت می‌کنند. InfoWorld وثیقه بازاریابی را برای انتشار نمی پذیرد و حق ویرایش تمام محتوای ارائه شده را برای خود محفوظ می دارد. تماس با doug_dineley@foundryco.com.