مایکروسافت در حال کار بر روی یک LLM برای مقابله با Gemini، GPT-4

LLM جدید با کد MAI-1 دارای ۵۰۰ میلیارد پارامتر است.

گزارش‌ها نشان می‌دهد که مایکروسافت در حال کار بر روی یک مدل زبان بزرگ (LLM) برای مقابله با Google’s Gemini و GPT-4 OpenAI.

با نام رمز MAI-1، LLM جدید در حال حاضر در مرحله توسعه است و توسط مصطفی سلیمان، یکی از بنیانگذاران Google DeepMind و Inflection AI، اطلاعات گزارش شده به نقل از دو منبع.

طبق یک پست وبلاگ نوشته شده توسط مدیر اجرایی مایکروسافت ساتیا نادلا.

مایکروسافت همچنین ۶۵۰ میلیون دلار به هوش مصنوعی Inflection پرداخت کرده بود تا نرم افزار خود را مجوز دهد. سلیمان و سیمونیان به همراه سایر کارکنان هوش مصنوعی Inflection که به مایکروسافت می پیوندند، بخشی از همین معامله هستند.

تاثیر هوش مصنوعی بر صرفه جویی در هزینه، بهره وری و مشاغل

در حالی که منابع ذکر شده توسط اطلاعات هدف از ساخت پارامتر ۵۰۰ میلیاردی LLM را فاش نکردند، آنها گفتند که LLM جدید می تواند در کنفرانس بیلد این شرکت در اواخر این ماه معرفی شود.

بر اساس گزارش‌ها، این شرکت مقدار زیادی از منابع محاسباتی را برای آموزش مدل اختصاص داده است، از جمله استفاده از داده‌های اینترنت و داده‌های تولید شده از GPT-4.

برای قرار دادن همه چیز در چارچوب، گزارش شده است که GPT-4 OpenAI دارای ۱.۷۶ تریلیون پارامتر است و شرکت برای آموزش آن بیش از ۱۰۰ میلیون دلار برای منابع محاسباتی هزینه کرده است.

متا نسل دوم مدل های Llama AI را آزاد می کند

در حالی که ممکن است مایکروسافت در حال کار بر روی مدل غول‌پیکر باشد، این شرکت ماه گذشته خانواده جدیدی از مدل‌های زبان کوچک (SLM) را راه‌اندازی کرد – خانواده Phi-3 – به عنوان بخشی از برنامه خود برای ساخت سبک‌وزن فناوری هوش مصنوعی مولد با عملکرد بالا در پلتفرم‌های بیشتری از جمله دستگاه‌های تلفن همراه موجود است.

خانواده Phi-3 از سه مدل تشکیل شده است – Phi-3 Mini با ۳.۸ میلیارد پارامتر، Phi-3 Small با ۷ میلیارد پارامتر و Phi-3 Medium با پارامتر ۱۴ میلیارد.

متا Code Llama LLM را برای کدنویسی منتشر کرد

در چند ماه گذشته شاهد انبوهی از LLMهایی بودیم که توسط چندین فروشنده، مانند Snowflake، Databricks، Cohere، Mistral، Anthropic، Meta، Google و AWS اعلام شد.

در حالی که Snowflake Arctic LLM خود را راه اندازی کرد، Databricks مدل DBRX خود را راه اندازی کرد. متا به طور جداگانه مدل Llama 3 خود را منتشر کرده بود. تنها چند روز بعد، Cohere نسخه‌های تکراری از خانواده مدل‌های Command خود را راه‌اندازی کرد.

Tags: مایکروسافت مولد-ai

پست های مرتبط

مایکروسافت در حال کار بر روی یک LLM برای مقابله با Gemini، GPT-4

مایکروسافت در حال کار بر روی یک LLM برای مقابله با Gemini، GPT-4

مایکروسافت در حال کار بر روی یک LLM برای مقابله با Gemini، GPT-4

شاید به این مطالب علاقمند باشید

مایکروسافت در حال کار بر روی یک LLM برای مقابله با Gemini، GPT-4

مایکروسافت در حال کار بر روی یک LLM برای مقابله با Gemini، GPT-4

مایکروسافت در حال کار بر روی یک LLM برای مقابله با Gemini، GPT-4

مایکروسافت در حال کار بر روی یک LLM برای مقابله با Gemini، GPT-4