۶ اردیبهشت ۱۴۰۴

Techboy

اخبار و اطلاعات روز تکنولوژی

Google از مدل های Multi-Modal AI رونمایی می کند

GEMMA 3 از ورودی های چشم انداز و خروجی های متن پشتیبانی می کند ، ویندوز زمینه را تا 128 کیلومتر نشان می دهد و بیش از 140 زبان را درک می کند.

GEMMA 3 از ورودی های چشم انداز و خروجی های متن پشتیبانی می کند ، ویندوز زمینه را تا ۱۲۸ کیلومتر نشان می دهد و بیش از ۱۴۰ زبان را درک می کند.

Google DeepMind gemma 3 را معرفی کرده است ، به روزرسانی در خانواده مدلهای تولیدی شرکت ، با داشتن چند مدلی که به مدل ها امکان تجزیه و تحلیل تصاویر را می دهد ، پاسخ می دهد و در مورد تصاویر ، اشیاء را شناسایی می کند و داده های دیگری را انجام می دهد.

به روزرسانی اعلام شد ۱۲ مارس و می توان در گوگل استودیوی AI برای توسعه AI. طبق گفته Google DeepMind ، Gemma 3 همچنین به طور قابل توجهی ریاضی ، برنامه نویسی و دستورالعمل های زیر را بهبود می بخشد.

Gemma 3 از ورودی های چشم انداز و خروجی های متن پشتیبانی می کند ، ویندوزهای زمینه را تا ۱۲۸ کیلومتر نشان می دهد و بیش از ۱۴۰ زبان را درک می کند. همچنین برای ریاضیات ، استدلال و گپ ، از جمله خروجی های ساختاری و فراخوانی عملکرد ، پیشرفت هایی نیز انجام شده است. Gemma 3 در چهار اندازه “سازگار با توسعه دهنده” از ۱B ، ۴B ، ۱۲B و ۲۷B و در نسخه های تنظیم شده توسط دستورالعمل های قبل از آموزش و عمومی قرار دارد. اعلامیه Google DeepMind گفت: “پنجره زمینه ۱۲۸K-Token به Gemma 3 اجازه می دهد تا مقادیر گسترده ای از اطلاعات را پردازش و درک کند ، به راحتی با کارهای پیچیده مقابله کند.”

توسعه دهندگان گزینه های استقرار چندگانه دارند ، مانند cloud run و پایه کد اصلاح شده است ، با دستور العمل های استنباط و تونز. وزن مدل Gemma 3 را می توان از kaggle بارگیری کرد و

NVIDIA از مدلهای Gemma 3 برای حداکثر عملکرد در GPU با هر اندازه ، از Jetson Nano گرفته تا تراشه های بلکول ، پشتیبانی مستقیم دارد. Gemma 3 همچنین برای Google Cloud TPU بهینه شده و با GPU های AMD ادغام می شود. برای اجرای GPU ها ، کاربران می توانند از gemma.cpp .

استفاده کنند.

Google DeepMind در ۱۲ مارس همچنین shieldgemma 2 ، یک مدل پارامتر ۴B ساخته شده بر روی Gemma 3 که بررسی می کند ایمنی و راهنمای کلیدی است. Shieldgemma 2 برای استفاده به عنوان فیلتر ورودی برای مدل های زبان بینایی یا به عنوان فیلتر خروجی سیستم های تولید تصویر توصیه می شود. Google DeepMind گفت ، Shieldgemma 2 به توسعه دهندگان اجازه می دهد تا خطر محتوای مضر مانند محتوا را که از نظر جنسی صریح ، خطرناک یا خشونت آمیز است ، به حداقل برسانند.