شرکت متا اوایل این ماه سری مدل‌ های زبان بزرگ خود را با نام لاما ۳.۱ منتشر کرد. این سری شامل دو نسخه با ۴۰۵ میلیارد و ۷۰ میلیارد پارامتر است. برای یک مدل متن‌ باز، این پیشرفت بسیار چشمگیری است.

 

متا Llama-3.1  رقیب جدیدی برای GPT-4

 

سازمان LMSys، یک پلتفرم جمع‌ سپاری باز برای مقایسه مدل‌ های زبان بزرگ، این دو نسخه را در هفته گذشته به طور گسترده آزمایش کرده است. و همانطور که انتظار می‌رفت، هر دو نسخه نتایج شگفت‌ انگیزی کسب کردند.

مدل متا-لاما-۳.۱-۴۰۵b-Instruct در رتبه سوم جدول کلی قرار گرفته و کنار مدل Gemini-Advanced-0514 قرار گرفته است. این اولین مدل متن‌ باز است که به چنین دستاوردی می‌رسد. دو مدل برتر GPT-4o و نسخه کوچک‌ تر آن هستند و کلود ۳.۵ ساننت در رتبه سوم قرار دارد.

مدل ۴۰۵ میلیارد پارامتری نتایج بسیار خوبی در زمینه‌ هایی مثل برنامه‌ نویسی، ریاضیات، دنبال کردن دستورالعمل‌ها و سوالات سخت کسب کرده است. در حوزه انگلیسی، طبق توصیف پلتفرم، مدل متا حتی با GPT-4o شرکت اوپن‌اِی هم‌ تراز است. این تنها مدلی است که در بنچمارک MMLU امتیاز ۸۸.۶ را کسب کرده و به GPT-4o، کلود ۳.۵ ساننت و جیمینی ۱.۵ پرو نزدیک است.

مدل متا-لاما-۳.۱-۷۰b-Instruct هم به طور شگفت‌ آوری عملکرد بسیار خوبی دارد. این مدل از زمان انتشار پیشرفت زیادی داشته و در رتبه نهم کنار کلود ۳ اوپوس و GPT-4 قرار گرفته است.

سازمان LMSys مدل‌ ها را با اجازه دادن به جامعه برای ارزیابی آن‌ ها از طریق مقایسه‌ های جفت‌ به‌ جفت زنده، باز و مبتنی بر جامعه آزمایش می‌کند. این پلتفرم متن‌ باز که در ماه مه ۲۰۲۳ توسط LMSYS و آزمایشگاه SkyLab دانشگاه برکلی ایجاد شده، میلیون‌ ها کاربر را درگیر کرده و بیش از ۹۰ چت‌ بات را آزمایش کرده است.

مارک زاکربرگ، مدیرعامل متا، اوایل امسال مدل‌ های لاما را متن‌ باز کرد. و حالا شرکت مادر فیسبوک استودیوی هوش مصنوعی مبتنی بر لاما ۳.۱ را راه‌ اندازی کرده که به شما اجازه می‌دهد هوش مصنوعی خود را بر اساس پروفایل اینستاگرام‌تان ایجاد کنید.

source