شرکت xAI مدل جدید Grok 4.1 را با کاهش چشمگیر هالوسینیشن و جهش عملکردی در دو نسخه رایگان عرضه کرده است.
به گزارش سرویس هوش مصنوعی تکناک، دو نسخه مختلف این مدل شامل Grok 4.1 و Grok 4.1 Thinking میشود و اگرچه هر دو مدل رایگان هستند، اما مشتریان پرداختی با محدودیتهای کمتری روبهرو خواهند بود.
شرکت xAI متعلق به ایلان ماسک اعلام کرده است که Grok 4.1 نسبت به مدلهای قبلی خود مثل Grok 4، به طور قابل توجهی بهبود یافته است. این مدل جدید به ویژه در کاهش احتمال هالوسینیشن (توهمات) عملکرد بهتری دارد و احتمال وقوع این پدیده را تا سه برابر نسبت به مدلهای قبلی کاهش میدهد. این ویژگی به عنوان یکی از مهمترین پیشرفتها در این مدل، آن را به یکی از بهترین انتشارهای تاریخ xAI تبدیل کرده است.

در حالی که عملکرد Grok 4.1 نسبت به مدلهای قبلی به وضوح بهبود یافته است، هنوز مشخص نیست که این مدل چگونه در مقایسه با رقبای اصلی خود، مانند GPT 5.1 عمل خواهد کرد، که به تازگی با بهبودهایی در زمینه عملکرد و هوش عاطفی منتشر شده است. به هر حال، LMArena’s Text Arena که یک پلتفرم ارزیابی است، نکات جالبی در مورد عملکرد این مدل جدید منتشر کرده است.
این گزارش میگوید که بر اساس ارزیابیهای انجامشده در Text Arena، مدل Grok 4.1 (thinking) در رتبه اول با امتیاز 1510 قرار دارد و نسخه اصلی Grok 4.1 در رتبه 19 با امتیاز 1437 قرار گرفته است. این پلتفرم ارزیابی تاکید کرده است که این امتیازات نشاندهنده یک بهبود بیش از 40 امتیاز نسبت به مدل قبلی Grok 4 است که تنها دو ماه پیش وارد این پلتفرم شده بود.

با وجود اینکه Grok 4.1 یک ارتقای چشمگیر است، برخی پیشبینیها حاکی از آن است که امکان دارد بهترین مدل سال 2025 نباشد. چرا که گوگل در حال آمادهسازی برای عرضه مدل Gemini 3.0 است، که بهعنوان قدرتمندترین مدل ساختهشده تاکنون شناخته میشود.
LMArena’s Text Arena یک ابزار متنباز است که به کاربران این امکان را میدهد مدلهای مختلف زبان بزرگ (LLMها) را از طریق آزمایشهای جانبی، تصادفی و ناشناس مقایسه کنند. طبق ارزیابیهای اولیه، Grok 4.1 و نسخه Thinking آن بهویژه در رقابتهای شدیدترین آزمایشها در این پلتفرم به نتایج قابل توجهی دست یافتهاند و به نظر میرسد که در آیندهای نزدیک، این مدلها نقش مهمی در دنیای هوش مصنوعی ایفا خواهند کرد.
تک جدید دریچهای به دنیای بزرگ فناوری
