چین از مدل Kimi K2 Thinking رونمایی کرد
استارتاپ چینی Moonshot AI از مدل متنباز Kimi K2 Thinking رونمایی کرده؛ مدلی که در برخی بنچمارکهای کلیدی نهتنها رقبای متنباز، بلکه مدلهای پیشرفته و پولی مانند GPT-5 و Claude Sonnet 4.5 را نیز پشت سر گذاشته است.
براساس دادههای منتشرشده، Kimi K2 Thinking در بنچمارک BrowseComp امتیاز ۶۰.۲٪ را به دست آورده؛ رقمی بالاتر از Deepseek-V3.2، GPT-5 با ۵۴.۹٪ و Claude 4.5 با ۲۴.۱٪. این مدل همچنین در تست استدلال HLE امتیاز ۴۴.۹٪ کسب کرده و در بنچمارک کدنویسی SWE-Bench Verified با ۷۱.۳٪ عملکردی بهتر از GPT-5 و Claude داشته است.
Kimi K2 Thinking حتی در بنچمارکهای ریاضی پیشرفته مانند AIME 2025 و HMMT 2025 نیز با GPT-5 برابری میکند؛ اتفاقی که برای نخستین بار یک مدل کاملاً متنباز را در سطح مدلهای اختصاصی و پرهزینه قرار میدهد.
معرفی Kimi K2 Thinking
این مدل بر پایه معماری MoE و با مقیاس ۱ تریلیون پارامتر ساخته شده است؛ اما در هر لحظه تنها ۳۲ میلیارد پارامتر فعال دارد و همین ویژگی آن را highly efficient میکند. K2 همچنین از پنجره زمینه ۲۵۶هزار توکنی و نسخهای فشردهشده با Quantization بهره میبرد که سرعت تولید متن را دو برابر میکند.
Kimi K2 Thinking در وبسایت kimi.com، از طریق API و همچنین روی Hugging Face در دسترس است. هزینه API آن ۰.۶۰ دلار برای هر ۱ میلیون توکن ورودی است که تقریباً نصف هزینه GPT-5 محسوب میشود و آن را بسیار رقابتی میسازد.
این مدل تحت مجوز MIT اصلاحشده منتشر شده؛ با یک شرط مهم: اگر یک محصول مبتنی بر آن بیش از ۱۰۰ میلیون کاربر ماهانه یا ۲۰ میلیون دلار درآمد ماهانه داشته باشد، باید نام Kimi K2 را بهطور واضح در رابط کاربری نمایش دهد.