نتایج جستجو

علی‌بابا مدل یک تریلیون پارامتری Qwen3-Max را معرفی کرد؛ رقیبی برای GPT-5

نوشته شده توسط رهام بخشائي

۰۳ مهر، ۱۴۰۴

علی‌بابا مدل یک تریلیون پارامتری Qwen3-Max را معرفی کرد؛ رقیبی برای GPT-5

نوشته شده توسط رهام بخشائي

۰۳ مهر، ۱۴۰۴

شرکت چینی علی‌بابا پیشرفته‌ترین مدل هوش مصنوعی خود به نام Qwen3-Max را عرضه کرد؛ مدلی با بیش از یک تریلیون پارامتر که در برخی بنچمارک‌ها حتی امتیاز بالاتری از رقبای بزرگی چون Claude، DeepSeek و حتی نسخه آزمایشی GPT-5 کسب کرده است. این مدل پیش‌تر در حالت پیش‌نمایش در دسترس قرار داشت.
Qwen3-Max بر پایه ۳۶ تریلیون توکن داده آموزش دیده و از معماری بهینه‌شده‌ی «ترکیب متخصصان» (MoE) استفاده می‌کند؛ رویکردی که امکان مدیریت بهینه منابع را با وجود اندازه عظیم مدل فراهم می‌سازد.

دو ویژگی کلیدی Qwen3-Max

توانایی ایجنت مستقل (Autonomous Agent): این مدل می‌تواند برای دستیابی به اهداف کاربر با حداقل دستور مستقیم عمل کرده و تصمیم‌گیری‌های خودکار انجام دهد.
قدرت برجسته در کدنویسی و حل مسائل برنامه‌نویسی: آزمایش‌های تخصصی نشان می‌دهند که Qwen3-Max توانایی چشمگیری در درک و تولید کد دارد.

عملکرد و جایگاه در بنچمارک‌ها

در رتبه‌بندی وب‌سایت LMArena، نسخه پیش‌نمایش Qwen3-Max جایگاه سوم جهانی را به‌دست آورده و حتی بالاتر از GPT-5-Chat قرار گرفته است.
در آزمون Tau2-Bench که بر توانایی‌های عامل‌محور تمرکز دارد، این مدل با امتیاز ۷۴.۸، از رقبایی مانند Claude Opus 4 و DeepSeek V3.1 پیشی گرفته است.

آینده‌ی توسعه

علی‌بابا اعلام کرده در حال کار روی نسخه‌ی پیشرفته‌تری به نام Qwen3-Max-Thinking است؛ مدلی با تمرکز ویژه بر استدلال. طبق گزارش‌ها، این نسخه در آزمون‌های دشوار ریاضی مانند AIME 25 و HMMT توانسته به امتیاز کامل ۱۰۰ درصد دست یابد.

سرمایه‌گذاری کلان

این شرکت پیش‌تر وعده داده بود که طی سه سال آینده بیش از ۵۳ میلیارد دلار روی زیرساخت‌های هوش مصنوعی سرمایه‌گذاری کند. «ادی وو» مدیرعامل علی‌بابا، در کنفرانس اخیر تاکید کرده که سرعت رشد این حوزه فراتر از انتظار بوده و میزان سرمایه‌گذاری احتمالاً از این هم بیشتر خواهد شد.

تکنولوژی

اشتراک گذاری: