علیبابا مدل یک تریلیون پارامتری Qwen3-Max را معرفی کرد؛ رقیبی برای GPT-5
شرکت چینی علیبابا پیشرفتهترین مدل هوش مصنوعی خود به نام Qwen3-Max را عرضه کرد؛ مدلی با بیش از یک تریلیون پارامتر که در برخی بنچمارکها حتی امتیاز بالاتری از رقبای بزرگی چون Claude، DeepSeek و حتی نسخه آزمایشی GPT-5 کسب کرده است. این مدل پیشتر در حالت پیشنمایش در دسترس قرار داشت.
Qwen3-Max بر پایه ۳۶ تریلیون توکن داده آموزش دیده و از معماری بهینهشدهی «ترکیب متخصصان» (MoE) استفاده میکند؛ رویکردی که امکان مدیریت بهینه منابع را با وجود اندازه عظیم مدل فراهم میسازد.
دو ویژگی کلیدی Qwen3-Max
توانایی ایجنت مستقل (Autonomous Agent): این مدل میتواند برای دستیابی به اهداف کاربر با حداقل دستور مستقیم عمل کرده و تصمیمگیریهای خودکار انجام دهد.
قدرت برجسته در کدنویسی و حل مسائل برنامهنویسی: آزمایشهای تخصصی نشان میدهند که Qwen3-Max توانایی چشمگیری در درک و تولید کد دارد.
عملکرد و جایگاه در بنچمارکها
در رتبهبندی وبسایت LMArena، نسخه پیشنمایش Qwen3-Max جایگاه سوم جهانی را بهدست آورده و حتی بالاتر از GPT-5-Chat قرار گرفته است.
در آزمون Tau2-Bench که بر تواناییهای عاملمحور تمرکز دارد، این مدل با امتیاز ۷۴.۸، از رقبایی مانند Claude Opus 4 و DeepSeek V3.1 پیشی گرفته است.
آیندهی توسعه
علیبابا اعلام کرده در حال کار روی نسخهی پیشرفتهتری به نام Qwen3-Max-Thinking است؛ مدلی با تمرکز ویژه بر استدلال. طبق گزارشها، این نسخه در آزمونهای دشوار ریاضی مانند AIME 25 و HMMT توانسته به امتیاز کامل ۱۰۰ درصد دست یابد.
سرمایهگذاری کلان
این شرکت پیشتر وعده داده بود که طی سه سال آینده بیش از ۵۳ میلیارد دلار روی زیرساختهای هوش مصنوعی سرمایهگذاری کند. «ادی وو» مدیرعامل علیبابا، در کنفرانس اخیر تاکید کرده که سرعت رشد این حوزه فراتر از انتظار بوده و میزان سرمایهگذاری احتمالاً از این هم بیشتر خواهد شد.