مجله خبری سرمایه گذاری اهرم
Loading...

نتایج جستجو

بازگشت
بازگشت

Kling O1 معرفی شد؛ هوش مصنوعی یکپارچه ویدیو

Kling O1 معرفی شد؛ هوش مصنوعی یکپارچه ویدیو
نوشته شده توسط هدی کاظمی نسب
|
۱۱ آذر، ۱۴۰۴

مدل جدید ویدیوساز Kling O1 معرفی شد؛ این هوش مصنوعی چینی برخلاف رقبا که برای هر کاری (تولید، ویرایش، تغییر لباس) ابزار جداگانه‌ای دارند، همه قابلیت‌ها را در یک مدل واحد ترکیب کرده است. این یعنی شما می‌توانید با یک پرامپت ساده، هم ویدیو بسازید، هم آن را ویرایش کنید و هم شخصیت را تغییر دهید.
تفاوت اصلی Kling O1 در معماری آن است که MVL (زبان بصری چندوجهی) نامیده می‌شود. در حالی که ابزارهای فعلی برای درک متن، تصویر و ویدیو از مدل‌های جداگانه استفاده می‌کنند، Kling O1 همه این ورودی‌ها را در یک فضای استدلالی واحد ترکیب می‌کند.
این مدل قادر است متن، تصویر، ویدیو و حتی حرکت را هم‌زمان درک کند. نتیجه این یکپارچگی چیست؟ شما دیگر نیازی به جابه‌جایی بین ابزارهای مختلف ندارید؛ تمام مراحل تولید، ویرایش، گسترش و تغییر استایل ویدیو در یک مرحله و توسط یک هوش مصنوعی انجام می‌شود.
مدل Kling O1 یکی از منعطف‌ترین سیستم‌های تبدیل تصویر به ویدیو در جهان است. هدف آن تبدیل ایده‌های انتزاعی به شات‌های سینمایی با ثبات بالاست. با Kling O1 می‌توانید تا ۷ تصویر مرجع آپلود کنید تا هوش مصنوعی دقیقاً همان کاراکتر، لباس یا فضا را در ویدیو حفظ کند.
همچنین با آپلود فریم آغازین و پایانی، هوش مصنوعی حرکت بین این دو نقطه را به نرمی و با حفظ هویت سوژه‌ها می‌سازد. طول ویدیوها حداکثر ۱۰ ثانیه است. علاوه بر این، می‌توانید با دستور متنی، کاراکتر ویدیو را تغییر دهید یا لباس او را عوض کنید.
بخش ویرایش Kling O1 جایی است که قدرت واقعی موتور یکپارچه این هوش مصنوعی را می‌بینید. دیگر نیازی به ماسک‌گذاری فریم‌به‌فریم نیست. شما می‌توانید با یک دستور متنی ساده، تغییرات مختلفی را اعمال کنید؛ هر شیء، فرد یا پس‌زمینه‌ای را در چند ثانیه حذف یا اضافه کنید.
همچنین می‌توانید یک ویدیوی مرجع آپلود کنید تا Kling O1 حرکت دوربین و ریتم آن را استخراج و روی صحنه جدید شما اعمال کند.
بزرگ‌ترین چالش مدل‌های هوش مصنوعی ویدیویی معمولاً عدم ثبات بوده است؛ یعنی چهره کاراکتر در طول ویدیو تغییر می‌کرد. اما Kling O1 ثبات بی‌نظیری در چهره، لباس و اشیا ارائه می‌دهد. این ویژگی به کارگردانان فرصتی می‌دهد تا استوری‌بوردهای متحرک بسازند و صحنه‌های مختلف فیلم خود را تست کنند.
به‌تازگی مدل ویدیوساز Runway Gen-4.5 نیز معرفی شده که در بنچمارک‌های مختلف، مدل‌های گوگل و OpenAI را پشت سر گذاشته است.

اشتراک گذاری:
کپی شد