Kling O1 معرفی شد؛ هوش مصنوعی یکپارچه ویدیو
مدل جدید ویدیوساز Kling O1 معرفی شد؛ این هوش مصنوعی چینی برخلاف رقبا که برای هر کاری (تولید، ویرایش، تغییر لباس) ابزار جداگانهای دارند، همه قابلیتها را در یک مدل واحد ترکیب کرده است. این یعنی شما میتوانید با یک پرامپت ساده، هم ویدیو بسازید، هم آن را ویرایش کنید و هم شخصیت را تغییر دهید.
تفاوت اصلی Kling O1 در معماری آن است که MVL (زبان بصری چندوجهی) نامیده میشود. در حالی که ابزارهای فعلی برای درک متن، تصویر و ویدیو از مدلهای جداگانه استفاده میکنند، Kling O1 همه این ورودیها را در یک فضای استدلالی واحد ترکیب میکند.
این مدل قادر است متن، تصویر، ویدیو و حتی حرکت را همزمان درک کند. نتیجه این یکپارچگی چیست؟ شما دیگر نیازی به جابهجایی بین ابزارهای مختلف ندارید؛ تمام مراحل تولید، ویرایش، گسترش و تغییر استایل ویدیو در یک مرحله و توسط یک هوش مصنوعی انجام میشود.
مدل Kling O1 یکی از منعطفترین سیستمهای تبدیل تصویر به ویدیو در جهان است. هدف آن تبدیل ایدههای انتزاعی به شاتهای سینمایی با ثبات بالاست. با Kling O1 میتوانید تا ۷ تصویر مرجع آپلود کنید تا هوش مصنوعی دقیقاً همان کاراکتر، لباس یا فضا را در ویدیو حفظ کند.
همچنین با آپلود فریم آغازین و پایانی، هوش مصنوعی حرکت بین این دو نقطه را به نرمی و با حفظ هویت سوژهها میسازد. طول ویدیوها حداکثر ۱۰ ثانیه است. علاوه بر این، میتوانید با دستور متنی، کاراکتر ویدیو را تغییر دهید یا لباس او را عوض کنید.
بخش ویرایش Kling O1 جایی است که قدرت واقعی موتور یکپارچه این هوش مصنوعی را میبینید. دیگر نیازی به ماسکگذاری فریمبهفریم نیست. شما میتوانید با یک دستور متنی ساده، تغییرات مختلفی را اعمال کنید؛ هر شیء، فرد یا پسزمینهای را در چند ثانیه حذف یا اضافه کنید.
همچنین میتوانید یک ویدیوی مرجع آپلود کنید تا Kling O1 حرکت دوربین و ریتم آن را استخراج و روی صحنه جدید شما اعمال کند.
بزرگترین چالش مدلهای هوش مصنوعی ویدیویی معمولاً عدم ثبات بوده است؛ یعنی چهره کاراکتر در طول ویدیو تغییر میکرد. اما Kling O1 ثبات بینظیری در چهره، لباس و اشیا ارائه میدهد. این ویژگی به کارگردانان فرصتی میدهد تا استوریبوردهای متحرک بسازند و صحنههای مختلف فیلم خود را تست کنند.
بهتازگی مدل ویدیوساز Runway Gen-4.5 نیز معرفی شده که در بنچمارکهای مختلف، مدلهای گوگل و OpenAI را پشت سر گذاشته است.