اپل هوش مصنوعی SHARP را معرفی کرد
اپل معمولاً در زمینه هوش مصنوعی بیسروصدا عمل میکند، اما اینبار با عرضه مدل متنباز قدرتمندی به نام SHARP توجه زیادی جلب کرده است. این مدل قادر است تنها با دریافت یک عکس دوبعدی معمولی، در کمتر از یک ثانیه یک صحنه سهبعدی واقعگرایانه بسازد و کاربردهای گستردهای در واقعیت مجازی، بازیسازی و حتی عکاسی دارد.
به زبان ساده، مدل جدید اپل میتواند عمق و پرسپکتیو یک عکس تخت را درک و آن را زنده کند. محققان اپل در مقالهای توضیح میدهند که SHARP پارامترهای سهبعدی را مستقیماً از یک عکس استخراج میکند. نتیجه این است که کاربران میتوانند دوربین را در فضای عکس حرکت دهند و صحنه را از زوایای نزدیک مشاهده کنند، گویی واقعاً در آنجا حضور دارند.
پیش از این، برای ساخت مدل سهبعدی از یک صحنه نیاز به دهها یا صدها عکس از زوایای مختلف بود، اما SHARP این کار را با یک عکس و در یک مرحله انجام میدهد. کل پردازش در کمتر از یک ثانیه روی یک کارت گرافیک استاندارد انجام شده و نسبت به مدلهای رقیب ۲۵ تا ۳۴ درصد خطا کمتر دارد.
اگرچه SHARP سریع و دقیق است، اما محدودیتهایی نیز دارد. این مدل نمیتواند بخشهای پنهان صحنه، مانند پشت مبل یا دیوار، را از خودش بسازد. به همین دلیل حرکت دوربین محدود به نماهای نزدیک است و اگر زاویه دورتر از تصویر اصلی گرفته شود، با فضای خالی مواجه خواهید شد. اپل این محدودیت را پذیرفته تا سرعت و واقعگرایی مدل حفظ شود.
خبر خوب اینکه اپل کد و وزنهای این مدل را بهصورت عمومی در GitHub منتشر کرده است. توسعهدهندگان و علاقهمندان میتوانند آن را دانلود و روی سیستمهای خود اجرا کنند. کاربران در شبکه اجتماعی ایکس ویدیوهایی از خروجی مدل به اشتراک گذاشتهاند که نشان میدهد چقدر سریع و طبیعی میتوان به عکسهای ثابت جان بخشید.