رول می خواهد با استفاده از هوش مصنوعی مولد، عکس های دالی و موارد دیگر را بازسازی کند

کسانی که با Fazian Buzdar آشنا هستند، که تا همین اواخر معاون مدیریت محصول در Box بود، احتمالاً این کارآفرین را با Convo، پلتفرم فضای کاری دیجیتال محبوب در میان اتاق‌های خبر (از جمله این یکی) مرتبط می‌دانند. اما بوزدار که سابقه‌اش در مهندسی الکترونیک است، مدت‌هاست که شیفته جلوه‌های ویدئویی و بصری است.

بوزدار از طریق ایمیل به من گفت: “یک علاقه مند مادام العمر به فیلم و عکاسی، من سال ها به تنهایی فیلم می ساختم، اما متوجه شدم که تولید ویدئو تا حد زیادی دستی و با نوآوری کمی در دهه های اخیر باقی مانده است، به خصوص برای کارهای وقت گیر مانند ویرایش ویدئو.” . در همین حال، متوجه شدم که فناوری دوربین و حسگر آیفون در چند سال گذشته پیشرفت‌هایی در عملکرد پله‌ای داشته است و از نظر کیفیت تصویر تقریباً معادل دوربین‌های DSLR شده است.

بنابراین، در زمانی که در Box بود، فایزن می‌گوید که تصمیم گرفت ویدیو را – یک رسانه محبوب – با نوآوری‌هایی در هوش مصنوعی و یادگیری ماشین ترکیب کند تا تجربه ضبط و ویرایش ویدیو را بهبود بخشد. فیضان ضربه زد عادل عباسمهندس ویدیویی که در زمان حضور در توییتر به زیرساختی کمک کرد تا ویژگی‌های پخش زنده سایت را تقویت کند ساج خان، فهد یعقوب و همکار باکس میشل اوه برای کاوش در مرزهای تولید ویدیوی شتاب یافته با فناوری.

رول نتیجه است. یک برنامه جدید برای iOS، ارائه می دهد بوکه، عکس‌های چند دوربینی، گرافیک‌های متحرک و – شاید برای من جذاب‌ترین – لغزنده‌های شبیه‌سازی شده با هوش مصنوعی، دالی‌ها و بازوها.

رول می خواهد با استفاده از هوش مصنوعی مولد، عکس های دالی و موارد دیگر را بازسازی کند

اعتبار تصویر: رول

ماموریت ما این است که دنیای تولید ویدیو با کیفیت بالا را مختل کنیم و به استاندارد جدیدی برای تولید محتوای ویدیویی تبدیل شویم. «ایجاد ویدیوی عالی یک سرمایه‌گذاری هنگفت در تجهیزات، تجهیزات، یادگیری نحوه استفاده از آن تجهیزات، نرم‌افزار برای ویرایش است – ما از شر همه این‌ها خلاص می‌شویم.»

Roll، که با هدف بازار «خروج‌کننده» (به اینفلوئنسرها و پادکست‌ها فکر کنید، اما همچنین کسب‌وکارهایی که مواد بازاریابی خود را ایجاد می‌کنند)، از دو محصول تشکیل شده است: برنامه Roll iPhone و برنامه وب. برنامه آیفون ویدیو را ضبط و ضبط می کند و سپس به طور خودکار آن را برای ذخیره سازی و پردازش در ابر Roll آپلود می کند. در همین حال، برنامه وب جایی است که می توان فیلم را پیش نمایش، دسترسی، اشتراک گذاری، دانلود و ویرایش توسط یک یا تیمی از تولیدکنندگان محتوا انجام داد.

البته، اپلیکیشن های ویدیویی یک دوجین قیمت دارند. بنابراین چه چیزی رول را متفاوت می کند؟ به عنوان مثال، این برنامه برای موارد استفاده است که اکثر برنامه های دوربین این کار را نمی کنند. بوزدار می گوید – پسندیدن مصاحبه های ویدئویی از راه دور، پادکست های ویدئویی و توصیفات مشتری. در حالی که Zoom، Microsoft Teams و Google Meet نیاز را تا حدودی برطرف می‌کنند، Buzdar استدلال می‌کند که آنها برای تولید ویدیوی «با کیفیت بالا» طراحی نشده‌اند.

Roll همچنین از تعدادی افکت بلادرنگ استفاده می‌کند تا (ظاهراً) طیف وسیع‌تری از انتخاب‌های پس از تولید را نسبت به اکثر برنامه‌های فیلم‌برداری ارائه دهد. برای مثال، Roll در استاندارد HEVC ضبط می‌کند و تقریباً دو برابر نرخ بیت و کیفیت تصویر بالاتر را برای همان اندازه فایل ارائه می‌کند. و رول می تواند حداکثر دو عکس دوربین – یک عکس با زاویه باز و یک عکس نزدیک – را به طور همزمان ضبط و پردازش کند و به کاربران امکان می دهد ویدیوهایی با چشم اندازهای “چند دوربینی” ایجاد کنند.

رول

رابط ویرایش رول.

مسلما، Multi-cam به خصوص منحصر به فرد نیست – رول با اولین برنامه ای که آن را ارائه می دهد فاصله زیادی دارد. ولی بوزدار می گوید جادو در پس پردازش است. رول از هوش مصنوعی مولد برای بازسازی اتاق‌ها در فضای سه‌بعدی استفاده می‌کند تا سازندگان محتوا بتوانند یک دوربین مجازی شبیه به بازی ویدیویی را به اطراف حرکت دهند و حرکاتی مانند حرکت از یک طرف به سمت دیگر با یک دالی یا جرثقیل را شبیه‌سازی کنند.

“امروزه، هوش مصنوعی مولد اغلب با ایجاد محتوای جعلی از هوا مرتبط است.” بوزدار گفت. “یعنی فلسفه ما نیست ما پیکسل، افراد یا صحنه های جعلی تولید نمی کنیم. ما از هوش مصنوعی مولد صرفاً به عنوان ابزاری برای بهره‌وری استفاده می‌کنیم – می‌خواهیم دسترسی به تولید ویدیو با کیفیت بالاتر را دموکراتیک کنیم.»

بوزدار توضیح داد که هوش مصنوعی رول برای درک عمق سه بعدی در یک صحنه آموزش دیده است و از داده ها برای اندازه گیری عمق و اشکال مستقل از فردی که در اتاق نشسته است استفاده می کند. رول شروع به آموزش الگوریتم های خود با مجموعه داده های منبع باز کرد که معمولاً برای محک زدن در دانشگاه استفاده می شود، اما سپس بیش از 22000 تماس ویدیویی را به صورت داخلی ضبط کرد و پایگاه داده غنی خود را ایجاد کرد.

نتایج نیمه بد نیستند – حداقل در فیلم‌های آزمایشی آن بوزدار به من نشان داد. برخی از تابه های تولید شده توسط هوش مصنوعی رول، دره عجیب و غریب را باز می کنند، که نتیجه تاب خوردن غیر طبیعی اشیاء در پس زمینه است. همانطور که دوربین مجازی می چرخد. اما در صحنه‌های کوتاه، جلوه‌های هوش مصنوعی به اندازه کافی قانع‌کننده هستند – و افزوده‌ای چشم‌گیر به آنچه در غیر این صورت یک مصاحبه از راه دور کسل‌کننده است.

ما کمی در این مورد تحقیق کرده‌ایم و ندیده‌ایم که کسی مانند ما از هوش مصنوعی استفاده کند – جفت کردن داده‌های حسگر آیفون با مدل‌های هوش مصنوعی بزرگ در فضای ابری. “فناوری ما قابلیت های اساسی برای شبیه سازی هر گونه جلوه های بصری که کاربر می خواهد را فراهم می کند.”

رول

ضبط تماس با رول.

هر جلوه های بصری کمی کشدار به نظر می رسد. اما رول ترفندهای الگوریتمی واقعی‌تر دیگری نیز در آستین خود دارد. همانطور که Roll فیلم ضبط می کند، متادیتا را برای استفاده در مراحل بعدی تولید ویدئو جمع آوری می کند، از جمله شرایط ضبط و نور، فاصله دوربین تا سوژه و موقعیت صورت و بدن سوژه. این ابرداده برای تنظیم خودکار دوربین ها و حسگرهای گوشی و همچنین ارائه بازخورد و دستورالعمل برای ترکیب بندی و نور استفاده می شود.

مانند چند ویرایشگر ویدیوی موبایلی «با قابلیت هوش مصنوعی» دیگر در بازار، Roll همچنین از ابرداده برای ایجاد یک حلقه کاملاً واقعی و چند دوربینی در ابر ویرایش خود استفاده می‌کند – بدون نیاز به ویرایش دستی. (کاربران همچنان می‌توانند زوایای دوربین را تغییر داده و تنظیم کنند یا حرکات دوربین و جلوه‌های بصری را در صورت تمایل اضافه کنند.) در آینده نزدیک، Roll می‌تواند مستقیماً در رسانه‌های اجتماعی از جمله TikTok، YouTube و Instagram منتشر کند – با وضوح مناسب و نسبت تصویر

“امروزه، تولید ویدئو به قطعات سخت افزاری و نرم افزاری زیادی برای تکمیل کامل نیاز دارد.” بوزدار گفت. ،با هر مرحله، وقتی فایل ویدیویی و صوتی از یک نرم‌افزار به نرم‌افزار دیگر پرش می‌کند، زمینه را از دست می‌دهد و به یک فایل «گنگ» تبدیل می‌شود که در اطراف پخش می‌شود. ما اساساً کل «پشته» تولید ویدیو را از ابتدا بازسازی کرده‌ایم. با برش از مرزهای نرم‌افزار سنتی، ما از هوش مصنوعی برای ارائه تجربه‌ای دگرگون‌کننده از عکس‌برداری تا انتشار استفاده کرده‌ایم که به صورت عمودی کل گردش کار تولید ویدیو از راه دور را یکپارچه و خودکار می‌کند.»

بنابراین، رول چگونه برای کسب درآمد برنامه ریزی می کند؟ این شرکت تاکنون پول نقد را از منابع سنتی VC جمع آوری کرده است – بوزدار دقیقاً نمی گوید کجا. اما از نظر درآمدزایی، Buzdar امیدوار است Roll در نهایت رشد کند تا نیازهای سازمان‌های شرکتی را برآورده کند – به‌ویژه تیم‌های بازاریابی شرکتی داخلی و تیم‌های ویدیویی آن‌ها، که نوعی هزینه برای خدمات Roll می‌پردازند.

“تولید ویدئو برای ایجاد اختلال از ابر آماده است.” بوزدار گفت. ،ویژگی‌هایی مانند اندازه فایل‌های بزرگ، پردازش پیچیده و نیاز به ویرایش‌های چند نفره و چرخه‌های بازبینی، آن را به گزینه‌ای عالی برای برخورداری از مزایای نمایی از رایانش ابری مانند ذخیره‌سازی مقیاس‌پذیر، هوش مصنوعی، محاسبه، و اشتراک‌گذاری و همکاری بلادرنگ تبدیل می‌کند.

مطمئنا حقیقتی در آن وجود دارد. در مورد اینکه آیا رول مختل کننده خواهد بود یا خیر، زمان مشخص خواهد کرد.