کسانی که با Fazian Buzdar آشنا هستند، که تا همین اواخر معاون مدیریت محصول در Box بود، احتمالاً این کارآفرین را با Convo، پلتفرم فضای کاری دیجیتال محبوب در میان اتاقهای خبر (از جمله این یکی) مرتبط میدانند. اما بوزدار که سابقهاش در مهندسی الکترونیک است، مدتهاست که شیفته جلوههای ویدئویی و بصری است.
بوزدار از طریق ایمیل به من گفت: “یک علاقه مند مادام العمر به فیلم و عکاسی، من سال ها به تنهایی فیلم می ساختم، اما متوجه شدم که تولید ویدئو تا حد زیادی دستی و با نوآوری کمی در دهه های اخیر باقی مانده است، به خصوص برای کارهای وقت گیر مانند ویرایش ویدئو.” . در همین حال، متوجه شدم که فناوری دوربین و حسگر آیفون در چند سال گذشته پیشرفتهایی در عملکرد پلهای داشته است و از نظر کیفیت تصویر تقریباً معادل دوربینهای DSLR شده است.
بنابراین، در زمانی که در Box بود، فایزن میگوید که تصمیم گرفت ویدیو را – یک رسانه محبوب – با نوآوریهایی در هوش مصنوعی و یادگیری ماشین ترکیب کند تا تجربه ضبط و ویرایش ویدیو را بهبود بخشد. فیضان ضربه زد عادل عباسمهندس ویدیویی که در زمان حضور در توییتر به زیرساختی کمک کرد تا ویژگیهای پخش زنده سایت را تقویت کند ساج خان، فهد یعقوب و همکار باکس میشل اوه برای کاوش در مرزهای تولید ویدیوی شتاب یافته با فناوری.
رول نتیجه است. یک برنامه جدید برای iOS، ارائه می دهد بوکه، عکسهای چند دوربینی، گرافیکهای متحرک و – شاید برای من جذابترین – لغزندههای شبیهسازی شده با هوش مصنوعی، دالیها و بازوها.

اعتبار تصویر: رول
“ماموریت ما این است که دنیای تولید ویدیو با کیفیت بالا را مختل کنیم و به استاندارد جدیدی برای تولید محتوای ویدیویی تبدیل شویم. «ایجاد ویدیوی عالی یک سرمایهگذاری هنگفت در تجهیزات، تجهیزات، یادگیری نحوه استفاده از آن تجهیزات، نرمافزار برای ویرایش است – ما از شر همه اینها خلاص میشویم.»
Roll، که با هدف بازار «خروجکننده» (به اینفلوئنسرها و پادکستها فکر کنید، اما همچنین کسبوکارهایی که مواد بازاریابی خود را ایجاد میکنند)، از دو محصول تشکیل شده است: برنامه Roll iPhone و برنامه وب. برنامه آیفون ویدیو را ضبط و ضبط می کند و سپس به طور خودکار آن را برای ذخیره سازی و پردازش در ابر Roll آپلود می کند. در همین حال، برنامه وب جایی است که می توان فیلم را پیش نمایش، دسترسی، اشتراک گذاری، دانلود و ویرایش توسط یک یا تیمی از تولیدکنندگان محتوا انجام داد.
البته، اپلیکیشن های ویدیویی یک دوجین قیمت دارند. بنابراین چه چیزی رول را متفاوت می کند؟ به عنوان مثال، این برنامه برای موارد استفاده است که اکثر برنامه های دوربین این کار را نمی کنند. بوزدار می گوید – پسندیدن مصاحبه های ویدئویی از راه دور، پادکست های ویدئویی و توصیفات مشتری. در حالی که Zoom، Microsoft Teams و Google Meet نیاز را تا حدودی برطرف میکنند، Buzdar استدلال میکند که آنها برای تولید ویدیوی «با کیفیت بالا» طراحی نشدهاند.
Roll همچنین از تعدادی افکت بلادرنگ استفاده میکند تا (ظاهراً) طیف وسیعتری از انتخابهای پس از تولید را نسبت به اکثر برنامههای فیلمبرداری ارائه دهد. برای مثال، Roll در استاندارد HEVC ضبط میکند و تقریباً دو برابر نرخ بیت و کیفیت تصویر بالاتر را برای همان اندازه فایل ارائه میکند. و رول می تواند حداکثر دو عکس دوربین – یک عکس با زاویه باز و یک عکس نزدیک – را به طور همزمان ضبط و پردازش کند و به کاربران امکان می دهد ویدیوهایی با چشم اندازهای “چند دوربینی” ایجاد کنند.

رابط ویرایش رول.
مسلما، Multi-cam به خصوص منحصر به فرد نیست – رول با اولین برنامه ای که آن را ارائه می دهد فاصله زیادی دارد. ولی بوزدار می گوید جادو در پس پردازش است. رول از هوش مصنوعی مولد برای بازسازی اتاقها در فضای سهبعدی استفاده میکند تا سازندگان محتوا بتوانند یک دوربین مجازی شبیه به بازی ویدیویی را به اطراف حرکت دهند و حرکاتی مانند حرکت از یک طرف به سمت دیگر با یک دالی یا جرثقیل را شبیهسازی کنند.
“امروزه، هوش مصنوعی مولد اغلب با ایجاد محتوای جعلی از هوا مرتبط است.” بوزدار گفت. “یعنی فلسفه ما نیست ما پیکسل، افراد یا صحنه های جعلی تولید نمی کنیم. ما از هوش مصنوعی مولد صرفاً به عنوان ابزاری برای بهرهوری استفاده میکنیم – میخواهیم دسترسی به تولید ویدیو با کیفیت بالاتر را دموکراتیک کنیم.»
بوزدار توضیح داد که هوش مصنوعی رول برای درک عمق سه بعدی در یک صحنه آموزش دیده است و از داده ها برای اندازه گیری عمق و اشکال مستقل از فردی که در اتاق نشسته است استفاده می کند. رول شروع به آموزش الگوریتم های خود با مجموعه داده های منبع باز کرد که معمولاً برای محک زدن در دانشگاه استفاده می شود، اما سپس بیش از 22000 تماس ویدیویی را به صورت داخلی ضبط کرد و پایگاه داده غنی خود را ایجاد کرد.
نتایج نیمه بد نیستند – حداقل در فیلمهای آزمایشی آن بوزدار به من نشان داد. برخی از تابه های تولید شده توسط هوش مصنوعی رول، دره عجیب و غریب را باز می کنند، که نتیجه تاب خوردن غیر طبیعی اشیاء در پس زمینه است. همانطور که دوربین مجازی می چرخد. اما در صحنههای کوتاه، جلوههای هوش مصنوعی به اندازه کافی قانعکننده هستند – و افزودهای چشمگیر به آنچه در غیر این صورت یک مصاحبه از راه دور کسلکننده است.
“ما کمی در این مورد تحقیق کردهایم و ندیدهایم که کسی مانند ما از هوش مصنوعی استفاده کند – جفت کردن دادههای حسگر آیفون با مدلهای هوش مصنوعی بزرگ در فضای ابری. “فناوری ما قابلیت های اساسی برای شبیه سازی هر گونه جلوه های بصری که کاربر می خواهد را فراهم می کند.”

ضبط تماس با رول.
هر جلوه های بصری کمی کشدار به نظر می رسد. اما رول ترفندهای الگوریتمی واقعیتر دیگری نیز در آستین خود دارد. همانطور که Roll فیلم ضبط می کند، متادیتا را برای استفاده در مراحل بعدی تولید ویدئو جمع آوری می کند، از جمله شرایط ضبط و نور، فاصله دوربین تا سوژه و موقعیت صورت و بدن سوژه. این ابرداده برای تنظیم خودکار دوربین ها و حسگرهای گوشی و همچنین ارائه بازخورد و دستورالعمل برای ترکیب بندی و نور استفاده می شود.
مانند چند ویرایشگر ویدیوی موبایلی «با قابلیت هوش مصنوعی» دیگر در بازار، Roll همچنین از ابرداده برای ایجاد یک حلقه کاملاً واقعی و چند دوربینی در ابر ویرایش خود استفاده میکند – بدون نیاز به ویرایش دستی. (کاربران همچنان میتوانند زوایای دوربین را تغییر داده و تنظیم کنند یا حرکات دوربین و جلوههای بصری را در صورت تمایل اضافه کنند.) در آینده نزدیک، Roll میتواند مستقیماً در رسانههای اجتماعی از جمله TikTok، YouTube و Instagram منتشر کند – با وضوح مناسب و نسبت تصویر
“امروزه، تولید ویدئو به قطعات سخت افزاری و نرم افزاری زیادی برای تکمیل کامل نیاز دارد.” بوزدار گفت. ،با هر مرحله، وقتی فایل ویدیویی و صوتی از یک نرمافزار به نرمافزار دیگر پرش میکند، زمینه را از دست میدهد و به یک فایل «گنگ» تبدیل میشود که در اطراف پخش میشود. ما اساساً کل «پشته» تولید ویدیو را از ابتدا بازسازی کردهایم. با برش از مرزهای نرمافزار سنتی، ما از هوش مصنوعی برای ارائه تجربهای دگرگونکننده از عکسبرداری تا انتشار استفاده کردهایم که به صورت عمودی کل گردش کار تولید ویدیو از راه دور را یکپارچه و خودکار میکند.»
بنابراین، رول چگونه برای کسب درآمد برنامه ریزی می کند؟ این شرکت تاکنون پول نقد را از منابع سنتی VC جمع آوری کرده است – بوزدار دقیقاً نمی گوید کجا. اما از نظر درآمدزایی، Buzdar امیدوار است Roll در نهایت رشد کند تا نیازهای سازمانهای شرکتی را برآورده کند – بهویژه تیمهای بازاریابی شرکتی داخلی و تیمهای ویدیویی آنها، که نوعی هزینه برای خدمات Roll میپردازند.
“تولید ویدئو برای ایجاد اختلال از ابر آماده است.” بوزدار گفت. ،ویژگیهایی مانند اندازه فایلهای بزرگ، پردازش پیچیده و نیاز به ویرایشهای چند نفره و چرخههای بازبینی، آن را به گزینهای عالی برای برخورداری از مزایای نمایی از رایانش ابری مانند ذخیرهسازی مقیاسپذیر، هوش مصنوعی، محاسبه، و اشتراکگذاری و همکاری بلادرنگ تبدیل میکند.
مطمئنا حقیقتی در آن وجود دارد. در مورد اینکه آیا رول مختل کننده خواهد بود یا خیر، زمان مشخص خواهد کرد.