Dumme با پشتیبانی YC 3.4 میلیون دلار برای ویرایشگر ویدیوی هوش مصنوعی خود جمع آوری می کند که ویدیوهای طولانی یوتیوب را به Short تبدیل می کند.

Dumme، استارت‌آپی که هوش مصنوعی را در ویرایش ویدیو به کار می‌گیرد، پیش از اینکه به روی عموم باز شود، تقاضا ایجاد کرده است. شرکت تحت حمایت Y Combinator صدها سازنده ویدیو دارد که محصولش را آزمایش می‌کنند، که از هوش مصنوعی برای ایجاد ویدیوهای کوتاه از محتوای YouTube استفاده می‌کند و فهرست انتظاری با بیش از 20000 فیلم قبل از راه‌اندازی. با استفاده از ترکیبی از هر دو مدل اختصاصی و موجود هوش مصنوعی، وعده Dumme این است که نه تنها می‌تواند در زمان ویرایش صرفه‌جویی کند، بلکه – و این ادعای بزرگ آن است – کار بهتری نسبت به نیروی کار قراردادی (انسانی) انجام می‌دهد که معمولاً وظیفه‌ی ضعیف‌تری دارند. کارهای ویرایش ویدیو، مانند کاهش محتوای طولانی برای انتشار در پلتفرم های کوتاه مانند YouTube Shorts، TikTok یا Instagram Reels.

مروان درای بنیانگذار و مدیر عامل Dumme که در ژانویه 2022 تأسیس شد و یکی از شرکت‌کنندگان در برنامه شتابدهنده استارت‌آپ Y Combinator’s Winter 2022 بود، گفت که در ابتدا روی ساخت یک موتور جستجو برای ویدیو متمرکز بود. اما حدود شش ماه پیش، تیم متوجه شد که یک محصول بهتر ممکن است استفاده مجدد از همان مدل‌های هوش مصنوعی باشد که در حال توسعه برای ویرایش کلیپ‌های ویدیویی بودند.

ویل دالستروم (CPO) و جردن برانان (CTO) که همگی دارای پیشینه هوش مصنوعی هستند، درای متوجه شد که Dumme ممکن است پس از ویروسی شدن برنامه آنها در بازار محصول مناسبی پیدا کرده باشد و سرورهای آنها را خراب کند.

درای توضیح می‌دهد: «ما واقعاً انتظار نداشتیم که کشش زیادی یا هر چیز دیگری داشته باشد، بنابراین فقط چیزی را در آنجا قرار دادیم. “سپس اتفاقی که افتاد این بود که یک شبه، ما با سرورهای پربار از خواب بیدار شدیم – مثل اینکه هیچ چیز واقعاً کار نکرد. بنابراین ما همه چیز را حذف کردیم و در واقع نوعی لیست انتظار را جمع آوری کردیم. صبح روز بعد، احتمالاً 5000 نفر در آنجا بیدار شدیم، که جالب بود.

تیم بعداً متوجه شد که یکی از خالقان TikTok ویدیوی کوتاهی در مورد این محصول ارسال کرده است که سیل ترافیکی را به سایت آنها فرستاد.

درای خاطرنشان می کند: «در واقع هرگز از آن آرام نشد.

این محصول که «دوممی» تلفظ می‌شود، برای سازندگان جذابیت داشت، زیرا هدف آن ساده‌سازی و سرعت بخشیدن به کار مربوط به ویرایش ویدیو بود.

اعتبار تصویر: احمق

استفاده از Dumme همانطور که از نامش پیداست ساده است. برای شروع، کاربر پیوند یک ویدیوی یوتیوب را جای‌گذاری می‌کند، سپس روی «تولید» کلیک می‌کند و هوش مصنوعی تعدادی ویدیوی کوتاه را به نمایش می‌گذارد که نکات برجسته آن محتوای دریافت‌شده را به نمایش می‌گذارد. این شرکت می‌گوید از یوتیوب به‌عنوان منبع استفاده می‌کند، به‌جای پشتیبانی از فیلم‌های ویدئویی خام، به منظور برون‌سپاری تعدیل محتوا – یعنی اگر در YouTube مجاز است، در Dumme مجاز است.

زمان پردازش و تعداد کلیپ های حاصل به طول ویدیوی اصلی بستگی دارد.

اما به‌عنوان مثال، پردازش یک پادکست ویدیویی یک ساعته ممکن است حدود 20 دقیقه طول بکشد و بعد از حدود پنج دقیقه شروع به دریافت کلیپ‌ها خواهید کرد. پس از تکمیل، سازندگان می‌توانند کلیپ‌های ویدیویی را که به‌طور پیش‌فرض کمتر از 60 ثانیه هستند دانلود کرده و آن‌ها را در هر پلتفرمی که از محتوای کوتاه‌مدت پشتیبانی می‌کند، مانند YouTube Shorts، و همچنین پلتفرم‌های دیگر، مانند Reels یا TikTok، آپلود کنند.

اعتبار تصویر: احمق

این که چگونه این همه در backend کار می کند، البته بسیار پیچیده تر است. این شرکت می‌گوید که در ابتدا Dumme تا جایی که بتواند از ویدیوی منبع از طریق ابرداده یاد می‌گیرد. سپس ویدیو را رونویسی می‌کند و سعی می‌کند معنایی را که گفته می‌شود درک کند، در حالی که به فریم‌ها نگاه می‌کند تا سعی کند احساسات فردی را که صحبت می‌کند رمزگشایی کند. این یافته‌ها با هم مرتبط هستند و به یک مدل زبانی منتقل می‌شوند که تلاش می‌کند تعیین کند چه بخش‌هایی از ویدیو ارزش برش را دارند. سپس به مدل دیگری که بلندگوهای فعال را ردیابی می کند و برش را کنترل می کند، واگذار می شود.

Dumme می‌گوید که با مدل‌های موجود هوش مصنوعی مانند GPT-4، یک نسخه تنظیم‌شده دقیق از Whisper، و سایر مدل‌هایی که در داخل خود ساخته است، کار می‌کند – مانند مدلی که بلندگوهای فعال را در یک قاب ویدیو ردیابی می‌کند. یکی از مدل‌های آن نیز روی دسته‌ای از شورت‌های یوتیوب آموزش دیده است تا بیاموزد که چه چیزی باعث ایجاد یک قلاب باز خوب برای جذب بینندگان می‌شود. برای درک بهتر زمینه ویدیو

این شرکت به ما می‌گوید که کار هوش مصنوعی بر روی CoreWeave ارائه‌دهنده GPU Cloud انجام می‌شود، نه AWS، زیرا مقرون به صرفه‌تر است.

از آنجایی که Dumme به هوش مصنوعی متکی است که کلمات گفته شده را پردازش می کند، این فناوری برای مواردی مانند ویدیوهای گیم پلی طولانی یا مواردی که مردم در آن صحبت نمی کنند مناسب نیست. Drai می‌گوید این استارت‌آپ در ابتدا سازندگان، پادکست‌ها و آژانس‌های یوتیوب را هدف قرار می‌دهد – آنها معتقدند که دومی بهترین گزینه برای کسب درآمد از محصول است.

اعتبار تصویر: احمق

درای توضیح می‌دهد که آژانس‌ها امروزه اغلب این نوع کارها را با نتایجی برون‌سپاری می‌کنند.

“آنها فقط به پیمانکاران در حوزه های قضایی ارزان قیمت می دهند تا محتوای خود را ویرایش کنند. و مشکل این است که هنوز در واقع بسیار گران است و زمان زیادی را صرف می کند – هفته ها طول می کشد، نه چند دقیقه.

دری در پاسخ به این سوال که در مورد ایجاد فناوری که در واقع مردم را بیکار می کند چه احساسی دارد، نگران نبود.

طرز فکر من در مورد آن این است که، در نهایت … فکر می کنم این مانند این است که به من بگویید معلمان ریاضی می خواهند [be put] بیکار چون چیزی به نام ماشین حساب وجود دارد…» او توضیح می دهد. «مردم قرار است خود را وفق دهند. و سپس کسی در مورد ماشین حساب به شما آموزش می دهد، درست است؟ بنابراین من فکر می‌کنم که فقط مسئله سازگاری با این موضوع است.» درای می‌گوید.

در حال حاضر، قیمت‌هایی که در نظر گرفته می‌شوند شامل سطوحی است که یک کسب‌وکار باید 0.40 دلار به ازای هر دقیقه ویدیوی پردازش شده بپردازد، در حالی که سازندگان کوچک‌تر ممکن است اشتراک ماهانه‌ای را انتخاب کنند که حداکثر 10 ساعت محتوا در ماه است. (این اعداد ممکن است تغییر کنند.) در طول آزمایش، استفاده از محصول رایگان بوده است.

پذیرندگان اولیه از Dumme برای ویرایش‌های مختلف استفاده می‌کردند، از جمله تولید کلیپ‌هایی از پادکست‌های ویدیویی خود برای انتشار در Shorts، و همچنین کاهش سایر ویدیوهای جدید و مرور کاتالوگ‌های پشتیبان آن‌ها.

به نظر می رسد این محصول با سایر فناوری های هوش مصنوعی موجود در بازار رقابت کند، از جمله فناوری ساخت شرکت Jellysmack، که از هوش مصنوعی برای تبدیل ویدیوهای طولانی تر YouTube به ویدیوهای کوتاه تر، با برش، تغییر اندازه و بهینه سازی آنها برای پلتفرم های خاص استفاده می کند. نتیجه خرید کاموا در سال 2021. ابزارهای دیگری که کارهای مشابه را انجام می دهند شامل مواردی مانند Opus Clip، Vidyo.ai، Detail، TubeBuddy، Wisecut و موارد دیگر است. اینکه Dumme تا چه اندازه موفق یا شکست می‌خورد، به عملکرد بهتر از رقبا در کیفیت کار و هزینه بستگی دارد – معیارهایی که هنوز مشخص نشده‌اند.

اما برخی از سرمایه گذاران شرط های خود را روی Dumme قرار می دهند. قبل از راه‌اندازی، این استارت‌آپ سرمایه ۳.۴ میلیون دلاری را از Y Combinator، Caffeinated Capital، Max و Nellie Levchin (از طریق SciFi VC)، سهیل دوشی، نیکو چینوت، Protocol Labs، Chris Puscasiu و دیگر فرشتگان جمع‌آوری کرد.

با توجه به علاقه و لیست انتظار قابل توجه، Dumme می گوید که قصد دارد هر هفته حدود 500 نفر را سوار کند. خوانندگان TechCrunch می‌توانند با استفاده از کد دعوت TECHCRUNCH تا زمانی که شکاف‌ها تمام شود، از خط عبور کنند.