Spawning برنامه‌هایی را ارائه می‌کند که به سازندگان اجازه می‌دهد از آموزش هوش مصنوعی مولد منصرف شوند

اختلافات قانونی بین هنرمندان و شرکت‌هایی که هوش مصنوعی را روی آثار هنری خود آموزش می‌دهند، هیچ نشانه‌ای از کاهش پیدا نمی‌کند.

در طی چند ماه، چندین پرونده قضایی بر سر فناوری هوش مصنوعی مولد از شرکت‌هایی از جمله OpenAI و Stability AI مطرح شد که توسط شاکیانی مطرح شد که ادعا می‌کنند داده‌های دارای حق چاپ – عمدتاً آثار هنری – بدون اجازه آنها برای آموزش مدل‌های مولد استفاده شده است. مدل‌های هوش مصنوعی مولد با «آموزش» روی نمونه‌های تصاویر و متن، که معمولاً به‌طور نامحسوس از وب حذف می‌شوند، خلق هنر، کد و موارد دیگر را «یاد می‌گیرند».

جردن مایر و متیو درایهورست در تلاش برای اعطای کنترل بیشتر بر نحوه – و مکان – استفاده از هنرشان، استارتاپ Spawning AI را تأسیس کردند. Spawning HaveIBeenTrained را ایجاد کرد، وب‌سایتی که به سازندگان اجازه می‌دهد از مجموعه داده‌های آموزشی برای یک مدل هوش مصنوعی تولیدکننده هنر، Stable Diffusion v3، که قرار است در ماه‌های آینده منتشر شود، انصراف دهند.

از ماه مارس، هنرمندان از HaveIbeenTrained برای حذف 80 میلیون اثر هنری از مجموعه آموزشی Stable Diffusion استفاده کرده بودند. در اواخر آوریل، این رقم به یک میلیارد رسیده بود.

با افزایش تقاضا برای خدمات Spawning، شرکت – که تا آن زمان به طور کامل راه اندازی شده بود – به دنبال سرمایه گذاری خارجی بود. و آن را دریافت کرد. Spawning امروز اعلام کرد که 3 میلیون دلار در یک دور اولیه به رهبری True Ventures با مشارکت Seed Club Ventures، Abhay Parasnis، Charles Songhurst، Balaji Srinivisan، Jacob.eth و Noise DAO جمع آوری کرده است..

مایر در صحبت با TechCrunch از طریق ایمیل گفت که این بودجه به Spawning اجازه می دهد تا به توسعه استانداردهای IP برای هوش مصنوعی عصر» و استانداردهای قوی تری برای انصراف و انتخاب کردن ایجاد کنید.

ما مشتاق پتانسیل هستیم هوش مصنوعی ابزار سازی ما تخصص دامنه را در این زمینه از علاقه مندی به فرصت های جدید توسعه دادیم هوش مصنوعی به سازندگان ارائه می دهد، اما احساس می کنید که رضایت یک لایه اساسی برای ایجاد این پیشرفت ها چیزی است که همه می توانند نسبت به آن احساس خوبی داشته باشند.

معیارهای تخم ریزی برای خود صحبت می کنند. واضح است که از هنرمندان خواسته می شود تا در مورد نحوه استفاده (یا خراشیده شدن) هنرشان بیشتر اظهار نظر کنند. اما فراتر از مشارکت با پلتفرم‌های هنری مانند Shutterstock و ArtStation، Spawning نتوانسته است صنعت را حول یک استاندارد انصراف یا منشأ مشترک جمع کند.

Adobe که اخیراً ابزارهای هوش مصنوعی مولد را معرفی کرده است، مکانیسم‌ها و ابزارهای انصراف خود را دنبال می‌کند. DeviantArt نیز همین‌طور است، که در ماه نوامبر حفاظتی را راه‌اندازی کرد که بر تگ‌های HTML متکی است تا ربات‌های نرم‌افزاری را که صفحات تصاویر را می‌خزند، از دانلود آن تصاویر برای مجموعه‌های آموزشی منع کند. OpenAI، غول مولد هوش مصنوعی در اتاق، هنوز ابزاری برای انصراف ارائه نمی دهد – و همچنین برنامه های خود را به زودی اعلام نکرده است.

تخم ریزی همچنین به دلیل غیرشفاف بودن – و مبهم بودن – فرآیند انصراف آن مورد انتقاد قرار گرفته است. همانطور که Ars Technica در مقاله اخیر خود اشاره کرده است، به نظر نمی‌رسد که فرآیند انصراف با تعریف رضایت برای استفاده از داده‌های شخصی در مقررات عمومی حفاظت از داده‌های اروپا، که بیان می‌کند رضایت باید به طور فعال داده شود، نه به طور پیش‌فرض، مطابقت داشته باشد. همچنین مشخص نیست که Spawning چگونه قصد دارد هویت هنرمندانی را که درخواست انصراف می‌دهند به صورت قانونی تأیید کند – یا در واقع آیا اصلاً قصد انجام این کار را دارد.

راه حل تخم ریزی چند وجهی است. اولاً، قصد دارد کار مربیان مدل هوش مصنوعی را آسان‌تر کند تا درخواست‌های انصراف را رعایت کنند و روند را برای سازندگان ساده‌تر کند. مایر می‌گوید سپس، Spawning خدمات بیشتری را به سازمان‌هایی که به دنبال محافظت از آثار هنرمندان خود هستند، ارائه می‌کند.

او افزود: «ما می‌خواهیم یک لایه رضایت برای هوش مصنوعی بسازیم، که احساس می‌کنیم یک زیرساخت اساسی در حرکت رو به جلو خواهد بود.» ما قصد داریم رشد کنیم تخم ریزی برای رسیدگی به بسیاری از دامنه های مختلف که توسط هوش مصنوعی اقتصاد، زیرا هر حوزه نیازهای خاص خود را دارد.

در اولین گام به سوی این چشم‌انداز بلندپروازانه، Spawning در ماه مارس «انصراف‌های دامنه» را فعال کرد و به سازندگان و شرکای محتوا این امکان را داد که به سرعت محتوا را از کل وب‌سایت‌ها انصراف دهند. Spawning می گوید که تا به امروز 30000 دامنه در این سیستم ثبت شده است.

آموزش دیده اند

ابزار Spawning به هنرمندان اجازه می‌دهد از آموزش هوش مصنوعی مولد منصرف شوند.

آوریل نشانگر انتشار یک API و بسته منبع باز پایتون خواهد بود که وسعت محتوایی را که Spawning لمس می کند، به میزان زیادی گسترش می دهد. قبلاً، درخواست‌های انصراف از طریق Spawning فقط برای مجموعه داده LAION-5B اعمال می‌شد – مجموعه داده‌ای که برای آموزش Stable Diffusion استفاده می‌شود. از ماه آوریل، هر وب‌سایت، برنامه یا سرویسی می‌تواند از API Spawning استفاده کند تا به‌طور خودکار از انصراف‌ها نه تنها برای داده‌های تصویر، بلکه برای متن، صدا، ویدیو و موارد دیگر پیروی کند.

مایر می گوید که Spawning هر روش انصراف جدیدی (مثلاً Adobe و DeviantArt) را در بسته Python خود برای مربیان مدل جمع می کند، با هدف کاهش تعداد حساب هایی که سازندگان مدل باید مدیریت کنند تا با درخواست های انصراف مطابقت کنند. .

برای افزایش دید، Spawning با Hugging Face، یکی از پلتفرم‌های بزرگ‌تر برای میزبانی و اجرای مدل‌های هوش مصنوعی، همکاری می‌کند تا جعبه اطلاعات جدیدی را در Hugging Face اضافه کند که کاربران را از نسبت داده‌های «انصرافی» در متن آگاه می‌کند. مجموعه های داده به تصویر این کادر همچنین به صفحه ثبت نام Spawning API پیوند می‌خورد تا مربیان مدل بتوانند تصاویر انصراف داده شده را در زمان آموزش حذف کنند.

مایر گفت: «ما احساس می‌کنیم زمانی که شرکت‌ها و توسعه‌دهندگان بدانند که گزینه احترام به خواسته‌های سازندگان در دسترس است، دلیل کمی برای عدم احترام به آنها وجود دارد. “ما در مورد آینده مولد هیجان زده هستیم هوش مصنوعی، اما سازندگان و سازمان ها به طور یکسان نیاز به استانداردهایی دارند تا داده هایشان به نفع آنها کار کند.»

با نگاهی به آینده، Spawning قصد دارد یک ویژگی تشخیص «دقیق تکراری» را منتشر کند تا تصاویر منتفی شده را با کپی‌هایی که پلتفرم در سرتاسر وب پیدا می‌کند مطابقت دهد، و به دنبال آن یک ویژگی تشخیص «تقریباً تکراری» برای اطلاع هنرمندان در صورت یافتن کپی‌های احتمالی از Spawning ارائه کند. کار آنها برش خورده، فشرده شده یا اندکی اصلاح شده است.

فراتر از آن، برنامه‌هایی برای یک برنامه افزودنی کروم وجود دارد که به سازندگان اجازه می‌دهد از کارهای ارسالی خود در هر نقطه از وب و جستجوی زیرنویس در وب‌سایت HaveIBeenTrained برای جستجوی مستقیم توضیحات تصویر، انصراف دهند. ابزار جستجوی فعلی سایت فقط از تطابق تقریبی بین متن و تصاویر و همچنین جستجوهای URL برای یافتن محتوای میزبانی شده در وب سایت های خاص استفاده می کند.

Spawning – که اکنون در اختیار سرمایه گذاران است – قصد دارد با ایجاد خدمات در بالای زیرساخت محتوای خود درآمد کسب کند، اگرچه Meyer چیز زیادی را فاش نمی کند. باید دید که این موضوع چگونه برای سازندگان محتوا خواهد بود.

ما با تعداد زیادی از سازمان‌ها صحبت کرده‌ایم، در حالی که بسیاری از گفتگوها برای اعلام زودهنگام هستند، و فکر می‌کنیم که اعلام بودجه ما و افزایش دید ما به نوعی تضمین می‌کند که آنچه می‌سازیم استانداردی قوی و قابل اعتماد برای کار کردن است. مایر گفت. پس از تکمیل این ویژگی‌ها، شروع به ساخت زیرساخت برای پشتیبانی از مجموعه داده‌های بیشتر – از جمله موسیقی، ویدئو و متن خواهیم کرد.