اختلافات قانونی بین هنرمندان و شرکتهایی که هوش مصنوعی را روی آثار هنری خود آموزش میدهند، هیچ نشانهای از کاهش پیدا نمیکند.
در طی چند ماه، چندین پرونده قضایی بر سر فناوری هوش مصنوعی مولد از شرکتهایی از جمله OpenAI و Stability AI مطرح شد که توسط شاکیانی مطرح شد که ادعا میکنند دادههای دارای حق چاپ – عمدتاً آثار هنری – بدون اجازه آنها برای آموزش مدلهای مولد استفاده شده است. مدلهای هوش مصنوعی مولد با «آموزش» روی نمونههای تصاویر و متن، که معمولاً بهطور نامحسوس از وب حذف میشوند، خلق هنر، کد و موارد دیگر را «یاد میگیرند».
جردن مایر و متیو درایهورست در تلاش برای اعطای کنترل بیشتر بر نحوه – و مکان – استفاده از هنرشان، استارتاپ Spawning AI را تأسیس کردند. Spawning HaveIBeenTrained را ایجاد کرد، وبسایتی که به سازندگان اجازه میدهد از مجموعه دادههای آموزشی برای یک مدل هوش مصنوعی تولیدکننده هنر، Stable Diffusion v3، که قرار است در ماههای آینده منتشر شود، انصراف دهند.
از ماه مارس، هنرمندان از HaveIbeenTrained برای حذف 80 میلیون اثر هنری از مجموعه آموزشی Stable Diffusion استفاده کرده بودند. در اواخر آوریل، این رقم به یک میلیارد رسیده بود.
با افزایش تقاضا برای خدمات Spawning، شرکت – که تا آن زمان به طور کامل راه اندازی شده بود – به دنبال سرمایه گذاری خارجی بود. و آن را دریافت کرد. Spawning امروز اعلام کرد که 3 میلیون دلار در یک دور اولیه به رهبری True Ventures با مشارکت Seed Club Ventures، Abhay Parasnis، Charles Songhurst، Balaji Srinivisan، Jacob.eth و Noise DAO جمع آوری کرده است..
مایر در صحبت با TechCrunch از طریق ایمیل گفت که این بودجه به Spawning اجازه می دهد تا به توسعه استانداردهای IP برای هوش مصنوعی عصر» و استانداردهای قوی تری برای انصراف و انتخاب کردن ایجاد کنید.
ما مشتاق پتانسیل هستیم هوش مصنوعی ابزار سازی ما تخصص دامنه را در این زمینه از علاقه مندی به فرصت های جدید توسعه دادیم هوش مصنوعی به سازندگان ارائه می دهد، اما احساس می کنید که رضایت یک لایه اساسی برای ایجاد این پیشرفت ها چیزی است که همه می توانند نسبت به آن احساس خوبی داشته باشند.
معیارهای تخم ریزی برای خود صحبت می کنند. واضح است که از هنرمندان خواسته می شود تا در مورد نحوه استفاده (یا خراشیده شدن) هنرشان بیشتر اظهار نظر کنند. اما فراتر از مشارکت با پلتفرمهای هنری مانند Shutterstock و ArtStation، Spawning نتوانسته است صنعت را حول یک استاندارد انصراف یا منشأ مشترک جمع کند.
Adobe که اخیراً ابزارهای هوش مصنوعی مولد را معرفی کرده است، مکانیسمها و ابزارهای انصراف خود را دنبال میکند. DeviantArt نیز همینطور است، که در ماه نوامبر حفاظتی را راهاندازی کرد که بر تگهای HTML متکی است تا رباتهای نرمافزاری را که صفحات تصاویر را میخزند، از دانلود آن تصاویر برای مجموعههای آموزشی منع کند. OpenAI، غول مولد هوش مصنوعی در اتاق، هنوز ابزاری برای انصراف ارائه نمی دهد – و همچنین برنامه های خود را به زودی اعلام نکرده است.
تخم ریزی همچنین به دلیل غیرشفاف بودن – و مبهم بودن – فرآیند انصراف آن مورد انتقاد قرار گرفته است. همانطور که Ars Technica در مقاله اخیر خود اشاره کرده است، به نظر نمیرسد که فرآیند انصراف با تعریف رضایت برای استفاده از دادههای شخصی در مقررات عمومی حفاظت از دادههای اروپا، که بیان میکند رضایت باید به طور فعال داده شود، نه به طور پیشفرض، مطابقت داشته باشد. همچنین مشخص نیست که Spawning چگونه قصد دارد هویت هنرمندانی را که درخواست انصراف میدهند به صورت قانونی تأیید کند – یا در واقع آیا اصلاً قصد انجام این کار را دارد.
راه حل تخم ریزی چند وجهی است. اولاً، قصد دارد کار مربیان مدل هوش مصنوعی را آسانتر کند تا درخواستهای انصراف را رعایت کنند و روند را برای سازندگان سادهتر کند. مایر میگوید سپس، Spawning خدمات بیشتری را به سازمانهایی که به دنبال محافظت از آثار هنرمندان خود هستند، ارائه میکند.
او افزود: «ما میخواهیم یک لایه رضایت برای هوش مصنوعی بسازیم، که احساس میکنیم یک زیرساخت اساسی در حرکت رو به جلو خواهد بود.» ما قصد داریم رشد کنیم تخم ریزی برای رسیدگی به بسیاری از دامنه های مختلف که توسط هوش مصنوعی اقتصاد، زیرا هر حوزه نیازهای خاص خود را دارد.
در اولین گام به سوی این چشمانداز بلندپروازانه، Spawning در ماه مارس «انصرافهای دامنه» را فعال کرد و به سازندگان و شرکای محتوا این امکان را داد که به سرعت محتوا را از کل وبسایتها انصراف دهند. Spawning می گوید که تا به امروز 30000 دامنه در این سیستم ثبت شده است.
آوریل نشانگر انتشار یک API و بسته منبع باز پایتون خواهد بود که وسعت محتوایی را که Spawning لمس می کند، به میزان زیادی گسترش می دهد. قبلاً، درخواستهای انصراف از طریق Spawning فقط برای مجموعه داده LAION-5B اعمال میشد – مجموعه دادهای که برای آموزش Stable Diffusion استفاده میشود. از ماه آوریل، هر وبسایت، برنامه یا سرویسی میتواند از API Spawning استفاده کند تا بهطور خودکار از انصرافها نه تنها برای دادههای تصویر، بلکه برای متن، صدا، ویدیو و موارد دیگر پیروی کند.
مایر می گوید که Spawning هر روش انصراف جدیدی (مثلاً Adobe و DeviantArt) را در بسته Python خود برای مربیان مدل جمع می کند، با هدف کاهش تعداد حساب هایی که سازندگان مدل باید مدیریت کنند تا با درخواست های انصراف مطابقت کنند. .
برای افزایش دید، Spawning با Hugging Face، یکی از پلتفرمهای بزرگتر برای میزبانی و اجرای مدلهای هوش مصنوعی، همکاری میکند تا جعبه اطلاعات جدیدی را در Hugging Face اضافه کند که کاربران را از نسبت دادههای «انصرافی» در متن آگاه میکند. مجموعه های داده به تصویر این کادر همچنین به صفحه ثبت نام Spawning API پیوند میخورد تا مربیان مدل بتوانند تصاویر انصراف داده شده را در زمان آموزش حذف کنند.
مایر گفت: «ما احساس میکنیم زمانی که شرکتها و توسعهدهندگان بدانند که گزینه احترام به خواستههای سازندگان در دسترس است، دلیل کمی برای عدم احترام به آنها وجود دارد. “ما در مورد آینده مولد هیجان زده هستیم هوش مصنوعی، اما سازندگان و سازمان ها به طور یکسان نیاز به استانداردهایی دارند تا داده هایشان به نفع آنها کار کند.»
با نگاهی به آینده، Spawning قصد دارد یک ویژگی تشخیص «دقیق تکراری» را منتشر کند تا تصاویر منتفی شده را با کپیهایی که پلتفرم در سرتاسر وب پیدا میکند مطابقت دهد، و به دنبال آن یک ویژگی تشخیص «تقریباً تکراری» برای اطلاع هنرمندان در صورت یافتن کپیهای احتمالی از Spawning ارائه کند. کار آنها برش خورده، فشرده شده یا اندکی اصلاح شده است.
فراتر از آن، برنامههایی برای یک برنامه افزودنی کروم وجود دارد که به سازندگان اجازه میدهد از کارهای ارسالی خود در هر نقطه از وب و جستجوی زیرنویس در وبسایت HaveIBeenTrained برای جستجوی مستقیم توضیحات تصویر، انصراف دهند. ابزار جستجوی فعلی سایت فقط از تطابق تقریبی بین متن و تصاویر و همچنین جستجوهای URL برای یافتن محتوای میزبانی شده در وب سایت های خاص استفاده می کند.
Spawning – که اکنون در اختیار سرمایه گذاران است – قصد دارد با ایجاد خدمات در بالای زیرساخت محتوای خود درآمد کسب کند، اگرچه Meyer چیز زیادی را فاش نمی کند. باید دید که این موضوع چگونه برای سازندگان محتوا خواهد بود.
ما با تعداد زیادی از سازمانها صحبت کردهایم، در حالی که بسیاری از گفتگوها برای اعلام زودهنگام هستند، و فکر میکنیم که اعلام بودجه ما و افزایش دید ما به نوعی تضمین میکند که آنچه میسازیم استانداردی قوی و قابل اعتماد برای کار کردن است. مایر گفت. پس از تکمیل این ویژگیها، شروع به ساخت زیرساخت برای پشتیبانی از مجموعه دادههای بیشتر – از جمله موسیقی، ویدئو و متن خواهیم کرد.