Nvidia, Apple, Anthropic i Salesforce uczyły swoje AI na filmach z YouTube. Oczywiście bez zgody zarówno twórców jak i samego portalu.
Zgodnie z nowym śledztwem przeprowadzonym przez niezależne studio informacyjne Proof oraz Wired, firmy takie jak Nvidia, Apple, Anthropic i Salesforce korzystają z transkrypcji filmów z YouTube do trenowania swoich narzędzi AI. Samo to jest już dość oburzające i trudne do zaakceptowania. Tymczasem smaczku dodaje fakt, że robiły to bez zgody zarówno twórców jak i samego YouTube’a.
Modele sztucznej inteligencji wymagają ogromnych ilości danych do treningu modeli, co często odbywa się kosztem twórców i artystów, którzy nie otrzymują za to wynagrodzenia. Wspomniane firmy używają zbioru danych AI o nazwie YouTube Subtitles, który zawiera 173 000 transkrypcji filmów z prawie 50 000 kanałów. Znajdują się tam co ciekawe między innymi teledyski chronione prawem autorskim. Chociażby takie jak te na kanałach Vevo Katy Perry i Taylor Swift.
Sprawdź: Prompt engineering – co to jest?
YouTube Subtitles jest częścią większego zbioru danych o nazwie „The Pile”, opracowanego przez startup AI EleutherAI i udostępnionego w 2021 roku. EleutherAI przyznało, że zestaw danych YouTube Subtitles powstał dzięki nieoficjalnemu interfejsowi API. To taki skrót myślowy dla „bez zgody kogokolwiek”.
Apple potwierdziło, że jego OpenELM jest trenowany na The Pile, podobnie jak model AI Salesforce. Podobne potwierdzenie uzyskano od Salesforce, a Nvidia odmawia na razie komentarza w tej sprawie. Na początku tego roku Nvidia została pozwana przez grupę autorów za wykorzystanie The Pile, którego sekcja „Books3” zawiera ich powieści. Ponownie – wykorzystane bez ich zgody.
Zobacz też:
Nvidia i AMD nie wypuszczą nowych kart graficznych w tym roku
Vision Pro to największa porażka Apple od wielu lat
Microsoft stworzył za dobre AI – boją się je udostępniać