Meta korzystała z torrentów. Terabajty pirackich książek nielegalnie pobierane dla AI
Cóż, sztuczna inteligencja nie wyszkoli się sama, prawda?
Jeśli kiedykolwiek mieliście wątpliwości co do tego, że korporacje pozyskują dane do szkolenia swoich modeli sztucznej inteligencji ze wszelkich możliwych źródeł, wliczając w to te o wątpliwej reputacji (i legalności), to tocząca się w sprawie Mety sprawa zdaje się wyjaśniać wszelkie potencjalne niedopowiedzenia w tym temacie. Jak się bowiem okazuje, pracownicy koncernu otrzymali zadanie przeczesania sieci, w tym "cienistych bibliotek", czyli repozytoriów pirackich książek i artykułów naukowych, celem pozyskania możliwie największej liczby materiałów mających posłużyć jako pokarm dla AI.
Meta oskarżona o korzystanie z torrentów podczas ściągania materiałów dla AI
Sądowe dokumenty jasno wskazują na to, że amerykańska korporacja pobrała przeszło 80 terabajtów danych z miejsc pokroju Z-library i LibGen. Zaznaczono przy tym, że przedstawiciele firmy nie mieli wątpliwości co do tego, że ściąganie treści z takich miejsc jest równoznaczne z piractwem, jednakże przedsiębiorstwo postanowiło przymknąć oko na ten proceder i dać swoim pracownikom zielone światło do dalszego działania.
Co ciekawe, wiele osób oddelegowanych do prowadzenia tego procederu miało wątpliwości co do jego słuszności i dzieliło się swoimi przemyśleniami ze współpracownikami. W wewnętrznych wiadomościach e-mail, do których dostęp uzyskał wymiar sprawiedliwości, można znaleźć takie fragmenty jak "pobieranie torrentów z firmowego laptopa nie wydaje się właściwe" lub "korzystanie z materiałów pirackich powinno wykraczać poza nasz próg etyczny"
Ba, jeden z badaczy działających w obrębie Mety poinformował, że koncern postanowił przejść w swoisty "tryb incognito" i pobierać torrenty wyłącznie poza oficjalnymi serwerami Facebooka, aby uniknąć namierzenia. Mimo wszystko korporacji należy oddać to, że korzystała z sieci P2P nie tylko do pobierania, ale również i do udostępniania, a więc bez wątpienia sprawiła miłą niespodziankę kilku innym kolekcjonerom książek o wątpliwym z prawnego punktu widzenia pochodzeniu.
Zuckerberg wiedział
Na koniec podkreślono, że kierownictwo giganta technologicznego, wliczając w to Marka Zuckerberga, było w pełni świadome tego, skąd jego pracownicy ściągają materiały i, co więcej, samo ten pomysł forsowało. W mailach wysyłanych pomiędzy pracownikami dokopano się do jeszcze jednej ciekawostki, a mianowicie – powszechnie wierzono, że OpenAI również "pożycza" sobie treści pochodzące z nielegalnych bibliotek. Na ten moment jednak to Meta, a nie Sam Altman i reszta, musi bronić się przed zarzutami w sądzie. Na zwieńczenie rzeczonej sprawy prawdopodobnie przyjdzie nam jeszcze trochę poczekać.