Cóż, sztuczna inteligencja nie wyszkoli się sama, prawda?
Jeśli kiedykolwiek mieliście wątpliwości co do tego, że korporacje pozyskują dane do szkolenia swoich modeli sztucznej inteligencji ze wszelkich możliwych źródeł, wliczając w to te o wątpliwej reputacji (i legalności), to tocząca się w sprawie Mety sprawa zdaje się wyjaśniać wszelkie potencjalne niedopowiedzenia w tym temacie. Jak się bowiem okazuje, pracownicy koncernu otrzymali zadanie przeczesania sieci, w tym „cienistych bibliotek”, czyli repozytoriów pirackich książek i artykułów naukowych, celem pozyskania możliwie największej liczby materiałów mających posłużyć jako pokarm dla AI.
Sądowe dokumenty jasno wskazują na to, że amerykańska korporacja pobrała przeszło 80 terabajtów danych z miejsc pokroju Z-library i LibGen. Zaznaczono przy tym, że przedstawiciele firmy nie mieli wątpliwości co do tego, że ściąganie treści z takich miejsc jest równoznaczne z piractwem, jednakże przedsiębiorstwo postanowiło przymknąć oko na ten proceder i dać swoim pracownikom zielone światło do dalszego działania.
Co ciekawe, wiele osób oddelegowanych do prowadzenia tego procederu miało wątpliwości co do jego słuszności i dzieliło się swoimi przemyśleniami ze współpracownikami. W wewnętrznych wiadomościach e-mail, do których dostęp uzyskał wymiar sprawiedliwości, można znaleźć takie fragmenty jak „pobieranie torrentów z firmowego laptopa nie wydaje się właściwe” lub „korzystanie z materiałów pirackich powinno wykraczać poza nasz próg etyczny”
Ba, jeden z badaczy działających w obrębie Mety poinformował, że koncern postanowił przejść w swoisty „tryb incognito” i pobierać torrenty wyłącznie poza oficjalnymi serwerami Facebooka, aby uniknąć namierzenia. Mimo wszystko korporacji należy oddać to, że korzystała z sieci P2P nie tylko do pobierania, ale również i do udostępniania, a więc bez wątpienia sprawiła miłą niespodziankę kilku innym kolekcjonerom książek o wątpliwym z prawnego punktu widzenia pochodzeniu.
Na koniec podkreślono, że kierownictwo giganta technologicznego, wliczając w to Marka Zuckerberga, było w pełni świadome tego, skąd jego pracownicy ściągają materiały i, co więcej, samo ten pomysł forsowało. W mailach wysyłanych pomiędzy pracownikami dokopano się do jeszcze jednej ciekawostki, a mianowicie – powszechnie wierzono, że OpenAI również „pożycza” sobie treści pochodzące z nielegalnych bibliotek. Na ten moment jednak to Meta, a nie Sam Altman i reszta, musi bronić się przed zarzutami w sądzie. Na zwieńczenie rzeczonej sprawy prawdopodobnie przyjdzie nam jeszcze trochę poczekać.
0 komentarzy