Reddit kontra Perplexity. Gigant AI pozwany za zbieranie danych

Perplexity jest kolejną firmą, którą Reddit oskarżył o nieupoważnione zbieranie danych i pozwał. Sprawa trafiła do sądu federalnego w Nowym Jorku i w nim też zapadnie wyrok, na który przyjdzie nam nieco poczekać.

Złożony przez Reddita pozew wpłynął w minioną środę, tj. 22 października, do sądu federalnego w Nowym Jorku. Popularna platforma oskarżyła firmę Perplexity oraz trzy inne o nieupoważnione zbieranie danych celem szkolenia modeli sztucznej inteligencji. Nie jest to przy tym pierwszy raz, kiedy Reddit wkracza na wojenną ścieżkę przeciw przedsiębiorstwom zajmującym się AI. W czerwcu serwis zdecydował się na podobne posunięcie w stosunku do Anthropic, a sprawa jest wciąż rozpatrywana i nie zanosi się, aby miała znaleźć zwieńczenie w najbliższej przyszłości.

Dla tych z nas, którzy nie wiedzą, czym jest Reddit, należy się wyjaśnienie. Mowa tu o hybrydzie serwisu społecznościowego oraz forum dyskusyjnego, która na przestrzeni ostatnich lat wyrosła na jedno z najbardziej wartościowych źródeł informacji w Internecie. Nie dziwi więc, że znajdujące się na jego łamach dane stały się łakomym kąskiem dla firm zajmujących się tworzeniem oraz trenowaniem sztucznej inteligencji. Wiele z nich zapomina przy tym, że jeszcze nieco ponad rok temu Gemini od Google’a sugerowało użytkownikom dodawanie kleju na pizzę celem poprawy „przylepności” sera do ciasta, powołując się przy tym na wiedzę wprost z Reddita (acz pochodzącą z ironicznego komentarza, czego AI oczywiście nie było w stanie wychwycić).

Szef działu prawnego Reddita, Ben Lee, odniósł się do wczorajszego pozwu i przekazał, że „firmy zajmujące się sztuczną inteligencją toczą wyścig zbrojeń o wysokiej jakości treści tworzone przez ludzi, a ta presja napędza gospodarkę opartą na „praniu brudnych danych” na skalę przemysłową”. Warto nadmienić, że serwis zezwala na dostęp do swoich danych, niemniej w zamian życzy sobie słonej zapłaty. Na jej uiszczenie zgodziły się m.in. OpenAI i Google, aczkolwiek przedsiębiorstwa pokroju Anthropic i Perplexity, niedysponujące takimi pokładami gotówki, starały się obejść tę niedogodność w wątpliwy moralnie sposób i z wiadomym skutkiem.

Swoje stanowisko w kontekście omawianego pozwu wystosowało także Perplexity, a prezentuje się ono jak poniżej:

Nasze podejście pozostaje oparte na zasadach i odpowiedzialności, ponieważ dostarczamy oparte na faktach odpowiedzi przy użyciu precyzyjnej sztucznej inteligencji i nie będziemy tolerować zagrożeń dla otwartości i interesu publicznego.
Perplexity

Poinformowano również, że Perplexity prawdopodobnie nie działało same. Za ściąganie informacji z Reddita bez uprzedniego uzyskania zgody na taki proceder pozwane zostały trzy przedsiębiorstwa: SerpApi (USA/Teksas), Oxylabs (Litwa) oraz AWMProxy (Rosja). Zarząd portalu utrzymuje, że co najmniej jedno z nich współpracowało z Perplexity i zbierało dane na jego potrzeby. SerpApi i Oxylabs zgodnie orzekły, że zarzuty Reddita są bezpodstawne, a druga z firm nadmieniła, że platforma nie raczyła nawet zainicjować kontaktu przed złożeniem pozwu. Rosyjskie AWMProxy zdecydowało się z kolei zachować milczenie i przeczekać burzę.

Tytułowy serwis podkreślił, że w ubiegłym roku wystosował do Perplexity pismo, w którym wyraźnie zażądano zaprzestania wykorzystywania pozyskanych z jego łamów treści. Jedyną reakcją giganta AI było podkręcenie tempa, a od tamtej pory liczba cytowań z Reddita w odpowiedziach generowanych przez czatbota Perplexity podobno wzrosła aż czterdziestokrotnie.

Reddit zażądał odcięcia Perplexity od swoich materiałów i ich wykorzystywania w przyszłości. Ponadto portal liczy na rekompensatę pieniężną, niemniej dokładna kwota nie jest znana.