rozwiń zwiń

Książki Kinga, Murakamiego, Atwood i Ferrante wykorzystane do trenowania AI

Konrad Wrzesiński Konrad Wrzesiński
24.08.2023

Zadie Smith, Jonathan Franzen, Stephen King czy Elena Ferrante – to tylko kilkoro z tysięcy pisarzy i pisarek, których prace wykorzystano do szkolenia sztucznej inteligencji. Do bazy, z której korzystają firmy tworzące narzędzia AI, trafiło przeszło 170 tysięcy tytułów – bez zgody autorów i wydawców.

Książki Kinga, Murakamiego, Atwood i Ferrante wykorzystane do trenowania AI snl.no (CC BY NC SA 2.0)

„Właśnie napotkaliśmy obcą inteligencję tutaj, na Ziemi. Nie wiemy o niej zbyt wiele, poza tym, że może zniszczyć naszą cywilizację” – tak o rozwoju sztucznej inteligencji mówił przed kilkoma miesiącami najpoczytniejszy filozof świata, autor bestsellerowego „Sapiens”, Yuval Noah Harari (więcej na ten temat przeczytasz w tekście Yuval Noah Harari ostrzega przed AI: Potencjalny koniec historii ludzkości).

Pisarze w walce ze sztuczną inteligencją

Ujmijmy rzecz prosto: rozwój AI to dziś zarówno najgorętszy temat dla światowego rynku księgarskiego, jak i jego największa obawa. O książkach tworzonych w kilka godzin przy użyciu ChatGPT, które zaczęły zalewać stronę Amazona, giganta rynku e-commerce, pisałem już w lutym tego roku. „Te książki zaleją rynek i wielu autorów zostanie bez pracy”, przestrzegały wówczas stowarzyszenia zrzeszające twórców.

Jako że do trenowania botów niezbędna jest, by tak rzec, prawdziwa literatura, w lipcu byliśmy świadkami pierwszego w historii pozwu przeciwko firmom tworzącym narzędzia AI. Do sądu federalnego w San Francisco wpłynął wniosek przeciwko OpenAI, firmie, która stworzyła ChatGPT. Zdaniem pisarzy spółka złamała prawo, wykorzystując ich książki do trenowania bota i czerpiąc zyski ze „skradzionych tekstów i pomysłów” (więcej na ten temat przeczytasz TUTAJ).

Kilkanaście dni później osiem tysięcy amerykańskich autorów, w tym Margaret Atwood, Viet Thanh Nguyen, Philip Pullman czy Jonathan Franzen, podpisało petycję wzywającą firmy zajmujące się sztuczną inteligencją do zaprzestania wykorzystywania pracy pisarzy bez zgody lub uznania wkładu autora.

Teraz, jak poinformował „The Atlantic”, ponad 170 tysięcy tytułów trafiło bez zgody autorów i wydawców do gigantycznej bazy danych Books3.

AI karmione książkami pisarzy

Amerykański miesięcznik z blisko 170-letnią tradycją ujawnił, że do szkolenia narzędzi sztucznej inteligencji wykorzystano pirackie prace kilku tysięcy autorów, w tym: Margaret Atwood, Harukiego Murakamiego, Zadie Smith, Eleny Ferrante, Stephena Kinga, Rachel Cusk, George’a Saundersa, Rebekki Solnit i Jonathana Franzena. AI nakarmiono też ponad setką książek założyciela Kościoła scjentologicznego L. Rona Hubbarda i 90 książkami pastora Johna MacArthura.

Dwie trzecie tytułów, które trafiły do Books3, to literatura faktu. Jedna trzecia to beletrystyka. Zdecydowana większość z nich to stosunkowo świeże publikacje, opublikowane w ciągu ostatnich dwóch dekad.

Tytuły obejmują zarówno dużych, jak i małych wydawców. w tym ponad 30 000 opublikowanych przez Penguin Random House, 14 000 przez HarperCollins, 7000 przez Macmillan, 1800 przez Oxford University Press.

Twórca Books3: Każda firma nastawiona na zysk robi to potajemnie

Dzięki interwencji duńskiej grupy antypirackiej Rights Alliance pliki zostały usunięte.

Shawn Presser, niezależny twórca sztucznej inteligencji, który zaprojektował Books3, powiedział, że choć sympatyzuje z obawami autorów, stworzył bazę danych, aby każdy mógł opracować generatywne narzędzia sztucznej inteligencji. Jak dodał, martwi się ryzykiem związanym z kontrolą technologii przez duże firmy.

„Jedynym sposobem na replikację modeli takich jak ChatGPT jest tworzenie zestawów danych jak Books3” – powiedział. „I każda firma nastawiona na zysk robi to potajemnie, bez publicznego udostępniania zbiorów danych”.

Maria Fredenslund, dyrektor generalna Rights Alliance, zapowiedziała tymczasem, że organizacja aktywnie pracuje nad usunięciem innych kopii Books3.

„Jesteśmy bardzo zaniepokojeni tym, co się dzieje” – powiedziała, wspominając rozwój technologiczny. Przypomniała przy tym dyskusję sprzed dekady, kiedy państwowe rządy obawiały się regulacji internetu w kwestii wymiany plików. „Okazało się, że prawo autorskie musi być regulowane zarówno w internecie, jak i w każdym innym aspekcie” – dodała.


komentarze [39]

Sortuj:
Niezalogowany
Aby napisać wiadomość zaloguj się
reversed 31.08.2023 01:17
Bibliotekarz

Wykorzystanie SI postępuje. Microsoft właśnie rozsyła komunikat o zmianach w umowach o świadczenie usług Microsoft (dotyczy użytkowników będących osobami fizycznymi i prawnymi nie korzystających z produktów licencjonowania zbiorowego np. licencji edukacyjnych, rządowych, itp.).

W zmianach między innymi jest też informacja o usługach SI, jako:
oznaczone lub opisane przez...

Czytelnicy oznaczyli ten post jako spam Zobacz ten post więcej
Wisienka 30.08.2023 11:17
Czytelniczka

Nie mamy na to wpływu czy sztuczna inteligencja bedzie tworzyła książki, czy będzie szkolona tekstami ludzkich pisarzy,  na pewno będzie korzystała dosłownie ze wszystkiego co jest w sieci. Nie zatrzyma się już tego, szeroko pojętego "postępu".  Do czego ten świat dąży? Pożyjemy - zobaczymy. W każdym razie, trochę szkoda mi mijającego. 

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Rick Deckard 30.08.2023 07:44
Czytelnik

Propagandzista globalistów Harari, filozofem, no uśmiałem się do łez. Jeśli on filozof, to chyba tylko dla ubogich intelektualnie.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Lis 28.08.2023 09:53
Bibliotekarz

Głupio się powtarzać... ale ChatGPT to nie AI. Tekstów historycznych nie napisze - sprawdziłem  😈 Ale jeszcze się nim pobawię.

EDIT:

ChatGPT twierdzi, że nie ma dostępu do oryginalnej treści książki "Wieża" Stephena Kinga:



I co teraz? 😂

Przy okazji przesyła Nam pozdrowienia (zabawnie przekręca Lubimy na Liubimy... tak trochę z ruska)

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
reversed 28.08.2023 23:36
Bibliotekarz

Czyli dowiedziałeś się tyle, ile co kilka dni raportują dziennikarze Gazety Wyborczej zauroczeni tym botem i wciąż piszący o nim per 'Sztuczna inteligencja' w rodzaju... Wtłaczają różne materiały w te boty i zadają im odczapione pytania dające odlotowe wypowiedzi. Zapytaj tego bota o prawa Ujgurów...

Takie ustrojstwa są botami (automatami) z wbudowanym mechanizmem...

Czytelnicy oznaczyli ten post jako spam Zobacz ten post więcej
Niezalogowany
Aby napisać wiadomość zaloguj się
Lanaja 27.08.2023 13:19
Czytelnik

Jeśli tak dalej pójdzie to ludzie nie będą do niczego potrzebni. Rozwój i unowocześnianie jest potrzebne, ale trzeba robić to z głową. Kiedy coś staje się mądrzejsze, lepsze i sprytniejsze od ludzi należy po prostu przestać i nie brnąć w to dalej. No chyba, że chcemy sami siebie zniszczyć.  

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
KamilJakiśtam 28.08.2023 11:34
Czytelnik

Pamiętasz "Ojca chrzestnego"? Rodzina Corleone naradzała się przed spotkaniem z Sollozzem. Don uważał, że narkotyki to brudny i niebezpieczny interes. Tom argumentował, że to branża ma przyszłość "Jeśli w to nie wejdziemy, inne rodziny wejdą. Zaczną zarabiać wielkie pieniądze, urosną w siłę i za kilka lat nas zniszczą." - niedokładny cytat, ale ten sens.
Tak jest teraz....

Czytelnicy oznaczyli ten post jako spam Zobacz ten post więcej
Niezalogowany
Aby napisać wiadomość zaloguj się
Pawello 26.08.2023 19:21
Czytelnik

Rozumiem autorów, ale to takie zawracanie Wisły kijem :)

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
saa-saa- 26.08.2023 17:23
Czytelnik

Opowiem króciutką historię. Koleżanka poleciła mi Petera Handke. Faktycznie, doskonała proza. Polecając powiedziała - pisze świetnie ale go nie lubię bo to mruk i nieciekawy człowiek. 
 Czyli, super powieść ale napisana przez AI. Nie lubię AI - jest beznadziejna bo sztuczna ale pisze świetne kawałki. Zatem jak się ustawić? Ciekawy dylemat, prawda?

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Necator 27.08.2023 20:53
Czytelnik

@saa-saa- 
Pisarz mruk, a nawet cham i gbur, nie wyruguje Cię z Twojej niszy ekologicznej. Nie stanowi dla Ciebie żadnej konkurencji. Nie sprawi, że przestaniesz być potrzebny. Natomiast AI, owszem, może.
Pamiętasz zapewne historię XIX wieku? Maszyny ułatwiły pracę w fabrykach, ale posłały na bruk robotników-ludzi.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Lucy 27.08.2023 22:14
Czytelniczka

@Necator, XIX wieczne maszyny z nikim nie trzymały (sztamy); kolejne ich pokolenia również nie. Natomiast AI może - to znaczy będzie mogła.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
saa-saa- 28.08.2023 06:11
Czytelnik

@Necator 
Z tą niszą ekologiczną w moim przypadku to kulą w płot. Pracuję w dziale AI 😃. A co do XIX wieku, ludzie niszczyli maszyny ale dzisiaj nie ma bezrobocia a poziom życia jakże różny.    

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Necator 28.08.2023 09:33
Czytelnik

@saa-saa- Fair enough :)
Ale wyobraź sobie... roboty z AI konstruujące inne roboty... yikes!
Powiedzmy, że przypomina mi się opowiadanie Kinga o ciężarówkach.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
saa-saa- 28.08.2023 10:17
Czytelnik

Cały czas o tym myślę - jesteśmy ogniwem w łańcuchu ewolucji, moze wkrótce zbędnym i unicestwionym. Pan Hawkins prorokował koniec ludzkości w zasięgu czasowym 80 lat. Czyli góra rok 2100. 

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Lucy 28.08.2023 17:57
Czytelniczka

Punktem odniesienia u mnie jest Amelia 2.0 - filmowa wersja AI, której tożsamość i cielesność zostają odwzorowane oraz zmaterializowane pośmiertnie w trwałej formie pierwotnej Amelii. Niestety nikogo nie urodzi, bo tej jednej funkcji organicznej z powodów technicznych jej brakuje, aczkolwiek skonstruować kogoś na swoje podobieństwo najpewniej by potrafiła, gdyż fizycznie...

Czytelnicy oznaczyli ten post jako spam Zobacz ten post więcej
Necator 28.08.2023 19:30
Czytelnik

@Lucy Fair 
To chyba nie oglądałaś Armitage...
https://animanga.fandom.com/wiki/Armitage_III 
To ma być już w 2048, czyli całkiem niedługo.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Lucy 29.08.2023 03:21
Czytelniczka

@Necator, odnośnie wieku, to dla Amelii na 25 mniej więcej latach przeżytych w swoim naturalnym ciele się skończyło. Jako Amelia 2.0 już nie podlega procesom starzenia.
Kreskówkę obejrzę, bo nie rozumiem do czego zmierzasz. 

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Necator 29.08.2023 14:54
Czytelnik

@Lucy Fair 
Kreskówka??? 😓 To jest thriller! Policjantka prowadzi śledztwo w sprawie morderstw kobiet-cyborgów. Nie będę spoilerować.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Niezalogowany
Aby napisać wiadomość zaloguj się
KamilJakiśtam 26.08.2023 09:56
Czytelnik

Sądzą się z OpenAI, a tymczasem firma Google ogłosiła oficjalnie i wprost, że zamierza nakarmić swoją sztuczną inteligencję wszystkimi treściami dostępnymi w internecie. Wszystkimi znaczy również nielegalnymi. Na torrentach i  innych portalach z lewizną są dostępne niemal wszystkie książki świata. Google'owi nikt procesu nie wytacza.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
reversed 26.08.2023 15:34
Bibliotekarz

Buńczuczne Google znowu prowokuje. Zaczęło się od przechwytywania aktualności (news grabbing), potem książkowni (Google Books), a teraz uzurpacja całego Internetu w charakterze zbioru treningowego. I raczej nie chodzi o treści spiracone w serwisach/portalach/torrentach. To rzecz jasna się przyda, ale chodzi o język żywy, dzisiejszy. To oznacza panele dyskusyjne, komentarze,...

Czytelnicy oznaczyli ten post jako spam Zobacz ten post więcej
Niezalogowany
Aby napisać wiadomość zaloguj się
the_deepest_black 25.08.2023 23:59
Czytelnik

To jest kryminał, bez dwóch zdań.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Zhabi 25.08.2023 23:40
Czytelnik

A mnie się rozwój AI bardzo podoba. Świetne narzędzie! Cóż z tego, że będzie zapchane pracami pisarzy, jeżeli bez odpowiednich promptów i umiejętności obsługi, byle laik nic z tego nie wyciągnie?
Śmiem nawet twierdzić, że treści wyplute przez maszynę, mogą okazać się lepsze od typowych dzisiaj grafomańskich, popularnych wysrywów, które zalewają rynek. Wszystkie motywy...

Czytelnicy oznaczyli ten post jako spam Zobacz ten post więcej
Rick Deckard 30.08.2023 08:10
Czytelnik

Technologia jest neutralna, tylko to, kto ma nad nią kontrolę jest niebezpieczne, a zważywszy na chęć zysku, brak regulacji prawnych i totalny brak kontroli nad wdrażaniem tych rozwiązań w rynek komercyjny, to przyszłość jawi nam się raczej w ciemnych barwach. Ty naprawdę uważasz że większa sztuką jest obsłużyć to stosunkowo prymitywne narzędzie, jak choćby algorytm do...

Czytelnicy oznaczyli ten post jako spam Zobacz ten post więcej
Niezalogowany
Aby napisać wiadomość zaloguj się