lubimyczytać
Wokół książki
Aktualności
Książki Kinga, Murakamiego, Atwood i Ferrante wykorzystane do trenowania AI

Książki Kinga, Murakamiego, Atwood i Ferrante wykorzystane do trenowania AI

24.08.2023

Zadie Smith, Jonathan Franzen, Stephen King czy Elena Ferrante – to tylko kilkoro z tysięcy pisarzy i pisarek, których prace wykorzystano do szkolenia sztucznej inteligencji. Do bazy, z której korzystają firmy tworzące narzędzia AI, trafiło przeszło 170 tysięcy tytułów – bez zgody autorów i wydawców.

Książki Kinga, Murakamiego, Atwood i Ferrante wykorzystane do trenowania AI

snl.no (CC BY NC SA 2.0)

„Właśnie napotkaliśmy obcą inteligencję tutaj, na Ziemi. Nie wiemy o niej zbyt wiele, poza tym, że może zniszczyć naszą cywilizację” – tak o rozwoju sztucznej inteligencji mówił przed kilkoma miesiącami najpoczytniejszy filozof świata, autor bestsellerowego „Sapiens”, Yuval Noah Harari (więcej na ten temat przeczytasz w tekście Yuval Noah Harari ostrzega przed AI: Potencjalny koniec historii ludzkości).

Pisarze w walce ze sztuczną inteligencją

Ujmijmy rzecz prosto: rozwój AI to dziś zarówno najgorętszy temat dla światowego rynku księgarskiego, jak i jego największa obawa. O książkach tworzonych w kilka godzin przy użyciu ChatGPT, które zaczęły zalewać stronę Amazona, giganta rynku e-commerce, pisałem już w lutym tego roku. „Te książki zaleją rynek i wielu autorów zostanie bez pracy”, przestrzegały wówczas stowarzyszenia zrzeszające twórców.

Jako że do trenowania botów niezbędna jest, by tak rzec, prawdziwa literatura, w lipcu byliśmy świadkami pierwszego w historii pozwu przeciwko firmom tworzącym narzędzia AI. Do sądu federalnego w San Francisco wpłynął wniosek przeciwko OpenAI, firmie, która stworzyła ChatGPT. Zdaniem pisarzy spółka złamała prawo, wykorzystując ich książki do trenowania bota i czerpiąc zyski ze „skradzionych tekstów i pomysłów” (więcej na ten temat przeczytasz TUTAJ).

Kilkanaście dni później osiem tysięcy amerykańskich autorów, w tym Margaret Atwood, Viet Thanh Nguyen, Philip Pullman czy Jonathan Franzen, podpisało petycję wzywającą firmy zajmujące się sztuczną inteligencją do zaprzestania wykorzystywania pracy pisarzy bez zgody lub uznania wkładu autora.

Teraz, jak poinformował „The Atlantic”, ponad 170 tysięcy tytułów trafiło bez zgody autorów i wydawców do gigantycznej bazy danych Books3.

AI karmione książkami pisarzy

Amerykański miesięcznik z blisko 170-letnią tradycją ujawnił, że do szkolenia narzędzi sztucznej inteligencji wykorzystano pirackie prace kilku tysięcy autorów, w tym: Margaret Atwood, Harukiego Murakamiego, Zadie Smith, Eleny Ferrante, Stephena Kinga, Rachel Cusk, George’a Saundersa, Rebekki Solnit i Jonathana Franzena. AI nakarmiono też ponad setką książek założyciela Kościoła scjentologicznego L. Rona Hubbarda i 90 książkami pastora Johna MacArthura.

Dwie trzecie tytułów, które trafiły do Books3, to literatura faktu. Jedna trzecia to beletrystyka. Zdecydowana większość z nich to stosunkowo świeże publikacje, opublikowane w ciągu ostatnich dwóch dekad.

Tytuły obejmują zarówno dużych, jak i małych wydawców. w tym ponad 30 000 opublikowanych przez Penguin Random House, 14 000 przez HarperCollins, 7000 przez Macmillan, 1800 przez Oxford University Press.

Twórca Books3: Każda firma nastawiona na zysk robi to potajemnie

Dzięki interwencji duńskiej grupy antypirackiej Rights Alliance pliki zostały usunięte.

Shawn Presser, niezależny twórca sztucznej inteligencji, który zaprojektował Books3, powiedział, że choć sympatyzuje z obawami autorów, stworzył bazę danych, aby każdy mógł opracować generatywne narzędzia sztucznej inteligencji. Jak dodał, martwi się ryzykiem związanym z kontrolą technologii przez duże firmy.

„Jedynym sposobem na replikację modeli takich jak ChatGPT jest tworzenie zestawów danych jak Books3” – powiedział. „I każda firma nastawiona na zysk robi to potajemnie, bez publicznego udostępniania zbiorów danych”.

I really want to make AI a competitive sport. I keep having visions of a big stadium with crowds cheering the competitors as they train their language models and adjust learning rates in real time.

”Ohh the loss tick is 2.67! One more like that might win it”

”NO! It diverged!”
— Shawn Presser (@theshawwn) July 24, 2023

Maria Fredenslund, dyrektor generalna Rights Alliance, zapowiedziała tymczasem, że organizacja aktywnie pracuje nad usunięciem innych kopii Books3.

„Jesteśmy bardzo zaniepokojeni tym, co się dzieje” – powiedziała, wspominając rozwój technologiczny. Przypomniała przy tym dyskusję sprzed dekady, kiedy państwowe rządy obawiały się regulacji internetu w kwestii wymiany plików. „Okazało się, że prawo autorskie musi być regulowane zarówno w internecie, jak i w każdym innym aspekcie” – dodała.

komentarze [39]

Sortuj:

Aby napisać wiadomość zaloguj się

reversed 31.08.2023 01:17

Bibliotekarz

Wykorzystanie SI postępuje. Microsoft właśnie rozsyła komunikat o zmianach w umowach o świadczenie usług Microsoft (dotyczy użytkowników będących osobami fizycznymi i prawnymi nie korzystających z produktów licencjonowania zbiorowego np. licencji edukacyjnych, rządowych, itp.).

W zmianach między innymi jest też informacja o usługach SI, jako:
oznaczone lub opisane przez Microsoft jako zawierające mechanizmy, bezpośrednio lub pośrednio oparte na mechanizmach lub będące systemem sztucznej inteligencji („SI”). Obejmuje to (4 pierwsze tirety):

i. Odtwarzanie. Użytkownik nie może używać usług SI do wykrywania elementów leżących u podstaw modeli, algorytmów i systemów. Użytkownik może na przykład nie próbować określać i usuwać wag modeli.

Użytkownik nie może wykorzystywać usług SI Microsoftu do swoich celów.

ii. Wyodrębnianie danych. O ile Użytkownik nie ma na to wyraźnej zgody, nie może stosować metod pozyskiwania danych ze stron internetowych w celu ekstrakcji danych z usług SI.

Użytkownik nie może korzystać z utworów zależnych (dane) powstałych z funkcjonowania usług SI Microsoftu.

iii. Ograniczenia używania danych pochodzących z usług SI. (i) Użytkownik nie może używać usług SI ani danych z usług SI w celu bezpośredniego lub pośredniego tworzenia, trenowania lub udoskonalania wszelkich innych usług SI.

Użytkownik nie może wytwarzać utworów zależnych (przetwarzanie danych i informacji, wytwarzanie opracowań, analiz, itp.) wykorzystując usługi SI Microsoftu (usług SI Microsoftu nie można wprząc w swoje oprogramowania na zasadzie skorzystania z zasobu np. chmurowego).

iv. Używanie treści Użytkownika. W ramach świadczenia usług SI Microsoft będzie przetwarzać i przechowywać dane wejściowe Użytkownika do usługi oraz dane wyjściowe z usługi w celu wykrywania przypadków z zapobiegania przypadkom niewłaściwego lub szkodliwego używania usługi lub danych wyjściowych usługi.

Microsoft deklaruje, że usługami SI będzie walczył z fejkami, hejtem, itd.

więcej

Odpowiedz

Wisienka 30.08.2023 11:17

Czytelniczka

Nie mamy na to wpływu czy sztuczna inteligencja bedzie tworzyła książki, czy będzie szkolona tekstami ludzkich pisarzy, na pewno będzie korzystała dosłownie ze wszystkiego co jest w sieci. Nie zatrzyma się już tego, szeroko pojętego "postępu". Do czego ten świat dąży? Pożyjemy - zobaczymy. W każdym razie, trochę szkoda mi mijającego.

Odpowiedz

Rick Deckard 30.08.2023 07:44

Czytelnik

Propagandzista globalistów Harari, filozofem, no uśmiałem się do łez. Jeśli on filozof, to chyba tylko dla ubogich intelektualnie.

Odpowiedz

Lis 28.08.2023 09:53

Bibliotekarz

Głupio się powtarzać... ale ChatGPT to nie AI. Tekstów historycznych nie napisze - sprawdziłem 😈 Ale jeszcze się nim pobawię.

EDIT:

ChatGPT twierdzi, że nie ma dostępu do oryginalnej treści książki "Wieża" Stephena Kinga:

I co teraz? 😂

Przy okazji przesyła Nam pozdrowienia (zabawnie przekręca Lubimy na Liubimy... tak trochę z ruska)

Pokaż odpowiedzi [1]

Odpowiedz

reversed 28.08.2023 23:36

Bibliotekarz

Czyli dowiedziałeś się tyle, ile co kilka dni raportują dziennikarze Gazety Wyborczej zauroczeni tym botem i wciąż piszący o nim per 'Sztuczna inteligencja' w rodzaju... Wtłaczają różne materiały w te boty i zadają im odczapione pytania dające odlotowe wypowiedzi. Zapytaj tego bota o prawa Ujgurów...

Takie ustrojstwa są botami (automatami) z wbudowanym mechanizmem...

więcej

Aby napisać wiadomość zaloguj się

Lanaja 27.08.2023 13:19

Czytelnik

Jeśli tak dalej pójdzie to ludzie nie będą do niczego potrzebni. Rozwój i unowocześnianie jest potrzebne, ale trzeba robić to z głową. Kiedy coś staje się mądrzejsze, lepsze i sprytniejsze od ludzi należy po prostu przestać i nie brnąć w to dalej. No chyba, że chcemy sami siebie zniszczyć.

Pokaż odpowiedzi [1]

Odpowiedz

KamilJakiśtam 28.08.2023 11:34

Czytelnik

Pamiętasz "Ojca chrzestnego"? Rodzina Corleone naradzała się przed spotkaniem z Sollozzem. Don uważał, że narkotyki to brudny i niebezpieczny interes. Tom argumentował, że to branża ma przyszłość "Jeśli w to nie wejdziemy, inne rodziny wejdą. Zaczną zarabiać wielkie pieniądze, urosną w siłę i za kilka lat nas zniszczą." - niedokładny cytat, ale ten sens.
Tak jest teraz....

więcej

Aby napisać wiadomość zaloguj się

Pawello 26.08.2023 19:21

Czytelnik

Rozumiem autorów, ale to takie zawracanie Wisły kijem :)

Odpowiedz

saa-saa- 26.08.2023 17:23

Czytelnik

Opowiem króciutką historię. Koleżanka poleciła mi Petera Handke. Faktycznie, doskonała proza. Polecając powiedziała - pisze świetnie ale go nie lubię bo to mruk i nieciekawy człowiek.
Czyli, super powieść ale napisana przez AI. Nie lubię AI - jest beznadziejna bo sztuczna ale pisze świetne kawałki. Zatem jak się ustawić? Ciekawy dylemat, prawda?

Pokaż odpowiedzi [9]

Odpowiedz

Necator 27.08.2023 20:53

Czytelnik

@saa-saa-
Pisarz mruk, a nawet cham i gbur, nie wyruguje Cię z Twojej niszy ekologicznej. Nie stanowi dla Ciebie żadnej konkurencji. Nie sprawi, że przestaniesz być potrzebny. Natomiast AI, owszem, może.
Pamiętasz zapewne historię XIX wieku? Maszyny ułatwiły pracę w fabrykach, ale posłały na bruk robotników-ludzi.

Lucy 27.08.2023 22:14

Czytelniczka

@Necator, XIX wieczne maszyny z nikim nie trzymały (sztamy); kolejne ich pokolenia również nie. Natomiast AI może - to znaczy będzie mogła.

saa-saa- 28.08.2023 06:11

Czytelnik

@Necator
Z tą niszą ekologiczną w moim przypadku to kulą w płot. Pracuję w dziale AI 😃. A co do XIX wieku, ludzie niszczyli maszyny ale dzisiaj nie ma bezrobocia a poziom życia jakże różny.

Necator 28.08.2023 09:33

Czytelnik

@saa-saa- Fair enough :)
Ale wyobraź sobie... roboty z AI konstruujące inne roboty... yikes!
Powiedzmy, że przypomina mi się opowiadanie Kinga o ciężarówkach.

saa-saa- 28.08.2023 10:17

Czytelnik

Cały czas o tym myślę - jesteśmy ogniwem w łańcuchu ewolucji, moze wkrótce zbędnym i unicestwionym. Pan Hawkins prorokował koniec ludzkości w zasięgu czasowym 80 lat. Czyli góra rok 2100.

Lucy 28.08.2023 17:57

Czytelniczka

Punktem odniesienia u mnie jest Amelia 2.0 - filmowa wersja AI, której tożsamość i cielesność zostają odwzorowane oraz zmaterializowane pośmiertnie w trwałej formie pierwotnej Amelii. Niestety nikogo nie urodzi, bo tej jednej funkcji organicznej z powodów technicznych jej brakuje, aczkolwiek skonstruować kogoś na swoje podobieństwo najpewniej by potrafiła, gdyż fizycznie...

więcej

Necator 28.08.2023 19:30

Czytelnik

@Lucy Fair
To chyba nie oglądałaś Armitage...
https://animanga.fandom.com/wiki/Armitage_III
To ma być już w 2048, czyli całkiem niedługo.

Lucy 29.08.2023 03:21

Czytelniczka

@Necator, odnośnie wieku, to dla Amelii na 25 mniej więcej latach przeżytych w swoim naturalnym ciele się skończyło. Jako Amelia 2.0 już nie podlega procesom starzenia.
Kreskówkę obejrzę, bo nie rozumiem do czego zmierzasz.

Necator 29.08.2023 14:54

Czytelnik

@Lucy Fair
Kreskówka??? 😓 To jest thriller! Policjantka prowadzi śledztwo w sprawie morderstw kobiet-cyborgów. Nie będę spoilerować.

Aby napisać wiadomość zaloguj się

KamilJakiśtam 26.08.2023 09:56

Czytelnik

Sądzą się z OpenAI, a tymczasem firma Google ogłosiła oficjalnie i wprost, że zamierza nakarmić swoją sztuczną inteligencję wszystkimi treściami dostępnymi w internecie. Wszystkimi znaczy również nielegalnymi. Na torrentach i innych portalach z lewizną są dostępne niemal wszystkie książki świata. Google'owi nikt procesu nie wytacza.

Pokaż odpowiedzi [1]

Odpowiedz

reversed 26.08.2023 15:34

Bibliotekarz

Buńczuczne Google znowu prowokuje. Zaczęło się od przechwytywania aktualności (news grabbing), potem książkowni (Google Books), a teraz uzurpacja całego Internetu w charakterze zbioru treningowego. I raczej nie chodzi o treści spiracone w serwisach/portalach/torrentach. To rzecz jasna się przyda, ale chodzi o język żywy, dzisiejszy. To oznacza panele dyskusyjne, komentarze,...

więcej

Aby napisać wiadomość zaloguj się

the_deepest_black 25.08.2023 23:59

Czytelnik

To jest kryminał, bez dwóch zdań.

Odpowiedz

Zhabi 25.08.2023 23:40

Czytelnik

A mnie się rozwój AI bardzo podoba. Świetne narzędzie! Cóż z tego, że będzie zapchane pracami pisarzy, jeżeli bez odpowiednich promptów i umiejętności obsługi, byle laik nic z tego nie wyciągnie?
Śmiem nawet twierdzić, że treści wyplute przez maszynę, mogą okazać się lepsze od typowych dzisiaj grafomańskich, popularnych wysrywów, które zalewają rynek. Wszystkie motywy...

więcej

Pokaż odpowiedzi [1]

Odpowiedz

Rick Deckard 30.08.2023 08:10

Czytelnik

Technologia jest neutralna, tylko to, kto ma nad nią kontrolę jest niebezpieczne, a zważywszy na chęć zysku, brak regulacji prawnych i totalny brak kontroli nad wdrażaniem tych rozwiązań w rynek komercyjny, to przyszłość jawi nam się raczej w ciemnych barwach. Ty naprawdę uważasz że większa sztuką jest obsłużyć to stosunkowo prymitywne narzędzie, jak choćby algorytm do...

więcej

Aby napisać wiadomość zaloguj się