rozwiń zwiń

Polak potrafi. Bot inspirowany Lemem rywalem dla ChatGPT

Konrad Wrzesiński Konrad Wrzesiński
12.09.2023

Polska, a właściwie gdańska firma technologiczna stworzyła bota, który może konkurować z popularnym ChatGPT. Inspirowała się przy tym twórczością Stanisława Lema. Sprawdzam, dlaczego Trurl bije na głowę inne polskie otwarte modele. I czemu bywa uparty jak postać stworzona przez mistrza prozy science fiction.

Polak potrafi. Bot inspirowany Lemem rywalem dla ChatGPT

„Konstruktor Trurl zbudował raz ośmiopiętrową maszynę rozumną, którą, kiedy skończył najważniejszą pracę, pociągnął najpierw białym lakierem; potem narożniki pomalował liliowo, przypatrzył się z daleka i dorobił jeszcze mały deseń na froncie, a tam, gdzie można sobie było wyobrazić jej czoło, położył lekki pomarańczowy rzucik i, bardzo zadowolony z siebie, pogwizdując od niechcenia, niejako z czczego obowiązku rzucił sakramentalne pytanie: ile jest dwa razy dwa?” – tak rozpoczyna się „Maszyna Trurla”, jedno z opowiadań składających się na „Bajki robotów” Lema.

Blisko 60 lat po premierze jednej z najpopularniejszych – obok „Solaris” i „Niezwyciężonego” – książek z dorobku polskiego mistrza science fiction Trurl przestał być tylko literacką fikcją. Za sprawą VoiceLab.AI, polskiej firmy AI, lemowski wielki konstruktor współdzieli nazwę z inspirowanym twórczością Lema botem zbliżonym do słynnego ChatGPT.

Trurl, czyli polska odpowiedź na ChatGPT

O możliwości Trurla pytam Agnieszkę Mikołajczyk z VoiceLab.AI. – Dużo mówią o nim dane – odpowiada liderka zespołu NLP gdańskiej firmy. – Trenowaliśmy go tak, żeby przypominał trochę ChatGPT – przyjazny czat asystent, który wesprze użytkownika w codziennych zadaniach.

Inspirowany Stanisławem Lemem bot sprawdzi się w zadaniach streszczania tekstu, przypisywania słów kluczowych, nadawania tytułów, wygeneruje wiersze czy posty na LinkedIn. – Można go też wykorzystać do zadań bardziej biznesowych – wyjaśnia Mikołajczyk. – Wytrenowaliśmy model tak, aby był w stanie ocenić przebieg rozmowy agenta z klientem – na przykład transkrypcję rozmowy telefonicznej z centrum obsługi klienta – i powiedzieć, co agent mógłby zrobić lepiej, ocenić, czy klient był zadowolony. ChatGPT nie do końca sobie z tym radzi, bo prawdopodobnie twórcy nie uwzględnili takiego zastosowania. My staramy się takie luki uzupełniać.

Pytam, jak polski bot wypada w zestawieniu z ChatGPT. – Nasz Trurl nie pobije go w każdym zadaniu, ale pewnie znajdą się takie, w których jest lepszy, co widać w powyższym przykładzie – mówi Agnieszka Mikołajczyk.

Zauważa, że zasobów gdańskiej firmy nie sposób porównać do OpenAI, twórcy ChatGPT. – Mamy mały zespół i wydaje mi się, że bardzo dużo osiągnęliśmy – podkreśla.

Gdzie plasuje się Trurl w starciu z polskimi botami? – Myślę, że jeśli chodzi o język polski, to bijemy wszystkie otwarte modele na głowę – mówi Mikołajczyk, dodając, że potwierdzają to dokonane przez gdańską firmę testy. – Większość otwartych modeli, nawet jeśli zrozumie polski, odpowiada po angielsku lub łamaną polszczyzną.

Siłą Trurla jest również to, że jest dostępny w wersji całkowicie otwartej – w przeciwieństwie do ChatGPT.

Dlaczego Lem?

Przechodzę do Lema. Skąd pomysł, by skojarzyć bota z prozą pisarza?

Chcieliśmy poprzez nazwę podkreślić jego polskość – wyjaśnia Agnieszka Mikołajczyk. – Mamy tutaj wielu fanów jego twórczości. Pomysłodawcą był Piotr Pęzik, pomysł się przyjął i został przegłosowany.

Choć, jak sama mówi, po raz ostatni czytała Lema w gimnazjum, przy pracy nad Trurlem postanowiła odświeżyć sobie lektury, a „Bajki robotów” przesłuchać w formie audiobooka. – Przyznam, że nieraz się zaśmiałam! Nasz Trurl bywa czasami uparty jak Trurl z bajek Lema, czasami trzeba go odpowiednio „wypromptować”, żeby zrobił, co chcemy, ale ogólnie działa całkiem nieźle. Pierwsze wersje Trurla były absolutnie ciekawe, zachowywał się jak przyjacielskie, ale niezbyt mądre dziecko. Z kolejnymi wersjami na szczęście wydoroślał.

O Lema pytam wspomnianego Piotra Pęzika, konsultanta NLP w VoiceLab.AI, dr. hab. językoznawstwa.

Trurl to robot konstruktor z „Cyberiady” Lema. Jego Elektrybałt jest literackim pierwowzorem wielkich modeli językowych, takich jak ChatGPT – podkreśla.

I dodaje: – Jego „ośmiopiętrowa maszyna rozumna” co prawda potrafi się komunikować z jego twórcą, ale zmyśla wyniki działań arytmetycznych, co również nasuwa skojarzenia z wyzwaniami, przed jakimi stoją twórcy wielkich modeli językowych. Z jednej strony słyszymy ekspertów, którzy porównują iloraz inteligencji GPT-4 z Einsteinem, z drugiej widzimy, że nawet GPT-4 nie potrafi się nauczyć mnożenia liczb czterocyfrowych.

O Lemie mówi też Łukasz Raczkowski, business development manager w gdańskiej firmie. – Mamy tutaj wielu miłośników jego twórczości. W jednym z opowiadań „Cyberiady” Stanisława Lema, „Wyprawa pierwsza A, czyli Elektrybałt Trurla”, Trurl, genialny robot/konstruktor, który może skonstruować wszystko, czego zapragnie, buduje maszynę, która (choć opowiadanie było pisane w 1965 roku) przypomina bardzo możliwościami to, co dzisiaj nazywamy GPT (Generative Pre-trained Transformer). Stąd, chcąc oddać hołd Lemowi i fikcyjnemu konstruktorowi GPT sprzed 50 lat, postanowiliśmy nadać mu nazwę Trurl.

– Co ciekawe, wyposażyliśmy też Trurla w nasze pozostałe technologie. I tak dzięki naszemu silnikowi do automatycznego rozpoznawania mowy (ASR) możemy nie tylko pisać z Trurlem, ale też do niego mówić. Z kolei nasza technologia generowania mowy syntetycznej (Text-to-speech TTS) pozwala Trurlowi odpowiedzieć jego własnym głosem – dodaje Raczkowski.

AI zastąpi pisarzy?

Na koniec sprowadzam rozmowę na temat pisarskich ambicji narzędzi pokroju ChatGPT. Wspominam choćby lawinowy wzrost liczby książek pisanych przez boty w kilka godzin w sklepie Amazona (więcej na ten temat przeczytasz TUTAJ).

A zatem – czy Trurl zamierza pisać książki?

Nie mamy takich ambicji – odpowiada Piotr Pęzik. – Pamiętajmy, że generowanie języka przez modele językowe polega obecnie – w dużym uproszczeniu – na przewidywaniu kolejnego słowa na podstawie ciągów słów zaobserwowanych w treningu, w komendzie użytkownika oraz w bieżącym wyniku generowania (czyli tego, co model zaczął pisać w odpowiedzi na komendę). Ten wynik może być inny za każdym razem dzięki prostej funkcji losującej spośród najbardziej prawdopodobnych słów.

Pęzik podkreśla, że w przypadku człowieka generowanie – by tak rzec – języka, nie jest torowane tylko przez ciągi słów, które słyszeliśmy w przeszłości lub które właśnie wypowiadamy, ale też przez doświadczenia, emocje, skojarzenia, wielomodalne sygnały sensoryczne i szlaki pamięciowe, zmieniające się w czasie rzeczywistym oczekiwania i reakcje słuchaczy.

Dlatego, jak zaznacza, narzędzia w stylu ChatGPT wydają się doskonałe w generowaniu krótkich, wysoce formulicznych tekstów. – Ewentualnie dłuższych tekstów, które nie muszą być spójne logicznie i nie muszą spełniać jakiejś globalnej funkcji pragmatycznej, którą pełni każda dobra książka – dodaje.

W podobny sposób sprawę komentuje Agnieszka Mikołajczyk. Wskazuje, że modele starają się przewidzieć każde kolejne słowo, budując ogromną listę słów prawdopodobnych i wybierając odpowiednie.

Słowa o wyższym prawdopodobieństwie wystąpienia mają większą szansę na wylosowanie. A to prawdopodobieństwo bierze się z danych treningowych – mówi. – Model wie więc, za sprawą danych, którymi go wcześniej „nakarmiliśmy”, jakie zlepki słów mają sens.

Czy to jest to samo, co kreatywność autora? Chyba nie – mówi z uśmiechem.


komentarze [23]

Sortuj:
Niezalogowany
Aby napisać wiadomość zaloguj się
reversed 04.01.2024 16:55
Bibliotekarz

A pamiętacie, jak to szło w „Misiu"?

- Panie, teraz to mamy komputer. Może Pan pisać co Pan tylko chce, ale to nie ma żadnego znaczenia. On i tak się pomyli.

W wersji z aktualizacją do LLC byłoby to mniej-więcej tak, jak myślę:

- Panie, teraz mamy sztucznego inteligenta. Może Pan go pytać o co Pan tylko chce, ale niech Pan się nie spodziewa czegoś konkretnego. On i tak...

Czytelnicy oznaczyli ten post jako spam Zobacz ten post więcej
Krzysiek 13.09.2023 19:01
Czytelnik

Każda zdobycz techniki i każdy szczebel na drabinie postępu jest dobry, jak się
go wykorzysta? No to już kwestia dyskusji. Nie próbuję się wymądrzać nad AI, bo – właśnie na LC - czytałem komentarze znawców, którzy udowadniali że rozwój AI to perspektywa setek lat. Szybko okazało się, że to co wielu zapowiadało za dziesięciolecia stało się faktem wczoraj, a pewnie to co ma...

Czytelnicy oznaczyli ten post jako spam Zobacz ten post więcej
Solaris 15.11.2023 13:06
Czytelnik

Jeśli ktoś uważa nic nie warte portale społecznościowe za źródło wiedzy(pomijam tik toka bo to abominacja oraz wypaczenie ludzkiego umysłu) to współczuję mu Serdecznie i życzę powodzenia w przyszłości, czerpiąc naukę z "GŁUPOT". 

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Niezalogowany
Aby napisać wiadomość zaloguj się
Lis 13.09.2023 16:06
Bibliotekarz

Ekhm... najwyraźniej wiedzę historyczną pozyskuje z tego samego źródła  😂

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Lis 13.09.2023 15:26
Bibliotekarz

Heh w kontekście Trurla piszecie "bot" a w kontekście ChatGPT używacie "AI"... chociaż to żadne AI nie jest. Rozumiem, że używacie potocznego znaczenia "AI", ale w takim razie może warto być konsekwentnym i tak samo określać Trurla?

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
reversed 13.09.2023 17:04
Bibliotekarz

Pozostańmy przy bocie. Określanie automatów generatywnych atrybutem AI kultywują (o zgrozo 😖i niestety 😒 ) dziennikarze. Swoją drogą, to nie AI, tylko SI.

Jak Trurl nauczy się wnioskowania abstrakcyjnego (nie wyuczanego zbiorem treningowym) i oznajmi „myślę, więc jestem", wtedy możemy go zapytać, czy jest samoświadomy. I dopiero wtedy będziemy mogli zacząć sprawdzać, czy...

Czytelnicy oznaczyli ten post jako spam Zobacz ten post więcej
Niezalogowany
Aby napisać wiadomość zaloguj się
Coldy 13.09.2023 12:58
Czytelnik

Po co oni tworzą te boty, skoro ludzie i tak będą chcieli czytać prawdziwych autorów?

"Możesz zaciągnąć konia do wodopoju, ale nie możesz go zmusić aby pił".

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Konrad Wrzesiński 13.09.2023 13:36
Redaktor

Czy doczytał Pan, jakie funkcje ma ten bot? I że de facto nie zamierza pisać książek?

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
reversed 13.09.2023 15:12
Bibliotekarz

Odpowiedź jest w artykule: „(...) narzędzia w stylu ChatGPT wydają się doskonałe w generowaniu krótkich, wysoce formulicznych tekstów.".

Udręczeni czytaniem lektur w szkole już się nie mogą doczekać.

Desperaci szukający pomocy w serwisach już znają natręctwo i śladową wartość zautomatyzowanej bot-pomocy.

Stalkowani telefonami automatów sprzedająco-reklamujących  już mają...

Czytelnicy oznaczyli ten post jako spam Zobacz ten post więcej
Coldy 13.09.2023 23:30
Czytelnik

 Konrad Wrzesiński Nie doczytałem. Mam nadzieję, że jest tak, jak Pan napisał.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
reversed 14.09.2023 00:05
Bibliotekarz

Cytat z treści artykułu. Ponure wizje niżej, to moja ekspresja mojego dyskomfortu  😁.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Niezalogowany
Aby napisać wiadomość zaloguj się
Cleopatrapl 13.09.2023 07:14
Czytelniczka

W styczniu będziemy na naszej grupie czytać synchronicznie  Kongres futurologiczny. Nie na jeszcze dokładnego terminu, ale już można zadeklarować swoje uczestnictwo🙂

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
 Kongres futurologiczny
reversed 12.09.2023 15:49
Bibliotekarz

To może czas zapytać tego Trurla ile jest dwa razy dwa?

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Neil 12.09.2023 19:53
Czytelnik

Cztery! Zawsze to było cztery! Nikt mi nie wmówi, że pięć! 





















Dwa plus dwa to pięć. ( Nie chce być zgnieciony) 

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
reversed 12.09.2023 23:44
Bibliotekarz

Sssie... (hep!) deem!

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Anachronist 13.09.2023 13:50
Czytelniczka

Osiem. Podbijam stawkę.  😈

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Necator 13.09.2023 14:00
Czytelnik

...Siedem! - rzekła gromowym głosem machina.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Lucy 13.09.2023 14:44
Czytelniczka

Stać mnie na jedynkę. Więcej nie dam.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Lis 13.09.2023 15:28
Bibliotekarz

Dajcie spokój przecież każdy wie, że 100  😈
Pozdro dla kumatych  😎

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Necator 13.09.2023 16:15
Czytelnik

@Lis Gracki 
Całe szczęście, że system dwójkowy to nie ocena w dzienniku :)

"Tato, czy 10 plus 10=100?"
"Wiesz, synku, kiedyś tak mnie skasowali w pewnej restauracji, ale swojej pani w szkole mów, że to 20..."

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Niezalogowany
Aby napisać wiadomość zaloguj się
Konrad Wrzesiński 12.09.2023 14:30
Redaktor

Zapraszam do dyskusji.

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Cleopatrapl 13.09.2023 07:20
Czytelniczka

Bardzo podoba mi się Pana artykuł. Ostatnio ma Pan bardzo dobrą passę🙂

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Konrad Wrzesiński 13.09.2023 09:29
Redaktor

Miło mi 😊

Czytelnicy oznaczyli ten post jako spam Zobacz ten post
Niezalogowany
Aby napisać wiadomość zaloguj się