CUDA w przykładach. Wprowadzenie do ogólnego programowania procesorów GPU

Okładka książki CUDA w przykładach. Wprowadzenie do ogólnego programowania procesorów GPU Edward Kandrot, Jason Sanders
Okładka książki CUDA w przykładach. Wprowadzenie do ogólnego programowania procesorów GPU
Edward KandrotJason Sanders Wydawnictwo: Helion informatyka, matematyka
232 str. 3 godz. 52 min.
Kategoria:
informatyka, matematyka
Tytuł oryginału:
CUDA by Example: An Introduction to General-Purpose GPU Programming
Wydawnictwo:
Helion
Data wydania:
2012-01-15
Data 1. wyd. pol.:
2012-01-15
Liczba stron:
232
Czas czytania
3 godz. 52 min.
Język:
polski
ISBN:
9788324638178
Tłumacz:
Łukasz Piwko
Tagi:
Cuda GPU
Średnia ocen

7,6 7,6 / 10

Oceń książkę
i
Dodaj do biblioteczki

Porównaj ceny

i
Porównywarka z zawsze aktualnymi cenami
W naszej porównywarce znajdziesz książki, audiobooki i e-booki, ze wszystkich najpopularniejszych księgarni internetowych i stacjonarnych, zawsze w najlepszej cenie. Wszystkie pozycje zawierają aktualne ceny sprzedaży. Nasze księgarnie partnerskie oferują wygodne formy dostawy takie jak: dostawę do paczkomatu, przesyłkę kurierską lub odebranie przesyłki w wybranym punkcie odbioru. Darmowa dostawa jest możliwa po przekroczeniu odpowiedniej kwoty za zamówienie lub dla stałych klientów i beneficjentów usług premium zgodnie z regulaminem wybranej księgarni.
Za zamówienie u naszych partnerów zapłacisz w najwygodniejszej dla Ciebie formie:
• online
• przelewem
• kartą płatniczą
• Blikiem
• podczas odbioru
W zależności od wybranej księgarni możliwa jest także wysyłka za granicę. Ceny widoczne na liście uwzględniają rabaty i promocje dotyczące danego tytułu, dzięki czemu zawsze możesz szybko porównać najkorzystniejszą ofertę.
Ładowanie Szukamy ofert...

Patronaty LC

Mogą Cię zainteresować

Oceny

Średnia ocen
7,6 / 10
5 ocen
Twoja ocena
0 / 10

OPINIE i DYSKUSJE

Sortuj:
avatar
494
492

Na półkach:

Najlepsze obecnie procesory 4-rdzeniowe osiągają moc obliczeniową rzędu 12Gflops (floating point operations per second). NVIDIA swoimi układami GPU w architekturze CUDA (Compute Unified Device Architecture, czytamy [niestety] z rosyjska "kuda") bije tę wydajność na głowę. Nowa stacja Tesla K40, którą mamy teraz w pracy z pomocą 2688 rdzeni osiąga 5Tflops, a więc około 500 razy więcej... Nie jest to jeszcze moc superkomputera (mierzona w peta-flopsach),ale z drugiej strony Cray ostatnio buduje swoje superkomputery... na kartach NVIDII (Cray Titan)!
Mając pod nosem taką moc obliczeniową i biorąc pod uwagę, że muszę często czekać tygodniami na wynik obliczeń na zwykłej stacji roboczej, musiałem się tym bliżej zainteresować. I pierwszy program mam już napisany, z grubsza rozumiem na czym to polega. Książka się sprawdziła. Nauczyłem się uruchamiać procedury GPU równolegle w blokach i wątkach, nauczyłem się kopiować do nich dane z pamięci CPU, synchronizować w elementarny sposób ich pracę i poznałem bardzo ciekawy sposób buforowania danych poprzez interfejs pamięci tekstur. Książka omawia też bardziej zaawansowane techniki, jak obsługę strumieni (umożliwiającą zakładkowe wykonywanie obliczeń na GPU i transfery do pamięci przez DMA),pamięci dzielonej (w obrębie bloków) czy obsługę większej ilości urządzeń GPU.
Jedyne czego zabrakło to szczegółów architektury pamięci na pokładzie GPU--np. żeby świadomie sterować dostępem do pamięci tych tysięcy rdzeni aby nie musiały nawzajem czekać na siebie. Jest też jeden kiepski rozdział o współpracy z bibliotekami graficznymi, gdzie autorzy omawiają klasy dedykowane do animacji, a omawiając je zamiast podać interfejs zachowują się jakby te klasy sami tworzyli. Ciężko się w tym było połapać--co jest przeciążoną metodą interfejsu, co jest własnym wynalazkiem.
Można się też poprzyczepiać do paru drobiazgów: np. na s. 92 autorzy liczą pierwiastek z... r^2. Nie powiem, żeby to dobrze świadczyło o dbałości o szybkość działania kodu:) (wiadomo, że wynik to r).
Na s. 115 dodają dodatkową instrukcję warunkową (dstOut),która niepotrzebnie zmienia schemat programu więcej niż wymagane z uwagi na wprowadzenie pamięci tekstur. To może mylić.
W rozdziale o pamięci tekstur nie podano o ile wzrosła wydajność po zastosowaniu interfejsu tekstur.
Str. 131, 193, itd. "inicjacja" (seksualna?) zamiast inicjalizacji.
Str. 181 - brak cytowanej funkcji cudaThreadSynchronize()
Str. 196 - autorzy twierdzą, że są takimi mistrzami, że nigdy nie napisali kodu, który zawiesiłby komputer i nie potrzebują debuggera... Hmmm, biorąc pod uwagę, że potrafią wyciągać pierwiastek z r^2 (podobna niefrasobliwość, jak niedopilnowanie wskaźnika na granicy tablicy) nie bardzo w to wierzę, źle to świadczy o piszących takie słowa.
Str. 198 - opisują profiler, mierzący czas wywoływania poszczególnych funkcji programu. Po co zatem wcześniej "ręcznie" mierzyli czasy wywołań funkcji programu za pomocą zdarzeń CUDA?

Najlepsze obecnie procesory 4-rdzeniowe osiągają moc obliczeniową rzędu 12Gflops (floating point operations per second). NVIDIA swoimi układami GPU w architekturze CUDA (Compute Unified Device Architecture, czytamy [niestety] z rosyjska "kuda") bije tę wydajność na głowę. Nowa stacja Tesla K40, którą mamy teraz w pracy z pomocą 2688 rdzeni osiąga 5Tflops, a więc około 500...

więcej Pokaż mimo to

avatar
283
114

Na półkach: ,

Książka bardzo dobrze opisuje jak programować wykorzystując narzędzia firmy NVidia. Niestety, praktycznie nie mogłem sprawdzić gdyż nie mam żadnej z kart Nvidi. Mimo tego, ta pozycja jest godna uwagi.

Książka bardzo dobrze opisuje jak programować wykorzystując narzędzia firmy NVidia. Niestety, praktycznie nie mogłem sprawdzić gdyż nie mam żadnej z kart Nvidi. Mimo tego, ta pozycja jest godna uwagi.

Pokaż mimo to

Książka na półkach

  • Przeczytane
    6
  • Posiadam
    3
  • Chcę przeczytać
    2
  • Inne
    1
  • Moje
    1
  • Teraz czytam
    1
  • Informatyka
    1

Cytaty

Podobne książki

Przeczytaj także