ODBIERZ TWÓJ BONUS :: »

Spark. B³yskawiczna analiza danych. Wydanie II

(ebook) (audiobook) (audiobook)
Wydawnictwo:
Helion
Wydawnictwo:
Helion
Ocena:
6.0/6  Opinie: 1
Stron:
360
Druk:
oprawa miêkka
Dostêpne formaty:
     PDF
     ePub
     Mobi
Czytaj fragment

Ksi±¿ka (53,40 z³ najni¿sza cena z 30 dni)

89,00 z³ (-40%)
53,40 z³

Dodaj do koszyka Wysy³amy w 24h

(53,40 z³ najni¿sza cena z 30 dni)

Ebook (44,50 z³ najni¿sza cena z 30 dni)

89,00 z³ (-50%)
44,50 z³

Dodaj do koszyka lub Kup na prezent Kup 1-klikniêciem

(44,50 z³ najni¿sza cena z 30 dni)

Przenie¶ na pó³kê

Do przechowalni

Do przechowalni

Powiadom o dostêpno¶ci audiobooka »

Apache Spark jest oprogramowaniem open source, przeznaczonym do klastrowego przetwarzania danych dostarczanych w ró¿nych formatach. Pozwala na uzyskanie niespotykanej wydajno¶ci, umo¿liwia te¿ pracê w trybie wsadowym i strumieniowym. Framework ten jest równie¿ ¶wietnie przygotowany do uruchamiania z³o¿onych aplikacji, w³±czaj±c w to algorytmy uczenia maszynowego czy analizy predykcyjnej. To wszystko sprawia, ¿e Apache Spark stanowi znakomity wybór dla programistów zajmuj±cych siê big data, a tak¿e eksploracj± i analiz± danych.

To ksi±¿ka przeznaczona dla in¿ynierów danych i programistów, którzy chc± za pomoc± Sparka przeprowadzaæ skomplikowane analizy danych i korzystaæ z algorytmów uczenia maszynowego, nawet je¶li te dane pochodz± z ró¿nych ¼róde³. Wyja¶niono tu, jak dziêki Apache Spark mo¿na odczytywaæ i ujednolicaæ du¿e zbiory informacji, aby powstawa³y niezawodne jeziora danych, w jaki sposób wykonuje siê interaktywne zapytania SQL, a tak¿e jak tworzy siê potoki przy u¿yciu MLlib i wdra¿a modele za pomoc± biblioteki MLflow. Omówiono równie¿ wspó³dzia³anie aplikacji Sparka z jego rozproszonymi komponentami i tryby jej wdra¿ania w poszczególnych ¶rodowiskach.

W ksi±¿ce:

  • API strukturalne dla Pythona, SQL, Scali i Javy
  • operacje Sparka i silnika SQL
  • konfiguracje Sparka i interfejs Spark UI
  • nawi±zywanie po³±czeñ ze ¼ród³ami danych: JSON, Parquet, CSV, Avro, ORC, Hive, S3 i Kafka
  • operacje analityczne na danych wsadowych i strumieniowanych
  • niezawodne potoki danych i potoki uczenia maszynowego

Spark: twórz skalowalne i niezawodne aplikacje big data!

Wybrane bestsellery

O autorach ksi±¿ki

4 Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee

Jules S. Damji - jest in¿ynierem oprogramowania dla wielu wiod±cych firm, takich jak Netscape, Sun Microsystems, Verisign i ProQuest. Zajmuje siê systemami rozproszonymi.

Brooke Wenig - kieruje zespo³em, który opracowuje potoki uczenia maszynowego. Prowadzi te¿ szkolenia z zakresu rozproszonego uczenia maszynowego.

Tathagata Das - jest cz³onkiem Apache Spark Project Management Committee. Pracuje nad strumieniowaniem strukturalnym i Delta Lake.

Denny Lee - zajmuje siê systemami rozproszonymi i in¿ynieri± danych, zw³aszcza dla bran¿y ochrony zdrowia.

Helion - inne ksi±¿ki

Zamknij

Wybierz metodê p³atno¶ci