Spark. Zaawansowana analiza danych Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills

(ebook) (audiobook) (audiobook)

Czasowo niedostępna
Promocja 2za1

Spark. Zaawansowana analiza danych Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills - okladka książki

Spark. Zaawansowana analiza danych Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills - audiobook MP3

Spark. Zaawansowana analiza danych Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills - audiobook CD

Zajrzyj do książki

Autorzy:: Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
Wydawnictwo:: Helion
Wydawnictwo:: Helion
Ocena:: Bądź pierwszym, który oceni tę książkę
Stron:: 240
Druk:: oprawa miękka
Dostępne formaty::      PDF

     ePub

     Mobi

Czytaj fragment

Książka

49,00 zł

Powiadom mnie, gdy książka będzie dostępna

Ebook

24,50 zł ~~49,00 zł~~ (-50%)

24,50 zł najniższa cena z 30 dni

(2za1 » dobierz ebook GRATIS)

Dodaj do koszyka Dostępny natychmiast po opłaceniu zakupu lub Kup na prezent Kup 1-kliknięciem

Przenieś na półkę

Do przechowalni

Powiadom o dostępności audiobooka »

Czego się nauczysz?

Przetwarzania i analizy dużych zbiorów danych z użyciem Apache Spark
Programowania w języku Scala na potrzeby analizy danych
Tworzenia i uruchamiania zadań Spark oraz korzystania z SparkContext
Agregowania, filtrowania i podsumowywania danych w Spark
Budowania systemów rekomendacyjnych na przykładzie danych Audioscrobbler
Stosowania algorytmu naprzemiennych najmniejszych kwadratów do rekomendacji
Wykorzystywania drzew i lasów decyzyjnych do prognozowania zjawisk
Wykrywania anomalii w danych za pomocą grupowania k-średnich
Przeprowadzania analizy semantycznej tekstu i wyliczania metryk TF-IDF
Analizowania sieci współwystępowań z użyciem biblioteki GraphX
Przetwarzania i analizowania danych geoprzestrzennych i temporalnych
Szacowania ryzyka finansowego metodą symulacji Monte Carlo
Przetwarzania i analizy danych genomicznych z wykorzystaniem narzędzi Spark
Analizy danych neuroobrazowych z użyciem pakietów PySpark i Thunder
Wykorzystywania podprojektów Spark: MLlib, Spark Streaming, Spark SQL, GraphX
Tworzenia i wdrażania procesów uczenia maszynowego z użyciem MLlib Pipelines API

Analiza ogromnych zbiorów danych nie musi być wolna!

Apache Spark to darmowy, zaawansowany szkielet i silnik pozwalający na szybkie przetwarzanie oraz analizę ogromnych zbiorów danych. Prace nad tym projektem rozpoczęły się w 2009 roku, a już rok później Spark został udostępniony użytkownikom. Jeżeli potrzebujesz najwyższej wydajności w przetwarzaniu informacji, jeżeli chcesz uzyskiwać odpowiedź na trudne pytania niemalże w czasie rzeczywistym, Spark może być odpowiedzią na Twoje oczekiwania.

Sięgnij po tę książkę i przekonaj się, czy tak jest w rzeczywistości. Autor porusza tu zaawansowane kwestie związane z analizą statystyczną danych, wykrywaniem anomalii oraz analizą obrazów. Jednak zanim przejdziesz do tych tematów, zapoznasz się z podstawami — wprowadzeniem do analizy danych za pomocą języka Scala oraz Apache Spark. Nauczysz się też przeprowadzać analizę semantyczną i zobaczysz, jak w praktyce przeprowadzić analizę sieci współwystępowań za pomocą biblioteki GraphX. Na koniec dowiesz się, jak przetwarzać dane geoprzestrzenne i genomiczne, a także oszacujesz ryzyko metodą symulacji Monte Carlo. Książka ta pozwoli Ci na wykorzystanie potencjału Apache Spark i zaprzęgnięcie go do najtrudniejszych zadań!

Przykłady prezetnowane w książce obejmują:

Rekomendowanie muzyki i dane Audioscrobbler
Prognozowanie zalesienia za pomocą drzewa decyzyjnego
Wykrywanie anomalii w ruchu sieciowym metodą grupowania według k-średnich
Wikipedia i ukryta analiza semantyczna
Analiza sieci współwystępowań za pomocą biblioteki GraphX
Geoprzestrzenna i temporalna analiza tras nowojorskich taksówek
Szacowanie ryzyka finansowego metodą symulacji Monte Carlo
Analiza danych genomicznych i projekt BDG
Analiza danych neuroobrazowych za pomocą pakietów PySpark i Thunder

Poznaj potencjał i wydajność Apache Spark!

Wybrane bestsellery

Promocja Promocja 2za1

Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.
- książka
- ebook
Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills

(41,40 zł najniższa cena z 30 dni)

41.40 zł ~~69.00 zł (-40%)~~
Promocja Promocja 2za1

In the second edition of this practical book, four Cloudera data scientists present a set of self-contained patterns for performing large-scale data analysis with Spark. The authors bring Spark, statistical methods, and real-world data sets together to teach you how to approach analytics problems by example. Updated for Spark 2.1, this edition acts
- ebook
Advanced Analytics with Spark. Patterns for Learning from Data at Scale. 2nd Edition

Sandy Ryza, Uri Laserson, Sean Owen

(143,65 zł najniższa cena z 30 dni)

143.65 zł ~~169.00 zł (-15%)~~
Promocja Promocja 2za1

The amount of data being generated today is staggering and growing. Apache Spark has emerged as the de facto tool to analyze big data and is now a critical part of the data science toolbox. Updated for Spark 3.0, this practical guide brings together Spark, statistical methods, and real-world datasets to teach you how to approach analytics problems
- ebook
Advanced Analytics with PySpark

Akash Tandon, Sandy Ryza, Uri Laserson

(169,14 zł najniższa cena z 30 dni)

169.14 zł ~~199.00 zł (-15%)~~
Bestseller Nowość Promocja Promocja 2za1

Świadomość tego, co i w jaki sposób jest przekazywane za pomocą sieci, to istotna sprawa. Szczególnie w kontekście potencjalnych ataków i włamań. Jednym z programów pozwalających przechwycić, przeanalizować w czasie rzeczywistym i szczegółowo przebadać pakiety danych przesyłanych w sieciach komputerowych jest Wireshark. Umożliwia on między innymi diagnozowanie problemów sieciowych, wykrywanie ataków i optymalizowanie wydajności sieci.
- książka
- ebook
Wireshark. Analiza ruchu sieciowego i wykrywanie włamań

Adam Józefiok

(90,89 zł najniższa cena z 30 dni)

89.40 zł ~~149.00 zł (-40%)~~
Bestseller Nowość Promocja Promocja 2za1

SQL pozostaje fundamentalnym narzędziem w nowoczesnej analityce danych, a jego znajomość należy do najbardziej pożądanych na rynku IT. W erze big data i podejmowania decyzji opartych na danych ważna jest umiejętność efektywnego wydobywania informacji z relacyjnych baz danych. Czwarte wydanie tej książki, zaktualizowane o najnowsze funkcje PostgreSQL i dostosowane do współczesnych przepływów pracy, łączy tradycyjne podejście SQL-owe z nowoczesnymi narzędziami, jak Python, i technikami uczenia maszynowego.
- książka
- ebook
SQL dla analityków danych. Skutecznie analizuj dane, wyciągaj wartościowe wnioski i opanuj zaawansowany SQL na potrzeby praktycznych zastosowań. Wydanie IV

Jun Shan, Haibin Li, Matt Goldwasser, Upom Malik, Benjamin Johnston

(48,18 zł najniższa cena z 30 dni)

47.40 zł ~~79.00 zł (-40%)~~
Bestseller Nowość Promocja Promocja 2za1

Ta książka ułatwi Ci zrozumienie nawet bardzo złożonych zagadnień związanych z projektowaniem relacyjnych baz danych i zrobi to w niezwykle przyjaznej formie. Nauczysz się sztuki projektowania poprzez praktyczne projekty, przejrzyste ilustracje, a także dzięki metodom nauki, które są ukierunkowane na działanie. Zrozumiesz, w jaki sposób budować bazy zupełnie od podstaw, tak aby umiejętnie połączyć wydajność działania z intuicyjnością obsługi. Krok po kroku zaprojektujesz, wdrożysz i zoptymalizujesz bazę danych dla aplikacji typu e-commerce. Przekonasz się też, jak używać technik generatywnej sztucznej inteligencji do usprawnienia najbardziej żmudnych etapów projektowania.
- książka
- ebook
Relacyjne bazy danych. Ilustrowany przewodnik

Qiang Hao, Michail Tsikerdekis

(54,29 zł najniższa cena z 30 dni)

53.40 zł ~~89.00 zł (-40%)~~
Nowość Promocja Promocja 2za1

Wyobraź sobie, że raport, który przygotowujesz dziś przez dwie godziny, jutro aktualizuje się sam po jednym kliknięciu. Bez ręcznego kopiowania danych, bez poprawiania formatów, bez łączenia kilkunastu plików Excela w środku dnia. Właśnie tak działa Power Query – narzędzie, które zmienia Excela z „arkusza do tabel” w potężne środowisko służące do automatyzacji i analizy danych.
- kurs
Power Query. Kurs video. Analizuj dane jak profesjonalista

Adam Kopeć

(224,25 zł najniższa cena z 30 dni)

239.20 zł ~~299.00 zł (-20%)~~
Nowość Promocja Promocja 2za1

Tę książkę możesz potraktować jako wygodną, szczegółową mapę drogową, dzięki której zrozumiesz specyfikę Microsoft Fabric i dowiesz się, jak się poruszać po architekturze i możliwościach tej platformy. Znajdziesz tu wyjaśnienia, najlepsze praktyki i przykłady rzeczywistych zastosowań, które pomogą Ci płynnie przejść od teorii do praktyki. Zagłębisz się w szczegóły pracy z Fabric, dzięki czemu Twój zespół do spraw danych będzie mógł w pełni korzystać z integracji danych, inżynierii danych, magazynowania danych, data science, analiz czasu rzeczywistego i analityki biznesowej. Wszystko to w ramach wspólnej przestrzeni roboczej, z zunifikowanymi procesami i prostą obsługą.
- książka
- ebook
Microsoft Fabric od podstaw. Kompleksowe projektowanie nowoczesnej analityki danych

Nikola Ilic, Ben Weissman

(59,40 zł najniższa cena z 30 dni)

59.40 zł ~~99.00 zł (-40%)~~
Nowość Promocja Promocja 2za1

Za sprawą tej książki poznasz metodologię rozwiązywania różnorodnych problemów związanych z pracą na danych. Poszczególne techniki zostały tu wyjaśnione krok po kroku, tak by odzwierciedlić tok myślenia i sposób działania profesjonalnego analityka. Znajdziesz tu osiem często spotykanych scenariuszy, z którymi można się zetknąć w tej dziedzinie.
- książka
- ebook
Jak ogarnąć trudne dane? Praktyczne podejście profesjonalnego analityka

David Asboth

(71,40 zł najniższa cena z 30 dni)

71.40 zł ~~119.00 zł (-40%)~~
Promocja Promocja 2za1

Ta książka to kompleksowy przewodnik po umiejętnościach twardych i miękkich niezbędnych do odniesienia sukcesu w tej dynamicznie rozwijającej się dziedzinie. Autorka dzieli się wiedzą zdobytą podczas ponad dziesięcioletniej kariery, pokazując, jak radzić sobie z rzeczywistymi wyzwaniami analitycznymi. Zamiast skupiać się wyłącznie na narzędziach i wzorach, opisuje praktyczne aspekty codziennej pracy analityka. Obejmuje przy tym cały proces: od definiowania pytań i metryk, przez dobór metod statystycznych, aż po skuteczną komunikację z interesariuszami. Omawia również zagadnienia związane z modelowaniem statystycznym, wykorzystaniem zewnętrznych źródeł danych, a także nowoczesnymi narzędziami analitycznymi, w tym zastosowaniem sztucznej inteligencji.
- książka
- ebook
Sztuka analizy danych. Twarde i miękkie umiejętności w czasach sztucznej inteligencji

Mona Khalil

(71,40 zł najniższa cena z 30 dni)

71.40 zł ~~119.00 zł (-40%)~~
Promocja Promocja 2za1

Snowflake jest kompleksową platformą chmurową do przechowywania i analizy danych. Oferuje niemal nieograniczoną skalowalność i szybkie, elastyczne usługi obliczeniowe. Umożliwia tworzenie i rozwijanie potoków danych, a jej nowe funkcjonalności, takie jak wyszukiwanie wektorowe, automatyczne konwersje tekstu do SQL czy generowanie kodu, korzystają z technik AI. Jeśli pracujesz z danymi, Snowflake otwiera przed tobą zupełnie nowe możliwości.
- książka
- ebook
Snowflake. Nowoczesna inżynieria danych w praktyce

Maja Ferle

(59,40 zł najniższa cena z 30 dni)

49.50 zł ~~99.00 zł (-50%)~~
Promocja Promocja 2za1

Żyjemy w rzeczywistości, w której jesteśmy dosłownie zalewani danymi. Dotyczy to zwłaszcza osób pracujących z nimi na co dzień. Ludzki mózg bez pomocy nie jest w stanie w pełni zrozumieć takiego ogromu informacji. Ten, kto pracuje z danymi, musi się wspierać odpowiednimi narzędziami do ich zbierania, przekształcania, analizy i prezentacji po to, by dzielić się efektami swojej pracy, ale też by móc te dane zwizualizować na własne potrzeby. Tu wkracza Power BI narzędzie, które pozwala przygotować raport tak, aby jego analiza mogła zająć zaledwie 60 sekund.
- książka
- ebook
Power BI w praktyce. Przejdź na wyższy poziom analizy danych

Aleksandra Piśko-Pancerz

(47,40 zł najniższa cena z 30 dni)

47.40 zł ~~79.00 zł (-40%)~~
Promocja Promocja 2za1

Data is at the center of many challenges in system design today. Difficult issues such as scalability, consistency, reliability, efficiency, and maintainability need to be resolved. In addition, there's an overwhelming variety of systems, including relational databases, NoSQL datastores, data warehouses, and data lakes. There are cloud services, on
- ebook
Designing Data-Intensive Applications. The Big Ideas Behind Reliable, Scalable, and Maintainable Systems. 2nd Edition

Martin Kleppmann, Chris Riccomini

(203,15 zł najniższa cena z 30 dni)

203.15 zł ~~239.00 zł (-15%)~~

O autorach książki

Sandy Ryza jest starszym analitykiem w Cloudera i aktywnym uczestnikiem projektu Apache Spark.

Uri Laserson jest starszym analitykiem w Cloudera, gdzie pracuje nad językiem Python w środowisku Hadoop.

Sean Owen jest dyrektorem działu analiz danych na region EMEA w Cloudera i uczestnikiem projektu Apache Spark.

Josh Wills jest starszym menedżerem działu analiz danych w Cloudera i inicjatorem pakietu Apache Crunch.

Zobacz pozostałe książki z serii

Ebooka "Spark. Zaawansowana analiza danych" przeczytasz na:

czytnikach Inkbook, Kindle, Pocketbook, Onyx Booxs i innych
systemach Windows, MacOS i innych

systemach Windows, Android, iOS, HarmonyOS
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi

Masz pytania? Zajrzyj do zakładki Pomoc »

Oceny i opinie klientów: Spark. Zaawansowana analiza danych Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills

(0)

Szczegóły książki

Dane producenta: »
Tytuł oryginału:: Advanced Analytics with Spark
Tłumaczenie:: Andrzej Watrak
ISBN Książki drukowanej:: 978-83-283-1461-0, 9788328314610
Data wydania książki drukowanej :: 2015-11-20
ISBN Ebooka:: 978-83-283-1464-1, 9788328314641
Data wydania ebooka :: 2015-11-24 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@helion.pl.
Format:: 168x237
Numer z katalogu:: 38000
Rozmiar pliku Pdf:: 3.1MB
Rozmiar pliku ePub:: 4MB
Rozmiar pliku Mobi:: 8.6MB
Pobierz przykładowy rozdział PDF
Przykłady na ftp

Zgłoś erratę
Kategorie:
Dane » Big Data i bazy danych » NoSQL
Dane » Data science » Machine Learning
Dane » Data science » NLP

Dostępność produktu

Produkt nie został jeszcze oceniony pod kątem ułatwień dostępu lub nie podano żadnych informacji o ułatwieniach dostępu lub są one niewystarczające. Prawdopodobnie Wydawca/Dostawca jeszcze nie umożliwił dokonania walidacji produktu lub nie przekazał odpowiednich informacji na temat jego dostępności.

Spis treści książki

Przedmowa (9)

Słowo wstępne (11)

1. Analiza wielkich zbiorów danych (13)

Wyzwania w nauce o danych (15)
Przedstawiamy Apache Spark (16)
O czym jest ta książka (18)

2. Wprowadzenie do analizy danych za pomocą Scala i Spark (21)

Scala dla badaczy danych (22)
Model programowania w Spark (23)
Wiązanie rekordów danych (23)
Pierwsze kroki - powłoka Spark i kontekst SparkContext (24)
Przesyłanie danych z klastra do klienta (29)
Wysyłanie kodu z klienta do klastra (32)
Tworzenie list danych i klas wyboru (33)
Agregowanie danych (36)
Tworzenie histogramów (38)
Statystyki sumaryzacyjne ciągłych wartości (39)
Tworzenie współdzielonego kodu wyliczającego statystyki sumaryczne (40)
Prosty wybór zmiennych i ocena zgodności rekordów (44)
Następny krok (45)

3. Rekomendowanie muzyki i dane Audioscrobbler (47)

Zbiór danych (48)
Algorytm rekomendacyjny wykorzystujący metodę naprzemiennych najmniejszych kwadratów (49)
Przygotowanie danych (51)
Utworzenie pierwszego modelu (54)
Wyrywkowe sprawdzanie rekomendacji (56)
Ocena jakości rekomendacji (57)
Obliczenie metryki AUC (59)
Dobór wartości hiperparametrów (60)
Przygotowanie rekomendacji (62)
Dalsze kroki (63)

4. Prognozowanie zalesienia za pomocą drzewa decyzyjnego (65)

Szybkie przejście do regresji (65)
Wektory i cechy (66)
Przykłady treningowe (67)
Drzewa i lasy decyzyjne (68)
Dane Covtype (70)
Przygotowanie danych (71)
Pierwsze drzewo decyzyjne (72)
Hiperparametry drzewa decyzyjnego (76)
Regulacja drzewa decyzyjnego (77)
Weryfikacja cech kategorialnych (79)
Losowy las decyzyjny (81)
Prognozowanie (83)
Dalsze kroki (83)

5. Wykrywanie anomalii w ruchu sieciowym metodą grupowania według k-średnich (85)

Wykrywanie anomalii (86)
Grupowanie według k-średnich (86)
Włamania sieciowe (87)
Dane KDD Cup 1999 (87)
Pierwsza próba grupowania (88)
Dobór wartości k (90)
Wizualizacja w środowisku R (93)
Normalizacja cech (94)
Zmienne kategorialne (96)
Wykorzystanie etykiet i wskaźnika entropii (97)
Grupowanie w akcji (98)
Dalsze kroki (100)

6. Wikipedia i ukryta analiza semantyczna (101)

Macierz słowo - dokument (102)
Pobranie danych (104)
Analiza składni i przygotowanie danych (104)
Lematyzacja (105)
Wyliczenie metryk TF-IDF (106)
Rozkład według wartości osobliwych (108)
Wyszukiwanie ważnych pojęć (110)
Wyszukiwanie i ocenianie informacji za pomocą niskowymiarowej reprezentacji danych (113)
Związek dwóch słów (114)
Związek dwóch dokumentów (115)
Związek słowa i dokumentu (116)
Wyszukiwanie wielu słów (117)
Dalsze kroki (118)

7. Analiza sieci współwystępowań za pomocą biblioteki GraphX (121)

Katalog cytowań bazy MEDLINE - analiza sieci (122)
Pobranie danych (123)
Analiza dokumentów XML za pomocą biblioteki Scala (125)
Analiza głównych znaczników i ich współwystępowań (126)
Konstruowanie sieci współwystępowań za pomocą biblioteki GraphX (128)
Struktura sieci (131)
- Połączone komponenty (131)
- Rozkład stopni wierzchołków (133)
Filtrowanie krawędzi zakłócających dane (135)
- Przetwarzanie struktury EdgeTriplet (136)
- Analiza przefiltrowanego grafu (138)
Sieci typu "mały świat" (139)
- Kliki i współczynniki klastrowania (139)
- Obliczenie średniej długości ścieżki za pomocą systemu Pregel (141)
Dalsze kroki (145)

8. Geoprzestrzenna i temporalna analiza tras nowojorskich taksówek (147)

Pobranie danych (148)
Przetwarzanie danych temporalnych i geoprzestrzennych w systemie Spark (148)
Przetwarzanie danych temporalnych za pomocą bibliotek JodaTime i NScalaTime (149)
Przetwarzanie danych geoprzestrzennych za pomocą Esri Geometry API i Spray (150)
- Użycie interfejsu API Esri Geometry (151)
- Wprowadzenie do formatu GeoJSON (152)
Przygotowanie danych dotyczących kursów taksówek (154)
- Obsługa dużej liczby błędnych rekordów danych (155)
- Analiza danych geoprzestrzennych (158)
Sesjonowanie w systemie Spark (161)
- Budowanie sesji - dodatkowe sortowanie danych w systemie Spark (162)
Dalsze kroki (165)

9. Szacowanie ryzyka finansowego metodą symulacji Monte Carlo (167)

Terminologia (168)
Metody obliczania wskaźnika VaR (169)
- Wariancja-kowariancja (169)
- Symulacja historyczna (169)
- Symulacja Monte Carlo (169)
Nasz model (170)
Pobranie danych (171)
Wstępne przetworzenie danych (171)
Określenie wag czynników (174)
Losowanie prób (176)
- Wielowymiarowy rozkład normalny (178)
Wykonanie testów (179)
Wizualizacja rozkładu zwrotów (181)
Ocena wyników (182)
Dalsze kroki (184)

10. Analiza danych genomicznych i projekt BDG (187)

Rozdzielenie sposobów zapisu i modelowania danych (188)
Przetwarzanie danych genomicznych za pomocą wiersza poleceń systemu ADAM (190)
- Format Parquet i format kolumnowy (195)
Prognozowanie miejsc wiązania czynnika transkrypcyjnego na podstawie danych ENCODE (197)
Odczytywanie informacji o genotypach z danych 1000 Genomes (203)
Dalsze kroki (204)

11. Analiza danych neuroobrazowych za pomocą pakietów PySpark i Thunder (205)

Ogólne informacje o pakiecie PySpark (206)
- Budowa pakietu PySpark (207)
Ogólne informacje i instalacja biblioteki pakietu Thunder (209)
Ładowanie danych za pomocą pakietu Thunder (210)
- Podstawowe typy danych w pakiecie Thunder (214)
Klasyfikowanie neuronów za pomocą pakietu Thunder (216)
Dalsze kroki (221)

A. Więcej o systemie Spark (223)

Serializacja (224)
Akumulatory (225)
System Spark i metody pracy badacza danych (226)
Formaty plików (228)
Podprojekty Spark (229)
- MLlib (229)
- Spark Streaming (230)
- Spark SQL (230)
- GraphX (230)

B. Nowy interfejs MLlib Pipelines API (231)

Samo modelowanie to za mało (231)
Interfejs API Pipelines (232)
Przykład procesu klasyfikacji tekstu (233)

Skorowidz (237)

pokaż cały spis treści

Helion - inne książki

Nowość Promocja Promocja 2za1

Jeśli pracujesz w sektorze IT i masz kontakt z klientami lub ze współpracownikami z krajów niemieckojęzycznych, ten podręcznik powinien się stać Twoją lekturą obowiązkową. Podobnie, jeżeli przygotowujesz się do wykonywania zawodu związanego z informatyką, elektroniką czy techniką i rozważasz wyjazd do Niemiec, Austrii lub Szwajcarii. Przyda Ci się również, jeśli jesteś lektorem lub lektorką języka niemieckiego i uczysz obecnych i przyszłych specjalistów z sektora nowoczesnych technologii.
- książka
- ebook
Nowoczesny niemiecki dla branży IT. Praktyczne przykłady i ćwiczenia

Izabela Kein

(48,18 zł najniższa cena z 30 dni)

47.40 zł ~~79.00 zł (-40%)~~
Bestseller Nowość Promocja Promocja 2za1

Automatyka przemysłowa i systemy sterowania stanowią fundament współczesnego przemysłu. Dzięki ich zastosowaniu możliwe jest precyzyjne planowanie, prowadzenie i koordynowanie procesów technologicznych. Znajomość zasad rządzących zarówno automatyką, jak i sterowaniem pozostaje obowiązkowa dla projektantów, osób uruchamiających i obsługujących urządzenia przemysłowe.
- książka
- ebook
Automatyka przemysłowa i systemy sterowania w pigułce

Witold Krieser

(36,54 zł najniższa cena z 30 dni)

35.94 zł ~~59.90 zł (-40%)~~
Bestseller Nowość Promocja Promocja 2za1

W tej książce znajdziesz sposób na zapanowanie nad złożonością integracji AI. Poznasz koncepcje i procesy architektoniczne kluczowe dla budowania skalowalnych, solidnych systemów AI przy jednoczesnej minimalizacji ryzyka związanego z ich rozwojem i konserwacją. Poszczególne zagadnienia zostały zilustrowane rzeczywistymi przykładami i wzbogacone o praktyczne ćwiczenia, co pozwoli Ci pogłębić zrozumienie omawianych tematów. Krok po kroku nauczysz się budować kluczowe komponenty architektoniczne wspierające systemy AI. Książkę w szczególności docenią architekci i doświadczeni programiści, którzy chcą budować systemy AI w sposób uporządkowany, przewidywalny i zgodny z zasadami inżynierii oprogramowania.
- książka
- ebook
Architektura systemów AI. Projektowanie skalowalnego i niezawodnego oprogramowania

Richard D Avila, Imran Ahmad

(41,40 zł najniższa cena z 30 dni)

41.40 zł ~~69.00 zł (-40%)~~
Bestseller Nowość Promocja Promocja 2za1

Książka stanowi kompleksowe wprowadzenie do stosowanego wnioskowania bayesowskiego i jego implementacji w Pythonie. Autor używa nowoczesnej biblioteki PyMC do programowania probabilistycznego, a ArviZ do analizy i diagnostyki modeli. Omawia także inne narzędzia ekosystemu bayesowskiego, takie jak Bambi, PreliZ i Kulprit. Zapoznasz się z zagadnieniami bayesowskich addytywnych drzew regresyjnych (BART), selekcji zmiennych, konstrukcji rozkładów a priori i porównywania modeli. Ponadto dowiesz się, jak budować, analizować i interpretować modele probabilistyczne w projektach z zakresu data science.
- książka
- ebook
Analiza bayesowska w Pythonie. Praktyczny przewodnik po modelowaniu probabilistycznym. Wydanie III

Osvaldo Martin

(54,29 zł najniższa cena z 30 dni)

53.40 zł ~~89.00 zł (-40%)~~
Bestseller Nowość Promocja Promocja 2za1

Systemy bazodanowe Oracle stanowią jeden z filarów infrastruktury IT w dużych organizacjach. Wspierają systemy biznesowe, zapewniając wysoką dostępność, wydajność i bezpieczeństwo przetwarzanych danych. Administrowanie takimi środowiskami to nie tylko utrzymanie ciągłości ich działania, ale również optymalizacja, automatyzacja i rozwiązywanie złożonych problemów w systemach o dużej skali. Kompetencje w tym obszarze są wysoko cenione na rynku i otwierają drogę do pracy przy najbardziej wymagających projektach IT.
- książka
- ebook
Administrowanie bazą danych Oracle w środowisku Linux

Karol Wieliczko

(60,39 zł najniższa cena z 30 dni)

59.40 zł ~~99.00 zł (-40%)~~
Nowość Promocja Promocja 2za1

Najpierw był wizjonerem technologicznym. Później, jako założyciel Microsoftu, przeobraził się w wyrachowanego kapitalistę, by po latach powrócić na scenę jako globalny filantrop. Nazywano go genialnym, bajecznie bogatym, hojnym. Czczono niemal jak króla. Aż w końcu na tym idealnym wizerunku pojawiła się głęboka rysa. I to nie jedna.
- książka
- ebook
Bill Gates. Wizja. Władza. Pieniądze. O wpływach, biznesie i tym, co niejawne

Anupreeta Das

(36,54 zł najniższa cena z 30 dni)

35.94 zł ~~59.90 zł (-40%)~~
Bestseller Nowość Promocja Promocja 2za1

Autorzy prowadzą czytelnika przez wszystkie aspekty profesjonalnego programowania w Node.js od fundamentów platformy i systemu modułów, przez programowanie asynchroniczne z wykorzystaniem callbacks, obietnic i async/await, aż po zaawansowane wzorce projektowe i architektury mikrousług. Szczegółowo omawiają strumienie Node.js, konstrukcyjne, strukturalne i behawioralne wzorce projektowe. Książka zawiera praktyczne receptury odpowiadające na typowe wyzwania: asynchroniczną inicjalizację, buforowanie, anulowanie operacji czy wykonywanie zadań obciążających procesor. Końcowe rozdziały koncentrują się na skalowalności przedstawiają techniki skalowania aplikacji, zastosowanie Kubernetes i wzorce komunikacji w systemach rozproszonych z użyciem Redis, RabbitMQ i ZeroMQ.
- książka
- ebook
Node.js. Wzorce projektowe i techniki tworzenia aplikacji produkcyjnych. Wydanie IV

Luciano Mammino, Mario Casciaro, Colin J. Ihrig (Foreword), Matteo Collina (Fore

(78,69 zł najniższa cena z 30 dni)

77.40 zł ~~129.00 zł (-40%)~~
Nowość Promocja Promocja 2za1

Dane są dziś powszechnie dostępne, ale rzadko w takiej formie, w jakiej ich potrzebujemy. Na szczęście z pomocą przychodzi Power Query. To nowoczesne narzędzie idealne do analityki w Excelu i Power BI, które zamienia żmudne, wielogodzinne czyszczenie danych w automatyczny, błyskawiczny proces.
- książka
- ebook
Power Query w Excelu. Analizuj dane jak profesjonalista

Adam Kopeć

(54,29 zł najniższa cena z 30 dni)

53.40 zł ~~89.00 zł (-40%)~~
Bestseller Nowość Promocja Promocja 2za1

Sztuczna inteligencja coraz silniej wpływa na nasze życie. Systemy oparte na uczeniu maszynowym decydują o przyznaniu kredytu, wspierają diagnozowanie chorób, odgrywają coraz większą rolę w odkryciach z zakresu biologii, chemii, fizyki czy medycyny. Skokowy rozwój dużych modeli językowych, takich jak ChatGPT, Gemini czy Claude, pozwala używać AI do zadań, które jeszcze niedawno były zarezerwowane wyłącznie dla ludzi.
- książka
- ebook
Dlaczego maszyny się uczą? O pięknie matematyki i działaniu współczesnej sztucznej inteligencji

Anil Ananthaswamy

(41,40 zł najniższa cena z 30 dni)

41.40 zł ~~69.00 zł (-40%)~~
Bestseller Nowość Promocja Promocja 2za1

Terraform to oprogramowanie typu open source umożliwiające zarządzanie infrastrukturą IT jako kodem (IaC, ang. infrastructure as code). Pozwala deklaratywnie zdefiniować zasoby chmurowe - takie jak AWS, Azure czy Google Cloud a także zasoby lokalne przy użyciu języka HCL, a potem zautomatyzować ich wdrażanie, wersjonowanie i modyfikowanie.
- książka
- ebook
Terraform w praktyce. Buduj i automatyzuj infrastrukturę chmurową oraz zarządzaj nią z wykorzystaniem Dockera

Mariusz Dworniczak

(29,95 zł najniższa cena z 30 dni)

35.94 zł ~~59.90 zł (-40%)~~

Najczęściej zadawane pytania (FAQ)

1. Czy muszę znać Apache Spark lub język Scala, żeby korzystać z tej książki?

Nie, książka wprowadza czytelnika w podstawy zarówno Apache Spark, jak i języka Scala, dzięki czemu osoby początkujące mogą swobodnie rozpocząć naukę i stopniowo przechodzić do zagadnień zaawansowanych.

2. Jakie praktyczne przykłady analizy danych znajdę w tej książce?

Książka zawiera liczne przykłady praktyczne, m.in. rekomendowanie muzyki, prognozowanie zalesienia, wykrywanie anomalii w ruchu sieciowym, analizę tras taksówek, analizę danych genomicznych i neuroobrazowych oraz szacowanie ryzyka finansowego.

3. Czy książka omawia najnowsze funkcje i narzędzia Apache Spark?

Tak, w książce znajdziesz omówienie aktualnych bibliotek i narzędzi Spark, takich jak MLlib, Spark Streaming, Spark SQL, GraphX oraz nowy interfejs MLlib Pipelines API.

4. Czy publikacja zawiera przykłady kodu i instrukcje krok po kroku?

Tak, książka prezentuje liczne fragmenty kodu z dokładnymi instrukcjami, co pozwala łatwo wdrożyć omawiane techniki w praktyce.

5. Czy mogę wykorzystać wiedzę z książki do własnych projektów analizy danych?

Zdecydowanie tak - książka nie tylko omawia teoretyczne podstawy, ale również pokazuje, jak zastosować Spark w realnych projektach, dzięki czemu zdobytą wiedzę można od razu wykorzystać w praktyce.

6. W jakim formacie dostępna jest książka na Helion.pl?

Książka dostępna jest w wersji drukowanej oraz w formatach elektronicznych (e-book: PDF, ePub, mobi), co pozwala czytać ją na różnych urządzeniach.

7. Czy po przeczytaniu książki będę w stanie samodzielnie analizować duże zbiory danych?

Tak, po zapoznaniu się z treścią książki zdobędziesz praktyczną wiedzę i umiejętności pozwalające na samodzielną analizę dużych zbiorów danych z użyciem Apache Spark.

8. Czy książka nadaje się do nauki w ramach kursów lub studiów z analizy danych?

Tak, publikacja doskonale sprawdzi się jako materiał pomocniczy do nauki na kursach, szkoleniach czy studiach związanych z analizą danych, big data i uczeniem maszynowym.

Zamknij

Proszę czekać...

Spark. Zaawansowana analiza danych Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills

Kup w zestawie z dodatkowym rabatem

Opis książki : Spark. Zaawansowana analiza danych

Analiza ogromnych zbiorów danych nie musi być wolna!