PySpark. Kurs video. Optymalizacja i procesowanie danych
Czego się nauczysz?
- Przygotowywać środowisko pracy (klaster)
- Konfigurować sesję PySpark
- Agregować dane
- Korzystać z pamięci podręcznej
- Używać funkcji okna
- Pracować z kolekcjami danych
- Działać na danych z różnych źródeł
- Przetwarzać dane w czasie rzeczywistym
- Pracować z formatem Delta
Spis lekcji
Obierz kurs na... optymalizację pracy z danymi
We współczesnej gospodarce rynkowej dane stały się nowym złotem. Kto nimi dysponuje, potrafi je w odpowiedni sposób przetworzyć i wyciągnąć z nich właściwe wnioski, zyskuje sporą przewagę konkurencyjną. Stąd na rynku pracy rosnące zapotrzebowanie na data engineerów – potrzebują ich wszystkie większe firmy i organizacje, których menedżerowie rozumieją wagę informacji w prowadzeniu biznesu, urzędu, instytucji czy dowolnego innego podmiotu. Jeśli interesuje Cię poznanie tajników pracy data engineera albo jeśli masz już doświadczenie w zawodzie i chcesz rozwinąć umiejętności w zakresie świetnego narzędzia służącego sprawniejszej pracy z danymi, to nasz kurs jest dla Ciebie.
Szkolenie, które proponujemy, skupia się na frameworku PySpark (Apache Spark dla Pythona). Jest to najpopularniejszy interfejs programowania aplikacji (API) dla języka Python i zarazem główny element platformy Databricks. Zastosowanie go umożliwia między innymi analizowanie dużych zbiorów danych i przeprowadzanie obliczeń na wielu komputerach równocześnie. Nasz kurs pozwala poznać najważniejsze składowe i funkcjonalności frameworka, rozbudować wiedzę na jego temat o nowe sposoby pobierania danych, pracę z bazami SQL i formatem Delta. W trakcie szkolenia pokazujemy również, jak partycjonować dane, korzystać z pamięci podręcznej (cache) i przetwarzać dane w czasie rzeczywistym (Spark Streaming).
Uwaga! Kurs zawiera informacje, które pojawiają się na rozmowach rekrutacyjnych i podczas certyfikacji.
PySpark. Kurs video. Optymalizacja i procesowanie danych kończy się na poziomie średnio zaawansowanym. Wiedza i umiejętności zdobyte w trakcie szkolenia pozwalają sprawnie korzystać z możliwości frameworka PySpark, rozpocząć pracę z nowymi źródłami danych, a także skuteczniej optymalizować zadania związane z pracą z danymi.
Oceny i opinie klientów: PySpark. Kurs video. Optymalizacja i procesowanie danych Piotr Chudzik (0)
Szczegóły kursu
Helion SA
ul. Kościuszki 1C
41-100 Gliwice
e-mail: gpsr@helion.pl

