SQL for Data Analytics

- Autorzy:
- Upom Malik, Matt Goldwasser, Benjamin Johnston


- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 386
- Dostępne formaty:
-
PDFePubMobi
Opis książki: SQL for Data Analytics
Understanding and finding patterns in data has become one of the most important ways to improve business decisions. If you know the basics of SQL, but don't know how to use it to gain the most effective business insights from data, this book is for you.
SQL for Data Analytics helps you build the skills to move beyond basic SQL and instead learn to spot patterns and explain the logic hidden in data. You'll discover how to explore and understand data by identifying trends and unlocking deeper insights. You'll also gain experience working with different types of data in SQL, including time-series, geospatial, and text data. Finally, you'll learn how to increase your productivity with the help of profiling and automation.
By the end of this book, you'll be able to use SQL in everyday business scenarios efficiently and look at data with the critical eye of an analytics professional.
Please note: if you are having difficulty loading the sample datasets, there are new instructions uploaded to the GitHub repository. The link to the GitHub repository can be found in the book's preface.
Wybrane bestsellery
-
Dzięki tej książce nauczysz się przekształcać suche dane liczbowe w pełną empatii narrację! Aby spełniły one swoje zadanie, ktoś musi przedstawić zawarte w nich informacje w postaci opowieści. W tej publikacji wyczerpująco i praktycznie opisano przebieg tego procesu. Jej lektura sprawi, że rozwin...
Opowieści ukryte w danych. Wyjaśnij dane i wywołaj działania za pomocą narracji Opowieści ukryte w danych. Wyjaśnij dane i wywołaj działania za pomocą narracji
(0,00 zł najniższa cena z 30 dni)20.90 zł
67.00 zł(-69%) -
Metody statystyczne są kluczowym elementem data science, mimo to niewielu specjalistów data science posiada formalne wykształcenie statystyczne. Kursy i podręczniki o podstawach statystyki, rzadko kiedy omawiają temat z perspektywy data science. W drugim wydaniu tego popularnego podręcznika zosta...
Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II
(0,00 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
To kolejne wydanie lubianego samouczka, dzięki któremu w ramach 24 godzinnych lekcji przyswoisz solidne podstawy programowania. Zrozumiesz, jak działają programy, i nauczysz się reguł stosowanych przez profesjonalistów przy ich projektowaniu. Dowiesz się, jak wygląda świat programistów i na czym ...
Programowanie dla początkujących w 24 godziny. Wydanie IV Programowanie dla początkujących w 24 godziny. Wydanie IV
(0,00 zł najniższa cena z 30 dni)34.50 zł
69.00 zł(-50%) -
BPMN pozwala na ciągłe analizowanie, monitorowanie i optymalizowanie procesów biznesowych. Jest narzędziem bardzo skutecznym, prawdziwym „świętym Graalem” współczesnego biznesu. Jednak nie jest on niestety tak przyjazny, jak mógłby oczekiwać początkujący użytkownik. Jego oryginalną sp...
Zrozumieć BPMN. Modelowanie procesów biznesowych. Wydanie 2 rozszerzone Zrozumieć BPMN. Modelowanie procesów biznesowych. Wydanie 2 rozszerzone
(0,00 zł najniższa cena z 30 dni)34.30 zł
49.00 zł(-30%) -
Oto piąte, zaktualizowane wydanie świetnego podręcznika, dzięki któremu niemal bez wysiłku nauczysz się podstaw języka SQL. Książka została podzielona na 22 rozdziały ? lektura jednego z nich nie powinna Ci zająć więcej niż 10 minut. Najpierw pokazano, w jaki sposób dokonać prostego pobierania da...
SQL w mgnieniu oka. Opanuj język zapytań w 10 minut dziennie. Wydanie V SQL w mgnieniu oka. Opanuj język zapytań w 10 minut dziennie. Wydanie V
(0,00 zł najniższa cena z 30 dni)41.30 zł
59.00 zł(-30%) -
To trzecie, poprawione i zaktualizowane wydanie praktycznego przewodnika po języku SQL i relacyjnych bazach danych. Przemyślana, uporządkowana struktura podręcznika sprzyja sprawnemu nabywaniu wiedzy i doskonaleniu umiejętności — pracę z nim ułatwiają przystępny sposób prezentowania materia...(0,00 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%) -
Ta książka jest przewodnikiem dla każdego, kto musi przekazywać informacje, robiąc przy tym użytek z danych. Szczególnie wartościowa będzie dla analityków, studentów i naukowców, a także dla każdego, kto w swojej komunikacji odwołuje się do danych. Pokazano tu prostą i intuicyjną technikę przedst...
Storytelling danych. Poradnik wizualizacji danych dla profesjonalistów Storytelling danych. Poradnik wizualizacji danych dla profesjonalistów
(0,00 zł najniższa cena z 30 dni)53.90 zł
77.00 zł(-30%) -
To drugie, w pełni zaktualizowane wydanie znakomitego przewodnika, dzięki któremu bezproblemowo rozpoczniesz pracę z Power BI i w pełni wykorzystasz jego możliwości. Dowiesz się, jak pozyskiwać i oczyszczać dane z różnych źródeł, a także jak zaprojektować model danych, aby móc analizować relacje ...
Microsoft Power BI. Jak modelować i wizualizować dane oraz budować narracje cyfrowe. Wydanie II Microsoft Power BI. Jak modelować i wizualizować dane oraz budować narracje cyfrowe. Wydanie II
Devin Knight, Mitchell Pearson, Bradley Schacht, Erin Ostrowsky
(0,00 zł najniższa cena z 30 dni)53.90 zł
77.00 zł(-30%) -
To książka przeznaczona dla osób, które dobrze poznały podstawy języka SQL i chcą nabrać biegłości w praktycznym zastosowaniu jego zaawansowanych funkcji. Poszczególne zagadnienia zostały zaprezentowane poprzez stopniową rozbudowę i zwiększanie złożoności prostych zapytań SQL. Omówiono takie tech...
Praktyczna nauka SQL dla Oracle. Wykorzystaj ogromne możliwości bazy danych Oracle Praktyczna nauka SQL dla Oracle. Wykorzystaj ogromne możliwości bazy danych Oracle
(0,00 zł najniższa cena z 30 dni)53.90 zł
77.00 zł(-30%) -
Cathy Tanimura jest analityczką danych z ponad dwudziestoletnim doświadczeniem. Odnosiła również sukcesy, budując zespoły do spraw analizy danych i tworząc potrzebną infrastrukturę. Zajmowała się także zarządzaniem zespołami w kilku czołowych firmach technologicznych. Od wielu lat używa języka SQ...
Analiza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski Analiza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski
(0,00 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%)
O autorach książki
3 Upom Malik, Matt Goldwasser, Benjamin JohnstonUpom Malik jest naukowcem, zajmuje się analizą danych i stosowaniem SQL do rozwiązywania problemów z branży finansów i energetyki.
Matt Goldwasser od lat pracuje jako analityk danych w prestiżowych firmach. Lubi rozwiązywać problemy z uczeniem maszynowym i poznawać nowe technologie.
Benjamin Johnston zajmuje się zaawansowaną analizą danych w branży medycznej. Interesuje się uczeniem maszynowym, przetwarzaniem obrazów i sieciami neuronowymi.
Upom Malik, Matt Goldwasser, Benjamin Johnston - pozostałe książki
-
Ta książka jest znakomitym przewodnikiem dla początkującego analityka danych. Dzięki niej dowiesz się, jak skutecznie przesiewać i uzyskiwać informacje z surowych danych. Nauczysz się formułować hipotezy i generować opisowe statystyki, a także pisać złożone zapytania SQL, które pozwalają na zagre...
SQL. Analiza danych za pomocą zapytań. Warsztaty praktyczne. Wydanie II SQL. Analiza danych za pomocą zapytań. Warsztaty praktyczne. Wydanie II
(53.40 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Learning how to apply unsupervised algorithms on unlabeled datasets from scratch can be easier than you thought with this beginner's workshop, featuring interesting examples and activities
-
Discover how you can supervise machine learning algorithms in Python and personalize predictive models with the help of real-world datasets
The Supervised Learning Workshop - Second Edition The Supervised Learning Workshop - Second Edition
Blaine Bateman, Ashish Ranjan Jha, Benjamin Johnston, Ishita Mathur
-
Take a step-by-step approach to learning SQL data analysis in this interactive workshop that uses fun exercises and activities to make learning data analytics for beginners easy and approachable.
The Applied SQL Data Analytics Workshop - Second Edition The Applied SQL Data Analytics Workshop - Second Edition
-
Design clever algorithms that can uncover interesting structures and hidden relationships in unstructured, unlabeled data Key Features Learn how to select the most suitable Python library to solve your problem Compare k-Nearest Neighbor (k-NN) and non-parametric methods and decide when to use ...
-
Explore the exciting world of machine learning with the fastest growing technology in the world Key Features Understand various machine learning concepts with real-world examples Implement a supervised machine learning pipeline from data ingestion to validation Gain insights into how you can us...
Ebooka przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolonych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video zobaczysz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolonych urządzeniach i aplikacjach obsługujących format MP4 (pliki spakowane w ZIP)
Szczegóły książki
- Tytuł oryginału:
- SQL for Data Analytics
- ISBN Ebooka:
- 978-17-898-0384-6, 9781789803846
- Data wydania ebooka:
-
2019-08-23
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@helion.pl.
- Język publikacji:
- angielski
- Rozmiar pliku Pdf:
- 21.8MB
- Rozmiar pliku ePub:
- 25.1MB
- Rozmiar pliku Mobi:
- 25.1MB
- Kategorie:
Bazy danych » SQL - Programowanie
Big Data » Analiza danych
Spis treści książki
- SQL for Data Analytics
- Preface
- About the Book
- About the Authors
- Learning Objectives
- Audience
- Approach
- Hardware Requirements
- Software Requirements
- Conventions
- Installation and Setup
- Installing PostgreSQL 10.9
- Installing Python
- Installing Git
- Loading the Sample Databases
- Running SQL Files
- Additional Resources
- About the Book
- 1. Understanding and Describing Data
- Introduction
- The World of Data
- Types of Data
- Data Analytics and Statistics
- Types of Statistics
- Activity 1: Classifying a New Dataset
- Methods of Descriptive Statistics
- Univariate Analysis
- Data Frequency Distribution
- Exercise 1: Creating a Histogram
- Exercise 2: Calculating the Quartiles for Add-on Sales
- Central Tendency
- Exercise 3: Calculating the Central Tendency of Add-on Sales
- Dispersion
- Exercise 4: Dispersion of Add-on Sales
- Bivariate Analysis
- Scatterplots
- Exercise 5: Calculating the Pearson Correlation Coefficient for Two Variables
- Activity 2: Exploring Dealership Sales Data
- Working with Missing Data
- Statistical Significance Testing
- Common Statistical Significance Tests
- Summary
- 2. The Basics of SQL for Analytics
- Introduction
- Relational Databases and SQL
- Advantages and Disadvantages of SQL Databases
- Basic Data Types of SQL
- Numeric
- Character
- Boolean
- Datetime
- Data Structures: JSON and Arrays
- Reading Tables: The SELECT Query
- Basic Anatomy and Working of a SELECT Query
- Basic Keywords in a SELECT Query
- Exercise 6: Querying the Salespeople Table Using Basic Keywords in a SELECT Query
- Activity 3: Querying the customers Table Using Basic Keywords in a SELECT Query
- Creating Tables
- Creating Blank Tables
- Exercise 7: Creating a Table in SQL
- Creating Tables with SELECT
- Updating Tables
- Adding and Removing Columns
- Adding New Data
- Updating Existing Rows
- Exercise 8: Updating Tables in SQL
- Deleting Data and Tables
- Deleting Values from a Row
- Deleting Rows from a Table
- Deleting Tables
- Exercise 9: Unnecessary Reference Table
- Activity 4: Marketing Operations
- SQL and Analytics
- Summary
- 3. SQL for Data Preparation
- Introduction
- Assembling Data
- Connecting Tables Using JOIN
- Types of Joins
- Exercise 10: Using Joins to Analyze Sales Dealership
- Subqueries
- Unions
- Exercise 11: Generating an Elite Customer Party Guest List using UNION
- Common Table Expressions
- Transforming Data
- Exercise 12: Using the CASE WHEN Function to Get Regional Lists
- Activity 5: Building a Sales Model Using SQL Techniques
- Summary
- 4. Aggregate Functions for Data Analysis
- Introduction
- Aggregate Functions
- Exercise 13: Using Aggregate Functions to Analyze Data
- Aggregate Functions with GROUP BY
- GROUP BY
- Multiple Column GROUP BY
- Exercise 14: Calculating the Cost by Product Type Using GROUP BY
- Grouping Sets
- Ordered Set Aggregates
- The HAVING Clause
- Exercise 15: Calculating and Displaying Data Using the HAVING Clause
- Using Aggregates to Clean Data and Examine Data Quality
- Finding Missing Values with GROUP BY
- Measuring Data Quality with Aggregates
- Activity 6: Analyzing Sales Data Using Aggregate Functions
- Summary
- 5. Window Functions for Data Analysis
- Introduction
- Window Functions
- The Basics of Window Functions
- Exercise 16: Analyzing Customer Data Fill Rates over Time
- The WINDOW Keyword
- Statistics with Window Functions
- Exercise 17: Rank Order of Hiring
- Window Frame
- Exercise 18: Team Lunch Motivation
- Activity 7: Analyzing Sales Using Window Frames and Window Functions
- Summary
- 6. Importing and Exporting Data
- Introduction
- The COPY Command
- Getting Started with COPY
- Copying Data with psql
- Configuring COPY and \copy
- Using COPY and \copy to Bulk Upload Data to Your Database
- Exercise 19: Exporting Data to a File for Further Processing in Excel
- Using R with Our Database
- Why Use R?
- Getting Started with R
- Using Python with Our Database
- Why Use Python?
- Getting Started with Python
- Exercise 20: Exporting Data from a Database within Python
- Improving Postgres Access in Python with SQLAlchemy and Pandas
- What is SQLAlchemy?
- Using Python with Jupyter Notebooks
- Reading and Writing to our Database with Pandas
- Performing Data Visualization with Pandas
- Exercise 21: Reading Data and Visualizing Data in Python
- Writing Data to the Database Using Python
- Improving Python Write Speed with COPY
- Reading and Writing CSV Files with Python
- Best Practices for Importing and Exporting Data
- Going Password-Less
- Activity 8: Using an External Dataset to Discover Sales Trends
- Summary
- 7. Analytics Using Complex Data Types
- Introduction
- Date and Time Data Types for Analysis
- Starting with the Date Type
- Transforming Date Types
- Intervals
- Exercise 22: Analytics with Time Series Data
- Performing Geospatial Analysis in Postgres
- Latitude and Longitude
- Representing Latitude and Longitude in Postgres
- Exercise 23: Geospatial Analysis
- Using Array Data Types in Postgres
- Starting with Arrays
- Using JSON Data Types in Postgres
- JSONB: Pre-Parsed JSON
- Accessing Data from a JSON or JSONB Field
- Creating and Modifying Data in a JSONB Field
- Exercise 24: Searching through JSONB
- Text Analytics Using Postgres
- Tokenizing Text
- Exercise 25: Performing Text Analytics
- Performing Text Search
- Optimizing Text Search on Postgres
- Activity 9: Sales Search and Analysis
- Summary
- 8. Performant SQL
- Introduction
- Database Scanning Methods
- Query Planning
- Scanning and Sequential Scans
- Exercise 26: Interpreting the Query Planner
- Activity 10: Query Planning
- Index Scanning
- The B-tree Index
- Exercise 27: Creating an Index Scan
- Activity 11: Implementing Index Scans
- Hash Index
- Exercise 28: Generating Several Hash Indexes to Investigate Performance
- Activity 12: Implementing Hash Indexes
- Effective Index Use
- Performant Joins
- Exercise 29: Determining the Use of Inner Joins
- Activity 13: Implementing Joins
- Functions and Triggers
- Function Definitions
- Exercise 30: Creating Functions without Arguments
- Activity 14: Defining a Maximum Sale Function
- Exercise 31: Creating Functions with Arguments Using a Single Function
- Activity 15: Creating Functions with Arguments
- Triggers
- Exercise 32: Creating Triggers to Update Fields
- Activity 16: Creating a Trigger to Track Average Purchases
- Killing Queries
- Exercise 33: Canceling a Long Query
- Activity 17: Terminating a Long Query
- Summary
- 9. Using SQL to Uncover the Truth a Case Study
- Introduction
- Case Study
- Scientific Method
- Exercise 34: Preliminary Data Collection Using SQL Techniques
- Exercise 35: Extracting the Sales Information
- Activity 18: Quantifying the Sales Drop
- Exercise 36: Launch Timing Analysis
- Activity 19: Analyzing the Difference in the Sales Price Hypothesis
- Exercise 37: Analyzing Sales Growth by Email Opening Rate
- Exercise 38: Analyzing the Performance of the Email Marketing Campaign
- Conclusions
- In-Field Testing
- Summary
- Appendix
- 1. Understanding and Describing Data
- Activity 1: Classifying a New Dataset
- Activity 2: Exploring Dealership Sales Data
- 1. Understanding and Describing Data
- 2. The Basics of SQL for Analytics
- Activity 3: Querying the customers Table Using Basic Keywords in a SELECT Query
- Activity 4: Marketing Operations
- 3. SQL for Data Preparation
- Activity 5: Building a Sales Model Using SQL Techniques
- 4. Aggregate Functions for Data Analysis
- Activity 6: Analyzing Sales Data Using Aggregate Functions
- 5. Window Functions for Data Analysis
- Activity 7: Analyzing Sales Using Window Frames and Window Functions
- 6. Importing and Exporting Data
- Activity 8: Using an External Dataset to Discover Sales Trends
- 7. Analytics Using Complex Data Types
- Activity 9: Sales Search and Analysis
- 8. Performant SQL
- Activity 10: Query Planning
- Activity 11: Implementing Index Scans
- Activity 12: Implementing Hash Indexes
- Activity 13: Implementing Joins
- Activity 14: Defining a Maximum Sale Function
- Activity 15: Creating Functions with Arguments
- Activity 16: Creating a Trigger to Track Average Purchases
- Activity 17: Terminating a Long Query
- 9. Using SQL to Uncover the Truth a Case Study
- Activity 18: Quantifying the Sales Drop
- Activity 19: Analyzing the Difference in the Sales Price Hypothesis
Packt Publishing - inne książki
-
Solve classic computer science problems from fundamental algorithms, such as sorting and searching, to modern algorithms in machine learning and cryptography
40 Algorithms Every Programmer Should Know - Second Edition 40 Algorithms Every Programmer Should Know - Second Edition
-
Use modern Python libraries such as pandas, NumPy, and scikit-learn and popular machine learning and deep learning methods to solve financial modeling problems
-
Get up to speed with Oracle's Autonomous Databases and implementation strategies for any workload or use case, including transactional, data warehousing, and non-relational databases
Oracle Autonomous Database in Enterprise Architecture Oracle Autonomous Database in Enterprise Architecture
-
Design, build, and deploy performant and maintainable web applications using Spring, Spring Boot, and Angular
-
Build CD pipelines following GitOps principles like declarative and immutable changes stored in version control, all continuously reconciled by Argo CD, and minimize the failure of deployments.
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
W przypadku usługi "Druk na żądanie" termin dostarczenia przesyłki może obejmować także czas potrzebny na dodruk (do 10 dni roboczych)
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.


Oceny i opinie klientów: SQL for Data Analytics Upom Malik, Matt Goldwasser, Benjamin Johnston (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.