Data Science at the Command Line. 2nd Edition

- Autor:
- Jeroen Janssens
- Promocja Przejdź


- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 282
- Dostępne formaty:
-
ePubMobi
Opis książki: Data Science at the Command Line. 2nd Edition
This thoroughly revised guide demonstrates how the flexibility of the command line can help you become a more efficient and productive data scientist. You'll learn how to combine small yet powerful command-line tools to quickly obtain, scrub, explore, and model your data. To get you started, author Jeroen Janssens provides a Docker image packed with over 80 tools--useful whether you work with Windows, macOS, or Linux.
You'll quickly discover why the command line is an agile, scalable, and extensible technology. Even if you're comfortable processing data with Python or R, you'll learn how to greatly improve your data science workflow by leveraging the command line's power. This book is ideal for data scientists, analysts, and engineers; software and machine learning engineers; and system administrators.
- Obtain data from websites, APIs, databases, and spreadsheets
- Perform scrub operations on text, CSV, HTM, XML, and JSON files
- Explore data, compute descriptive statistics, and create visualizations
- Manage your data science workflow
- Create reusable command-line tools from one-liners and existing Python or R code
- Parallelize and distribute data-intensive pipelines
- Model data with dimensionality reduction, clustering, regression, and classification algorithms
Wybrane bestsellery
-
Ta książka jest praktycznym i wyczerpującym przewodnikiem, dzięki któremu w pełni wykorzystasz możliwości Kali Linux. Opisano w niej wiele interesujących zagadnień związanych z przeprowadzaniem testów penetracyjnych. Dowiesz się, jak zbudować nowoczesne środowisko testowe z użyciem kontenerów Doc...(0,00 zł najniższa cena z 30 dni)
64.35 zł
99.00 zł(-35%) -
Oto intuicyjny przewodnik dla średnio zaawansowanych programistów Pythona, pomyślany tak, by przyswajać zasady programowania zorientowanego obiektowo podczas praktycznych ćwiczeń. Dowiesz się, jakie problemy wiążą się z zastosowaniem podejścia proceduralnego i jak dzięki podejściu obiektowemu pis...
Python zorientowany obiektowo. Programowanie gier i graficznych interfejsów użytkownika Python zorientowany obiektowo. Programowanie gier i graficznych interfejsów użytkownika
(0,00 zł najniższa cena z 30 dni)57.85 zł
89.00 zł(-35%) -
To drugie, zaktualizowane i poprawione wydanie bestsellerowego podręcznika Programowania w Pythonie pozwoli Ci błyskawicznie zacząć tworzyć kod, który działa! Zaczniesz od zrozumienia podstawowych koncepcji programistycznych, następnie nauczysz się zapewniać programom interaktywność i wykształcis...(0,00 zł najniższa cena z 30 dni)
64.35 zł
99.00 zł(-35%) -
To kompleksowy podręcznik do nauki programowania w Pythonie. Jego piąte wydanie zostało gruntownie zaktualizowane i rozbudowane o dodatkowe treści. Omówiono tu najnowsze wersje Pythona w liniach 3.X i 2.X, czyli 3.3 i 2.7, i dodano opisy nowych lub rozszerzonych mechanizmów, takich jak obsługa fo...(0,00 zł najniższa cena z 30 dni)
129.35 zł
199.00 zł(-35%) -
Tę książkę docenią administratorzy systemów, projektanci, inżynierowie aplikacji i entuzjaści Linuksa. Dzięki niej dowiesz się, jak tworzyć i uruchamiać złożone polecenia rozwiązujące rzeczywiste problemy, przetwarzające i pobierające informacje, a także automatyzujące zadania, które dotychczas t...
Wiersz poleceń Linuksa. Rozwijanie umiejętności efektywnej pracy Wiersz poleceń Linuksa. Rozwijanie umiejętności efektywnej pracy
(0,00 zł najniższa cena z 30 dni)38.35 zł
59.00 zł(-35%) -
Dzięki tej książce przekonasz się, jak wspaniałą przygodą jest programowanie i jak łatwo ją zacząć! Poznasz podstawy Pythona, dowiesz się, jak pisać i formatować kod, a także szybko nauczysz się uruchamiać swoje programy. Instrukcje sterujące, operatory, typy danych, funkcje, klasy i moduły nie b...
Python 3. Projekty dla początkujących i pasjonatów Python 3. Projekty dla początkujących i pasjonatów
(0,00 zł najniższa cena z 30 dni)38.94 zł
59.90 zł(-35%) -
Ta książka jest przystępnym wprowadzeniem do kryptografii i bibliotek kryptograficznych Pythona. Omówiono tu podstawowe koncepcje z tej dziedziny, najważniejsze algorytmy i niezbędny zakres podstaw matematycznych: liczby pierwsze, teorię grup czy generatory liczb pseudolosowych. Wyjaśniono, czym ...
Algorytmy kryptograficzne w Pythonie. Wprowadzenie Algorytmy kryptograficzne w Pythonie. Wprowadzenie
(0,00 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
To książka przeznaczona dla użytkowników komputerów pracujących pod kontrolą Linuksa. Znalazły się w niej tak ważne kwestie, jak omówienie komponentów o krytycznym znaczeniu i mechanizmów kontroli dostępu czy wyjaśnienie systemu plików w Linuksie. Umieszczono tu również liczne wskazówki i ćwiczen...
Nowoczesny Linux. Przewodnik dla użytkownika natywnej chmury Nowoczesny Linux. Przewodnik dla użytkownika natywnej chmury
(0,00 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
Metody statystyczne są kluczowym elementem data science, mimo to niewielu specjalistów data science posiada formalne wykształcenie statystyczne. Kursy i podręczniki o podstawach statystyki, rzadko kiedy omawiają temat z perspektywy data science. W drugim wydaniu tego popularnego podręcznika zosta...
Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II
(0,00 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
Wykrywanie śladów niewłaściwego użycia dotyczy maszyn, które zarówno posłużyły do przeprowadzenia ataków, jak i były ich przedmiotem. Obecnie dostępnych jest wiele opracowań poświęconych sposobom działania na miejscu zdarzenia i analizie działających systemów Linux za pomocą poleceń dostępnych po...
Systemy Linux w kryminalistyce. Praktyczny przewodnik dla analityków śledczych Systemy Linux w kryminalistyce. Praktyczny przewodnik dla analityków śledczych
(0,00 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%)
Ebooka przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolonych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video zobaczysz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolonych urządzeniach i aplikacjach obsługujących format MP4 (pliki spakowane w ZIP)
Szczegóły książki
- ISBN Ebooka:
- 978-14-920-8786-1, 9781492087861
- Data wydania ebooka:
-
2021-08-17
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@helion.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 5.0MB
- Rozmiar pliku Mobi:
- 9.5MB
Spis treści książki
- Foreword
- Preface
- What to Expect from This Book
- Changes for the Second Edition
- How to Read This Book
- Who This Book Is For
- Conventions Used in This Book
- OReilly Online Learning
- How to Contact Us
- Acknowledgments for the Second Edition (2021)
- Acknowledgments for the First Edition (2014)
- 1. Introduction
- Data Science Is OSEMN
- Obtaining Data
- Scrubbing Data
- Exploring Data
- Modeling Data
- Interpreting Data
- Data Science Is OSEMN
- Intermezzo Chapters
- What Is the Command Line?
- Why Data Science at the Command Line?
- The Command Line Is Agile
- The Command Line Is Augmenting
- The Command Line Is Scalable
- The Command Line Is Extensible
- The Command Line Is Ubiquitous
- Summary
- For Further Exploration
- 2. Getting Started
- Getting the Data
- Installing the Docker Image
- Essential Unix Concepts
- The Environment
- Executing a Command-Line Tool
- Five Types of Command-Line Tools
- Combining Command-Line Tools
- Redirecting Input and Output
- Working with Files and Directories
- Managing Output
- Help!
- Summary
- For Further Exploration
- 3. Obtaining Data
- Overview
- Copying Local Files to the Docker Container
- Downloading from the Internet
- Introducing curl
- Saving
- Other Protocols
- Following Redirects
- Decompressing Files
- Converting Microsoft Excel Spreadsheets to CSV
- Querying Relational Databases
- Calling Web APIs
- Authentication
- Streaming APIs
- Summary
- For Further Exploration
- 4. Creating Command-Line Tools
- Overview
- Converting One-Liners into Shell Scripts
- Step 1: Create a File
- Step 2: Give Permission to Execute
- Step 3: Define a Shebang
- Step 4: Remove the Fixed Input
- Step 5: Add Arguments
- Step 6: Extend Your PATH
- Creating Command-Line Tools with Python and R
- Porting the Shell Script
- Processing Streaming Data from Standard Input
- Summary
- For Further Exploration
- 5. Scrubbing Data
- Overview
- Transformations, Transformations Everywhere
- Plain Text
- Filtering Lines
- Based on location
- Based on a pattern
- Based on randomness
- Filtering Lines
- Extracting Values
- Replacing and Deleting Values
- CSV
- Bodies and Headers and Columns, Oh My!
- Performing SQL Queries on CSV
- Extracting and Reordering Columns
- Filtering Rows
- Merging Columns
- Combining Multiple CSV Files
- Concatenate horizontally
- Joining
- Working with XML/HTML and JSON
- Summary
- For Further Exploration
- 6. Project Management with Make
- Overview
- Introducing Make
- Running Tasks
- Building, for Real
- Adding Dependencies
- Summary
- For Further Exploration
- 7. Exploring Data
- Overview
- Inspecting Data and Its Properties
- Header or Not, Here I Come
- Inspect All the Data
- Feature Names and Data Types
- Unique Identifiers, Continuous Variables, and Factors
- Computing Descriptive Statistics
- Column Statistics
- R One-Liners on the Shell
- Creating Visualizations
- Displaying Images from the Command Line
- Plotting in a Rush
- Creating Bar Charts
- Creating Histograms
- Creating Density Plots
- Happy Little Accidents
- Creating Scatter Plots
- Creating Trend Lines
- Creating Box Plots
- Adding Labels
- Going Beyond Basic Plots
- Summary
- For Further Exploration
- 8. Parallel Pipelines
- Overview
- Serial Processing
- Looping Over Numbers
- Looping Over Lines
- Looping Over Files
- Parallel Processing
- Introducing GNU Parallel
- Specifying Input
- Controlling the Number of Concurrent Jobs
- Logging and Output
- Creating Parallel Tools
- Distributed Processing
- Get List of Running AWS EC2 Instances
- Running Commands on Remote Machines
- Distributing Local Data Among Remote Machines
- Processing Files on Remote Machines
- Summary
- For Further Exploration
- 9. Modeling Data
- Overview
- More Wine, Please!
- Dimensionality Reduction with Tapkee
- Introducing Tapkee
- Linear and Nonlinear Mappings
- Regression with Vowpal Wabbit
- Preparing the Data
- Training the Model
- Testing the Model
- Classification with SciKit-Learn Laboratory
- Preparing the Data
- Running the Experiment
- Parsing the Results
- Summary
- For Further Exploration
- 10. Polyglot Data Science
- Overview
- Jupyter
- Python
- R
- RStudio
- Apache Spark
- Summary
- For Further Exploration
- 11. Conclusion
- Lets Recap
- Three Pieces of Advice
- Be Patient
- Be Creative
- Be Practical
- Where to Go from Here
- The Command Line
- Shell Programming
- Python, R, and SQL
- APIs
- Machine Learning
- Getting in Touch
- A. List of Command-Line Tools
- alias
- awk
- aws
- bash
- bat
- bc
- body
- cat
- cd
- chmod
- cols
- column
- cowsay
- cp
- csv2vw
- csvcut
- csvgrep
- csvjoin
- csvlook
- csvquote
- csvsort
- csvsql
- csvstack
- csvstat
- curl
- cut
- display
- dseq
- echo
- env
- export
- fc
- find
- fold
- for
- fx
- git
- grep
- gron
- head
- header
- history
- hostname
- in2csv
- jq
- json2csv
- l
- less
- ls
- make
- man
- mkdir
- mv
- nano
- nl
- parallel
- paste
- pbc
- pip
- pup
- pwd
- python
- R
- rev
- rm
- rush
- sample
- scp
- sed
- seq
- servewd
- shuf
- skll
- sort
- split
- sponge
- sql2csv
- ssh
- sudo
- tail
- tapkee
- tar
- tee
- telnet
- tldr
- tr
- tree
- trim
- ts
- type
- uniq
- unpack
- unrar
- unzip
- vw
- wc
- which
- xml2json
- xmlstarlet
- xsv
- zcat
- zsh
- Index
O'Reilly Media - inne książki
-
FinOps brings financial accountability to the variable spend model of cloud. Used by the majority of global enterprises, this management practice has grown from a fringe activity to the de facto discipline managing cloud spend. In this book, authors J.R. Storment and Mike Fuller outline the proce...(0,00 zł najniższa cena z 30 dni)
262.65 zł
309.00 zł(-15%) -
Edge AI is transforming the way computers interact with the real world, allowing IoT devices to make decisions using the 99% of sensor data that was previously discarded due to cost, bandwidth, or power limitations. With techniques like embedded machine learning, developers can capture human intu...(0,00 zł najniższa cena z 30 dni)
262.65 zł
309.00 zł(-15%) -
Why is it difficult for so many companies to get digital identity right? If you're still wrestling with even simple identity problems like modern website authentication, this practical book has the answers you need. Author Phil Windley provides conceptual frameworks to help you make sense of all ...(0,00 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
Python was recently ranked as today's most popular programming language on the TIOBE index, thanks to its broad applicability to design and prototyping to testing, deployment, and maintenance. With this updated fourth edition, you'll learn how to get the most out of Python, whether you're a profe...(0,00 zł najniższa cena z 30 dni)
296.65 zł
349.00 zł(-15%) -
With the accelerating speed of business and the increasing dependence on technology, companies today are significantly changing the way they build in-house business solutions. Many now use low-code and no code technologies to help them deal with specific issues, but that's just the beginning. Wit...
Building Solutions with the Microsoft Power Platform Building Solutions with the Microsoft Power Platform
(0,00 zł najniższa cena z 30 dni)262.65 zł
309.00 zł(-15%) -
Companies are scrambling to integrate AI into their systems and operations. But to build truly successful solutions, you need a firm grasp of the underlying mathematics. This accessible guide walks you through the math necessary to thrive in the AI field such as focusing on real-world application...(0,00 zł najniższa cena z 30 dni)
262.65 zł
309.00 zł(-15%) -
DevOps engineers, developers, and security engineers have ever-changing roles to play in today's cloud native world. In order to build secure and resilient applications, you have to be equipped with security knowledge. Enter security as code.In this book, authors BK Sarthak Das and Virginia Chu d...(0,00 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
With the increasing use of AI in high-stakes domains such as medicine, law, and defense, organizations spend a lot of time and money to make ML models trustworthy. Many books on the subject offer deep dives into theories and concepts. This guide provides a practical starting point to help develop...(0,00 zł najniższa cena z 30 dni)
262.65 zł
309.00 zł(-15%) -
Why are so many companies adopting GitOps for their DevOps and cloud native strategy? This reliable framework is quickly becoming the standard method for deploying apps to Kubernetes. With this practical, developer-oriented book, DevOps engineers, developers, IT architects, and SREs will learn th...(0,00 zł najniższa cena z 30 dni)
262.65 zł
309.00 zł(-15%) -
Learn the essentials of working with Flutter and Dart to build full stack applications that meet the needs of a cloud-driven world. Together, the Flutter open source UI software development kit and the Dart programming language for client development provide a unified solution to building applica...(0,00 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
W przypadku usługi "Druk na żądanie" termin dostarczenia przesyłki może obejmować także czas potrzebny na dodruk (do 10 dni roboczych)
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.


Oceny i opinie klientów: Data Science at the Command Line. 2nd Edition Jeroen Janssens (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.