HBase: The Definitive Guide. Random Access to Your Planet-Size Data

- Autor:
- Lars George
- Promocja Przejdź


- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 556
- Dostępne formaty:
-
ePubMobi
Opis książki: HBase: The Definitive Guide. Random Access to Your Planet-Size Data
If you're looking for a scalable storage solution to accommodate a virtually endless amount of data, this book shows you how Apache HBase can fulfill your needs. As the open source implementation of Google's BigTable architecture, HBase scales to billions of rows and millions of columns, while ensuring that write and read performance remain constant. Many IT executives are asking pointed questions about HBase. This book provides meaningful answers, whether you’re evaluating this non-relational database or planning to put it into practice right away.
- Discover how tight integration with Hadoop makes scalability with HBase easier
- Distribute large datasets across an inexpensive cluster of commodity servers
- Access HBase with native Java clients, or with gateway servers providing REST, Avro, or Thrift APIs
- Get details on HBase’s architecture, including the storage format, write-ahead log, background processes, and more
- Integrate HBase with Hadoop's MapReduce framework for massively parallelized data processing jobs
- Learn how to tune clusters, design schemas, copy tables, import bulk data, decommission nodes, and many other tasks
Wybrane bestsellery
-
Dzięki tej książce nauczysz się przekształcać suche dane liczbowe w pełną empatii narrację! Aby spełniły one swoje zadanie, ktoś musi przedstawić zawarte w nich informacje w postaci opowieści. W tej publikacji wyczerpująco i praktycznie opisano przebieg tego procesu. Jej lektura sprawi, że rozwin...
Opowieści ukryte w danych. Wyjaśnij dane i wywołaj działania za pomocą narracji Opowieści ukryte w danych. Wyjaśnij dane i wywołaj działania za pomocą narracji
(0,00 zł najniższa cena z 30 dni)20.90 zł
67.00 zł(-69%) -
Metody statystyczne są kluczowym elementem data science, mimo to niewielu specjalistów data science posiada formalne wykształcenie statystyczne. Kursy i podręczniki o podstawach statystyki, rzadko kiedy omawiają temat z perspektywy data science. W drugim wydaniu tego popularnego podręcznika zosta...
Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II Statystyka praktyczna w data science. 50 kluczowych zagadnień w językach R i Python. Wydanie II
(0,00 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
BPMN pozwala na ciągłe analizowanie, monitorowanie i optymalizowanie procesów biznesowych. Jest narzędziem bardzo skutecznym, prawdziwym „świętym Graalem” współczesnego biznesu. Jednak nie jest on niestety tak przyjazny, jak mógłby oczekiwać początkujący użytkownik. Jego oryginalną sp...
Zrozumieć BPMN. Modelowanie procesów biznesowych. Wydanie 2 rozszerzone Zrozumieć BPMN. Modelowanie procesów biznesowych. Wydanie 2 rozszerzone
(0,00 zł najniższa cena z 30 dni)31.85 zł
49.00 zł(-35%) -
Trzech poważanych architektów oprogramowania omawia cały cykl życia, prezentując praktyczne wskazówki, metody stosowane przez ekspertów i sprawdzone modele przydatne w każdym projekcie niezależnie od poziomu jego złożoności. Dowiesz się, jak za pomocą architektury radzić sobie z coraz większymi w...
Architektura oprogramowania w praktyce. Wydanie IV Architektura oprogramowania w praktyce. Wydanie IV
(0,00 zł najniższa cena z 30 dni)64.35 zł
99.00 zł(-35%) -
Ta książka jest przewodnikiem dla każdego, kto musi przekazywać informacje, robiąc przy tym użytek z danych. Szczególnie wartościowa będzie dla analityków, studentów i naukowców, a także dla każdego, kto w swojej komunikacji odwołuje się do danych. Pokazano tu prostą i intuicyjną technikę przedst...
Storytelling danych. Poradnik wizualizacji danych dla profesjonalistów Storytelling danych. Poradnik wizualizacji danych dla profesjonalistów
(0,00 zł najniższa cena z 30 dni)50.05 zł
77.00 zł(-35%) -
W tej praktycznej książce dokładnie wyjaśniono współczesne podejście do tworzenia architektury baz danych i ich eksploatacji. Jeśli chcesz stać się znakomitym inżynierem niezawodności baz danych, czyli DBRE (z Database Reliability Engineer), znajdziesz tu schemat zasad i praktyk projektowania, bu...
Inżynieria niezawodnych baz danych. Projektowanie systemów odpornych na błędy Inżynieria niezawodnych baz danych. Projektowanie systemów odpornych na błędy
(0,00 zł najniższa cena z 30 dni)35.40 zł
59.00 zł(-40%) -
To drugie, w pełni zaktualizowane wydanie znakomitego przewodnika, dzięki któremu bezproblemowo rozpoczniesz pracę z Power BI i w pełni wykorzystasz jego możliwości. Dowiesz się, jak pozyskiwać i oczyszczać dane z różnych źródeł, a także jak zaprojektować model danych, aby móc analizować relacje ...
Microsoft Power BI. Jak modelować i wizualizować dane oraz budować narracje cyfrowe. Wydanie II Microsoft Power BI. Jak modelować i wizualizować dane oraz budować narracje cyfrowe. Wydanie II
Devin Knight, Mitchell Pearson, Bradley Schacht, Erin Ostrowsky
(0,00 zł najniższa cena z 30 dni)50.05 zł
77.00 zł(-35%) -
Termin business intelligence ostatnimi czasy jest odmieniany przez wszystkie przypadki. Według raportu Gartnera z 2020 roku aktualnie liderem w dziedzinie narzędzi BI jest Microsoft - ten kurs video oferuje możliwość zapoznania się z jednym z nich. Power BI, bo o nim mowa, pozwala efektywnie anal...
Power BI Desktop. Kurs video. Wykorzystanie narzędzia w analizie i wizualizacji danych Power BI Desktop. Kurs video. Wykorzystanie narzędzia w analizie i wizualizacji danych
(0,00 zł najniższa cena z 30 dni)194.35 zł
299.00 zł(-35%) -
Ten praktyczny przewodnik po narzędziu Power Query nauczy Cię efektywnie przetwarzać dane w Excelu: importować, oczyszczać, przekształcać i wydobywać potrzebne informacje. Dowiesz się, jak sprawnie wykonywać typowe zadania i prace analityczne, jak zwiększyć swoją skuteczność dzięki opanowaniu pod...
Power Query w Excelu i Power BI. Zbieranie i przekształcanie danych Power Query w Excelu i Power BI. Zbieranie i przekształcanie danych
(0,00 zł najniższa cena z 30 dni)57.85 zł
89.00 zł(-35%) -
Data is at the center of many challenges in system design today. Difficult issues need to be figured out, such as scalability, consistency, reliability, efficiency, and maintainability. In addition, we have an overwhelming variety of tools, including relational databases, NoSQL datastores, stream...
Designing Data-Intensive Applications. The Big Ideas Behind Reliable, Scalable, and Maintainable Systems Designing Data-Intensive Applications. The Big Ideas Behind Reliable, Scalable, and Maintainable Systems
(0,00 zł najniższa cena z 30 dni)203.15 zł
239.00 zł(-15%)
Ebooka przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolonych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video zobaczysz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolonych urządzeniach i aplikacjach obsługujących format MP4 (pliki spakowane w ZIP)
Szczegóły książki
- ISBN Ebooka:
- 978-14-493-1522-1, 9781449315221
- Data wydania ebooka:
-
2011-08-29
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@helion.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 4.8MB
- Rozmiar pliku Mobi:
- 4.8MB
- Kategorie:
Bazy danych » Inne
Programowanie » Programowanie w chmurze
Big Data » Analiza danych
Spis treści książki
- HBase: The Definitive Guide
- Dedication
- SPECIAL OFFER: Upgrade this ebook with OReilly
- Foreword
- Preface
- General Information
- HBase Version
- Building the Examples
- Hush: The HBase URL Shortener
- Running Hush
- General Information
- Conventions Used in This Book
- Using Code Examples
- Safari Books Online
- How to Contact Us
- Acknowledgments
- 1. Introduction
- The Dawn of Big Data
- The Problem with Relational Database Systems
- Nonrelational Database Systems, Not-Only SQL or NoSQL?
- Dimensions
- Scalability
- Database (De-)Normalization
- Building Blocks
- Backdrop
- Tables, Rows, Columns, and Cells
- Auto-Sharding
- Storage API
- Implementation
- Summary
- HBase: The Hadoop Database
- History
- Nomenclature
- Summary
- 2. Installation
- Quick-Start Guide
- Requirements
- Hardware
- Servers
- Networking
- Hardware
- Software
- Operating system
- Filesystem
- Java
- Hadoop
- SSH
- Domain Name Service
- Synchronized time
- File handles and process limits
- Datanode handlers
- Swappiness
- Windows
- Filesystems for HBase
- Local
- HDFS
- S3
- Other Filesystems
- Installation Choices
- Apache Binary Release
- Building from Source
- Run Modes
- Standalone Mode
- Distributed Mode
- Pseudodistributed mode
- Fully distributed mode
- Specifying region servers
- ZooKeeper setup
- Using the existing ZooKeeper ensemble
- Configuration
- hbase-site.xml and hbase-default.xml
- hbase-env.sh
- regionserver
- log4j.properties
- Example Configuration
- hbase-site.xml
- regionservers
- hbase-env.sh
- Client Configuration
- Deployment
- Script-Based
- Apache Whirr
- Puppet and Chef
- Operating a Cluster
- Running and Confirming Your Installation
- Web-based UI Introduction
- Shell Introduction
- Stopping the Cluster
- 3. Client API: The Basics
- General Notes
- CRUD Operations
- Put Method
- Single Puts
- The KeyValue class
- Client-side write buffer
- List of Puts
- Atomic compare-and-set
- Put Method
- Get Method
- Single Gets
- The Result class
- List of Gets
- Related retrieval methods
- Delete Method
- Single Deletes
- List of Deletes
- Atomic compare-and-delete
- Batch Operations
- Row Locks
- Scans
- Introduction
- The ResultScanner Class
- Caching Versus Batching
- Miscellaneous Features
- The HTable Utility Methods
- The Bytes Class
- 4. Client API: Advanced Features
- Filters
- Introduction to Filters
- The filter hierarchy
- Comparison operators
- Comparators
- Introduction to Filters
- Comparison Filters
- RowFilter
- FamilyFilter
- QualifierFilter
- ValueFilter
- DependentColumnFilter
- Filters
- Dedicated Filters
- SingleColumnValueFilter
- SingleColumnValueExcludeFilter
- PrefixFilter
- PageFilter
- KeyOnlyFilter
- FirstKeyOnlyFilter
- InclusiveStopFilter
- TimestampsFilter
- ColumnCountGetFilter
- ColumnPaginationFilter
- ColumnPrefixFilter
- RandomRowFilter
- Decorating Filters
- SkipFilter
- WhileMatchFilter
- FilterList
- Custom Filters
- Filters Summary
- Counters
- Introduction to Counters
- Single Counters
- Multiple Counters
- Coprocessors
- Introduction to Coprocessors
- The Coprocessor Class
- Coprocessor Loading
- Loading from the configuration
- Loading from the table descriptor
- The RegionObserver Class
- Handling region life-cycle events
- State: pending open
- State: open
- State: pending close
- Handling region life-cycle events
- Handling client API events
- The RegionCoprocessorEnvironment class
- The ObserverContext class
- The BaseRegionObserver class
- The MasterObserver Class
- The MasterCoprocessorEnvironment class
- The BaseMasterObserver class
- Endpoints
- The CoprocessorProtocol interface
- The BaseEndpointCoprocessor class
- HTablePool
- Connection Handling
- 5. Client API: Administrative Features
- Schema Definition
- Tables
- Table Properties
- Column Families
- Schema Definition
- HBaseAdmin
- Basic Operations
- Table Operations
- Schema Operations
- Cluster Operations
- Cluster Status Information
- 6. Available Clients
- Introduction to REST, Thrift, and Avro
- Interactive Clients
- Native Java
- REST
- Operation
- Supported formats
- Plain (text/plain)
- XML (text/xml)
- JSON (application/json)
- Protocol Buffer (application/x-protobuf)
- Raw binary (application/octet-stream)
- REST Java client
- Thrift
- Installation
- Operation
- Example: PHP
- Avro
- Installation
- Operation
- Other Clients
- Batch Clients
- MapReduce
- Native Java
- Clojure
- MapReduce
- Hive
- Pig
- Cascading
- Shell
- Basics
- Commands
- General
- Data definition
- Data manipulation
- Tools
- Replication
- Scripting
- Web-based UI
- Master UI
- Main page
- User Table page
- ZooKeeper page
- Master UI
- Region Server UI
- Main page
- Shared Pages
- 7. MapReduce Integration
- Framework
- MapReduce Introduction
- Classes
- InputFormat
- Mapper
- Reducer
- OutputFormat
- Supporting Classes
- MapReduce Locality
- Table Splits
- Framework
- MapReduce over HBase
- Preparation
- Static Provisioning
- Dynamic Provisioning
- Preparation
- Data Sink
- Data Source
- Data Source and Sink
- Custom Processing
- 8. Architecture
- Seek Versus Transfer
- B+ Trees
- Log-Structured Merge-Trees
- Seek Versus Transfer
- Storage
- Overview
- Write Path
- Files
- Root-level files
- Table-level files
- Region-level files
- Region splits
- Compactions
- HFile Format
- KeyValue Format
- Write-Ahead Log
- Overview
- HLog Class
- HLogKey Class
- WALEdit Class
- LogSyncer Class
- LogRoller Class
- Replay
- Single log
- Log splitting
- Edits recovery
- Durability
- Read Path
- Region Lookups
- The Region Life Cycle
- ZooKeeper
- Replication
- Life of a Log Edit
- Normal processing
- Non-Responding slave clusters
- Life of a Log Edit
- Internals
- Choosing region servers to replicate to
- Keeping track of logs
- Reading, filtering, and sending edits
- Cleaning logs
- Region server failover
- 9. Advanced Usage
- Key Design
- Concepts
- Tall-Narrow Versus Flat-Wide Tables
- Partial Key Scans
- Pagination
- Time Series Data
- Time-Ordered Relations
- Key Design
- Advanced Schemas
- Secondary Indexes
- Search Integration
- Transactions
- Bloom Filters
- Versioning
- Implicit Versioning
- Custom Versioning
- 10. Cluster Monitoring
- Introduction
- The Metrics Framework
- Contexts, Records, and Metrics
- Master Metrics
- Region Server Metrics
- RPC Metrics
- JVM Metrics
- Info Metrics
- Ganglia
- Installation
- Ganglia-related steps
- Ganglia monitoring daemon
- Ganglia meta daemon
- Ganglia web frontend
- Ganglia-related steps
- HBase-related steps
- Installation
- Usage
- JMX
- JConsole
- JMX Remote API
- Nagios
- 11. Performance Tuning
- Garbage Collection Tuning
- Memstore-Local Allocation Buffer
- Compression
- Available Codecs
- Snappy
- LZO
- GZIP
- Available Codecs
- Verifying Installation
- Compression test tool
- Startup check
- Enabling Compression
- Optimizing Splits and Compactions
- Managed Splitting
- Region Hotspotting
- Presplitting Regions
- Load Balancing
- Merging Regions
- Client API: Best Practices
- Configuration
- Load Tests
- Performance Evaluation
- YCSB
- 12. Cluster Administration
- Operational Tasks
- Node Decommissioning
- Rolling Restarts
- Adding Servers
- Pseudodistributed mode
- Adding a local backup master
- Adding a local region server
- Pseudodistributed mode
- Fully distributed cluster
- Adding a backup master
- Adding a region server
- Operational Tasks
- Data Tasks
- Import and Export Tools
- CopyTable Tool
- Bulk Import
- Bulk load procedure
- Using the importtsv tool
- Using the completebulkload Tool
- Advanced usage
- Replication
- Additional Tasks
- Coexisting Clusters
- Required Ports
- Changing Logging Levels
- Troubleshooting
- HBase Fsck
- Analyzing the Logs
- Common Issues
- Basic setup checklist
- File handles
- DataNode connections
- Compression
- Garbage collection/memory tuning
- Basic setup checklist
- Stability issues
- ZooKeeper problems
- Could not obtain block errors
- A. HBase Configuration Properties
- B. Road Map
- HBase 0.92.0
- HBase 0.94.0
- C. Upgrade from Previous Releases
- Upgrading to HBase 0.90.x
- From 0.20.x or 0.89.x
- Within 0.90.x
- Upgrading to HBase 0.90.x
- Upgrading to HBase 0.92.0
- D. Distributions
- Clouderas Distribution Including Apache Hadoop
- E. Hush SQL Schema
- F. HBase Versus Bigtable
- Index
- About the Author
- Colophon
- SPECIAL OFFER: Upgrade this ebook with OReilly
- Copyright
O'Reilly Media - inne książki
-
FinOps brings financial accountability to the variable spend model of cloud. Used by the majority of global enterprises, this management practice has grown from a fringe activity to the de facto discipline managing cloud spend. In this book, authors J.R. Storment and Mike Fuller outline the proce...(0,00 zł najniższa cena z 30 dni)
262.65 zł
309.00 zł(-15%) -
Edge AI is transforming the way computers interact with the real world, allowing IoT devices to make decisions using the 99% of sensor data that was previously discarded due to cost, bandwidth, or power limitations. With techniques like embedded machine learning, developers can capture human intu...(0,00 zł najniższa cena z 30 dni)
262.65 zł
309.00 zł(-15%) -
Why is it difficult for so many companies to get digital identity right? If you're still wrestling with even simple identity problems like modern website authentication, this practical book has the answers you need. Author Phil Windley provides conceptual frameworks to help you make sense of all ...(0,00 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
Python was recently ranked as today's most popular programming language on the TIOBE index, thanks to its broad applicability to design and prototyping to testing, deployment, and maintenance. With this updated fourth edition, you'll learn how to get the most out of Python, whether you're a profe...(0,00 zł najniższa cena z 30 dni)
296.65 zł
349.00 zł(-15%) -
With the accelerating speed of business and the increasing dependence on technology, companies today are significantly changing the way they build in-house business solutions. Many now use low-code and no code technologies to help them deal with specific issues, but that's just the beginning. Wit...
Building Solutions with the Microsoft Power Platform Building Solutions with the Microsoft Power Platform
(0,00 zł najniższa cena z 30 dni)262.65 zł
309.00 zł(-15%) -
Companies are scrambling to integrate AI into their systems and operations. But to build truly successful solutions, you need a firm grasp of the underlying mathematics. This accessible guide walks you through the math necessary to thrive in the AI field such as focusing on real-world application...(0,00 zł najniższa cena z 30 dni)
262.65 zł
309.00 zł(-15%) -
DevOps engineers, developers, and security engineers have ever-changing roles to play in today's cloud native world. In order to build secure and resilient applications, you have to be equipped with security knowledge. Enter security as code.In this book, authors BK Sarthak Das and Virginia Chu d...(0,00 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
With the increasing use of AI in high-stakes domains such as medicine, law, and defense, organizations spend a lot of time and money to make ML models trustworthy. Many books on the subject offer deep dives into theories and concepts. This guide provides a practical starting point to help develop...(0,00 zł najniższa cena z 30 dni)
262.65 zł
309.00 zł(-15%) -
Why are so many companies adopting GitOps for their DevOps and cloud native strategy? This reliable framework is quickly becoming the standard method for deploying apps to Kubernetes. With this practical, developer-oriented book, DevOps engineers, developers, IT architects, and SREs will learn th...(0,00 zł najniższa cena z 30 dni)
262.65 zł
309.00 zł(-15%) -
Learn the essentials of working with Flutter and Dart to build full stack applications that meet the needs of a cloud-driven world. Together, the Flutter open source UI software development kit and the Dart programming language for client development provide a unified solution to building applica...(0,00 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
W przypadku usługi "Druk na żądanie" termin dostarczenia przesyłki może obejmować także czas potrzebny na dodruk (do 10 dni roboczych)
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.


Oceny i opinie klientów: HBase: The Definitive Guide. Random Access to Your Planet-Size Data Lars George (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.