A Practical Guide to Reinforcement Learning from Human Feedback. Using Human Signals to Align AI Models Sandip K

(ebook) (audiobook) (audiobook)

W przygotowaniu

A Practical Guide to Reinforcement Learning from Human Feedback. Using Human Signals to Align AI Models Sandip K - okladka książki

A Practical Guide to Reinforcement Learning from Human Feedback. Using Human Signals to Align AI Models Sandip K - audiobook MP3

A Practical Guide to Reinforcement Learning from Human Feedback. Using Human Signals to Align AI Models Sandip K - audiobook CD

Autor:: Sandip K
Wydawnictwo:: Packt Publishing (Z chęcią przeczytam książkę w języku polskim)
Ocena:

Ebook

139,00 zł

Powiadom mnie, gdy książka będzie dostępna

Przenieś na półkę

Reinforcement Learning from Human Feedback (RLHF) is a cutting-edge approach to aligning AI systems with human values. By combining reinforcement learning with human input, RLHF has become a critical methodology for improving the safety and reliability of large language models (LLMs).

This book begins with the foundations of reinforcement learning, including key algorithms such as proximal policy optimization, and shows how reward models integrate human preferences to fine-tune AI behavior. You’ll gain a practical understanding of how RLHF optimizes model parameters to better match real-world needs.

Beyond theory, you’ll explore strategies for collecting preference data, training reward models, and enhancing LLM fine-tuning workflows. Common challenges such as cost, bias, and scalability are addressed with practical solutions and AI-driven alternatives.

The final chapters cover emerging methods, advanced evaluation, and AI safety. By the end, you’ll be equipped with the knowledge and skills to apply RLHF across domains, building AI systems that are powerful, trustworthy, and aligned with human values.

Wybrane bestsellery

Nowość Promocja

Żyjemy w epoce potężnej superkonwergencji – momentu, w którym trzy przełomowe rewolucje: genetyczna, biotechnologiczna i sztucznej inteligencji, zaczynają się splatać, napędzając zmiany szybciej, niż kiedykolwiek w dziejach ludzkości.
- Druk
- PDF + ePub + Mobi
Superkonwergencja. Jak rewolucje w genetyce, biotechnologii i AI mogą odmienić nasze życie

Jamie Metzl

(51,35 zł najniższa cena z 30 dni)

51.35 zł ~~79.00 zł (-35%)~~
Bestseller Nowość Promocja

Ta książka jest niezbędnikiem dla liderów produktowych, którzy chcą projektować i wdrażać produkty oparte na AI i GenAI, a także skutecznie zarządzać zespołami zaangażowanymi w ich rozwój. Znajdziesz tu sprawdzone strategie, praktyczne narzędzia i konkretne przykłady, dzięki którym łatwiej przekujesz potencjał najnowszych technologii w realne korzyści dla użytkowników. Bez względu na to, czy już zarządzasz produktem, czy dopiero chcesz wejść do świata produktów AI — ten przewodnik ułatwi Ci pewne poruszanie się po każdym etapie cyklu życia produktu.
- Druk
- PDF + ePub + Mobi
Produkty oparte na sztucznej inteligencji. Projektowanie, budowa i rozwijanie rozwiązań z AI i GenAI

Dr. Marily Nika

(47,74 zł najniższa cena z 30 dni)

50.05 zł ~~77.00 zł (-35%)~~
Bestseller Nowość Promocja

Modele bazowe (foundation models) zapoczątkowały prawdziwy rozkwit aplikacji opartych na sztucznej inteligencji. AI stała się potężnym narzędziem rozwojowym, którego dziś może używać niemal każdy. Decyzja o stworzeniu własnej aplikacji AI wymaga jednak zrozumienia procesu budowy i świadomego podejmowania decyzji projektowych.
- Druk
- PDF + ePub + Mobi
Inżynieria AI. Tworzenie aplikacji z wykorzystaniem modeli bazowych

Chip Huyen

(77,40 zł najniższa cena z 30 dni)

83.85 zł ~~129.00 zł (-35%)~~
Bestseller Nowość Promocja

Poznaj historię programowania i przekonaj się, jak fascynujący jest świat koderów, od Charlesa Babbage’a i Ady Lovelace po Alana Turinga, Grace Hopper i Dennisa Ritchiego; od przełomowych bitów i bajtów po przejmujące ludzkie historie. Przekonaj się, że droga do sukcesu często bywa wyboista, triumf poprzedzają porażki, a depresja i kpiny ze strony innych to codzienność wielu pionierów. Strona po stronie odkrywaj nieoczywiste prawdy o technologii i o ludziach, których kod tworzy współczesny świat.
- Druk
- PDF + ePub + Mobi
My, programiści. Kronika koderów od Ady do AI

Robert C. Martin

(53,40 zł najniższa cena z 30 dni)

57.84 zł ~~89.00 zł (-35%)~~
Bestseller Nowość Promocja

W tej unikalnej książce znajdziesz kompleksowe omówienie procesu tworzenia LLM, od pracy z zestawami danych po implementację architektury modelu, wstępne szkolenie na nieoznakowanych danych i dostrajanie do określonych zadań. Bez korzystania z gotowych bibliotek LLM samodzielnie zbudujesz podstawowy model, przekształcisz go w klasyfikator tekstu, a ostatecznie stworzysz chatbota, który będzie wykonywał Twoje polecenia. I co najważniejsze ― naprawdę zrozumiesz, jak działa model, w końcu będziesz jego twórcą!
- Druk
- PDF + ePub + Mobi
Stwórz własne AI. Jak od podstaw zbudować duży model językowy

Sebastian Raschka

(59,40 zł najniższa cena z 30 dni)

64.35 zł ~~99.00 zł (-35%)~~
Bestseller Nowość Promocja

Ta książka jest przeznaczona dla programistów, którzy chcą używać AI do optymalizacji procesu tworzenia oprogramowania. Znalazły się tu praktyczne informacje dotyczące budowy interfejsu użytkownika, backendu, tworzenia i optymalizacji kodu. Opisano, jak pisać interfejsy Web API, refaktoryzować kod i zwiększać jego wydajność za pomocą Copilota. Omówiono ponadto sposoby formułowania podpowiedzi dla przetwarzania danych, inżynierii cech, doboru modeli, ich trenowania, strojenia hiperparametrów i oceny jakości uczenia maszynowego. Nie zabrakło również zaawansowanych technik pracy z Copilotem i agentami programowymi, a także omówienia zasad wywoływania narzędzi AI.
- Druk
- PDF + ePub + Mobi
Programowanie wspomagane AI. Automatyzacja pracy programisty dzięki ChatGPT i GitHub Copilot

Christoffer Noring, Anjali Jain, Marina Fernandez, Ayşe Mutlu, Ajit Jaokar

(77,40 zł najniższa cena z 30 dni)

83.85 zł ~~129.00 zł (-35%)~~
Nowość Promocja

Oto czas przełomu. Należysz do pierwszego pokolenia, które ma dostęp do sztucznej inteligencji. Równocześnie żyjesz w czasach gwałtownych zmian. To oznacza, że nie możesz zachłysnąć się AI i w pełni zautomatyzować procesu sprzedaży. W erze sztucznej inteligencji relacje międzyludzkie przynoszą jeszcze większą przewagę konkurencyjną. Jeśli jednak nie wdrożysz potrzebnych narzędzi AI, szybko zostaniesz w tyle.
- Druk
- PDF + ePub + Mobi
AI w rękach sprzedawcy. Jak zwiększyć efektywność sprzedaży i zdominować rynek

Jeb Blount, Anthony Iannarino

(41,40 zł najniższa cena z 30 dni)

44.85 zł ~~69.00 zł (-35%)~~
Bestseller Promocja

Ta niewielka, przystępnie napisana książka jest drugim wydaniem kompleksowego przewodnika dla programistów Pythona, którzy chcą budować aplikacje bazujące na dużych modelach językowych. Zaprezentowano w niej główne cechy i zasady działania modeli GPT-4 i GPT-3.5 z uwzględnieniem najnowszych osiągnięć w rozwoju technologii sztucznej inteligencji. Znalazły się tu także instrukcje, jak krok po kroku tworzyć aplikacje z zastosowaniem biblioteki OpenAI dla Pythona, włączając w to generowanie treści, odpowiadanie na pytania i inteligentnych asystentów. Dodatkowe ułatwienie stanowią przejrzyste przykłady i dołączone do wydania pliki z kodami. Dzięki tej książce z łatwością wykorzystasz moc dużych modeli językowych w swoich aplikacjach!
- Druk
- PDF + ePub + Mobi
Tworzenie aplikacji z wykorzystaniem GPT-4 i ChatGPT. Buduj inteligentne chatboty, generatory treści i realizuj fascynujące projekty. Wydanie II

Olivier Caelen, Marie-Alice Blete

(47,40 zł najniższa cena z 30 dni)

51.35 zł ~~79.00 zł (-35%)~~
Bestseller Promocja

O sztucznej inteligencji jest ostatnio bardzo głośno, to nośny temat, nierzadko przedstawiany w tonie sensacyjnym. Czy AI nas zniewoli? Czy wymknie się spod kontroli? A może zabierze nam pracę i zmieni nasze życie w bezproduktywny koszmar? Rzeczywistość wygląda zgoła inaczej, niż zdają się sugerować clickbaitowe nagłówki w prasie i mediach społecznościowych. Sztuczna inteligencja jest obecna w naszym życiu od wielu lat, choć często nie zdajemy sobie z tego sprawy. Służy nam pomocą, gdy szukamy czegoś w sieci, kiedy chcemy coś przetłumaczyć, kupić, porównać albo dotrzeć z miejsca A do miejsca B. Odsiewa dla nas spam w poczcie internetowej i chroni nasze urządzenia elektroniczne przed cyberatakami. Oczywiście, ma swoje mroczne strony i tych także powinniśmy być świadomi.

sztuit/sztuit.mp3 sztuit

00:00
- Druk
- PDF + ePub + Mobi
- Audiobook MP3
Sztuczna inteligencja. O czym myśli, gdy nikt nie patrzy?

Gniewosz Leliwa

(29,49 zł najniższa cena z 30 dni)

38.35 zł ~~59.00 zł (-35%)~~
Promocja

Analityka mocno się zmieniła. Kiedyś skupiała się głównie na tworzeniu raportów i wykresów, które prezentowały dane w atrakcyjnej formie. Teraz stała się bardziej zaawansowana ― zespoły pracują w nowy sposób, łącząc różnorodne umiejętności, takie jak analiza danych, programowanie i znajomość biznesu. Dzięki temu decyzje podejmowane w firmach mogą być lepsze, a osiąganie celów ― łatwiejsze. Jednak by to działało, potrzebne są zmiany w strukturze organizacji i podejściu do pracy. Oto najbardziej praktyczny poradnik korzystania z analityki w funkcjonowaniu organizacji! Bill Schmarzo, dyrektor do spraw innowacji w Hitachi Vantara
- Druk
- PDF + ePub + Mobi
Biznes oparty na danych. Zespół ekspertów, sztuczna inteligencja i analityka jako klucz do sukcesu

John K. Thompson, Douglas B. Laney

(29,94 zł najniższa cena z 30 dni)

32.43 zł ~~49.90 zł (-35%)~~

O autorze książki

Sandeep (Sandip) Kulkarni is a Principal Applied AI Engineer at Microsoft, where he builds LLM- and RL-powered solutions across Azure Data and Microsoft Fabric. His work spans real-time control, simulators, and LLMOps, with deployments from heavy equipment to chemical processing. Previously at Bonsai and Western Digital, he led simulation and control initiatives. He holds a PhD in Control Engineering (University of Utah) and an MS in Dynamical Systems & Control (UC Davis).

Ebooka "A Practical Guide to Reinforcement Learning from Human Feedback. Using Human Signals to Align AI Models" przeczytasz na:

czytnikach Inkbook, Kindle, Pocketbook, Onyx Booxs i innych
systemach Windows, MacOS i innych

systemach Windows, Android, iOS, HarmonyOS
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi

Masz pytania? Zajrzyj do zakładki Pomoc »

Oceny i opinie klientów: A Practical Guide to Reinforcement Learning from Human Feedback. Using Human Signals to Align AI Models Sandip K

(0)

Szczegóły książki

Tytuł oryginału:: A Practical Guide to Reinforcement Learning from Human Feedback. Using Human Signals to Align AI Models
ISBN Ebooka:: 978-18-358-8051-7, 9781835880517
Data wydania ebooka :: 2026-02-20 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@helion.pl.
Język publikacji:: angielski

Zgłoś erratę
Kategorie:
Sztuczna inteligencja

Dostępność produktu

Produkt nie został jeszcze oceniony pod kątem ułatwień dostępu lub nie podano żadnych informacji o ułatwieniach dostępu lub są one niewystarczające. Prawdopodobnie Wydawca/Dostawca jeszcze nie umożliwił dokonania walidacji produktu lub nie przekazał odpowiednich informacji na temat jego dostępności.

Spis treści książki

1. Introduction to Reinforcement Learning
2. Role of Human Feedback in Reinforcement Learning
3. Reward Modeling
4. Policy Training Based on Reward Model
5. Introduction to Language Models and Fine Tuning
6. Parameter Efficient Fine Tuning
7. Reward Modeling for Language Model Tuning
8. Reinforcement Learning for Tuning Language Models
9. Challenges of Reinforcement Learning with Human Feedback
10. Direct Preference Optimization
11. RLHF and Model Evaluations
12. Other Applications

pokaż cały spis treści

Packt Publishing - inne książki

Zamknij

Proszę czekać...

A Practical Guide to Reinforcement Learning from Human Feedback. Using Human Signals to Align AI Models Sandip K