ΠΠ»ΡΠ±ΠΎΠΊΠΎΠ΅ ΠΎΠ±ΡΡΠ΅Π½ΠΈΠ΅ Ρ ΠΏΠΎΠ΄ΠΊΡΠ΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ. AlphaGo ΠΈ Π΄ΡΡΠ³ΠΈΠ΅ ΡΠ΅Ρ
Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ
ΠΠ°ΠΊΡΠΈΠΌ ΠΠ°ΠΏΠ°Π½Ρ, 2020, Π‘Π΅ΡΠΈΡ: ΠΠ»Ρ ΠΏΡΠΎΡΠ΅ΡΡΠΈΠΎΠ½Π°Π»ΠΎΠ²
ΠΠ±Π·ΠΎΡ
ΠΡΠ° ΠΊΠ½ΠΈΠ³Π° ΠΏΡΠ΅Π΄ΡΡΠ°Π²Π»ΡΠ΅Ρ ΡΠΎΠ±ΠΎΠΉ Π΄Π΅ΡΠ°Π»ΡΠ½ΠΎΠ΅ ΡΡΠΊΠΎΠ²ΠΎΠ΄ΡΡΠ²ΠΎ ΠΏΠΎ ΡΠΎΠ²ΡΠ΅ΠΌΠ΅Π½Π½ΡΠΌ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΠ°ΠΌ Π³Π»ΡΠ±ΠΎΠΊΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ Ρ ΠΏΠΎΠ΄ΠΊΡΠ΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ (RL) ΠΈ ΠΈΡ
ΠΎΠ³ΡΠ°Π½ΠΈΡΠ΅Π½ΠΈΡΠΌ. Π Π½Π΅ΠΉ ΡΠ°ΡΡΠΌΠ°ΡΡΠΈΠ²Π°ΡΡΡΡ ΠΈ ΡΠ΅Π°Π»ΠΈΠ·ΡΡΡΡΡ Π½Π° ΠΏΡΠ°ΠΊΡΠΈΠΊΠ΅ ΠΌΠ΅ΡΠΎΠ΄Ρ ΠΊΡΠΎΡΡ-ΡΠ½ΡΡΠΎΠΏΠΈΠΈ, ΠΈΡΠ΅ΡΠ°ΡΠΈΠΈ ΠΏΠΎ ΡΠ΅Π½Π½ΠΎΡΡΡΠΌ (Q-learning) ΠΈ Π³ΡΠ°Π΄ΠΈΠ΅Π½ΡΡ ΠΏΠΎ ΡΡΡΠ°ΡΠ΅Π³ΠΈΡΠΌ. ΠΠ»Ρ ΡΠΊΡΠΏΠ΅ΡΠΈΠΌΠ΅Π½ΡΠΎΠ² ΠΈΡΠΏΠΎΠ»ΡΠ·ΡΡΡΡΡ ΡΠ°Π·Π½ΠΎΠΎΠ±ΡΠ°Π·Π½ΡΠ΅ ΡΡΠ΅Π΄Ρ RL, ΠΎΡ ΠΊΠ»Π°ΡΡΠΈΡΠ΅ΡΠΊΠΈΡ
CartPole ΠΈ GridWorld Π΄ΠΎ ΡΠΌΡΠ»ΡΡΠΎΡΠΎΠ² Atari ΠΈ ΡΠΈΡΡΠ΅ΠΌ Π½Π΅ΠΏΡΠ΅ΡΡΠ²Π½ΠΎΠ³ΠΎ ΡΠΏΡΠ°Π²Π»Π΅Π½ΠΈΡ.
ΠΠΎΠΌΡ ΠΏΠΎΠ΄ΠΎΠΉΠ΄ΡΡ
- Π‘ΠΏΠ΅ΡΠΈΠ°Π»ΠΈΡΡΠ°ΠΌ, ΠΆΠ΅Π»Π°ΡΡΠΈΠΌ ΠΎΡΠ²ΠΎΠΈΡΡ Π½ΠΎΠ²Π΅ΠΉΡΠΈΠ΅ ΠΈΠ½ΡΡΡΡΠΌΠ΅Π½ΡΡ Π³Π»ΡΠ±ΠΎΠΊΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ Ρ ΠΏΠΎΠ΄ΠΊΡΠ΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ.
- Π Π°Π·ΡΠ°Π±ΠΎΡΡΠΈΠΊΠ°ΠΌ, ΠΈΠ½ΡΠ΅ΡΠ΅ΡΡΡΡΠΈΠΌΡΡ ΡΠ΅Π°Π»ΠΈΠ·Π°ΡΠΈΠ΅ΠΉ ΡΠ»ΠΎΠΆΠ½ΡΡ
ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π³Π»ΡΠ±ΠΎΠΊΠΎΠ³ΠΎ ΠΎΠ±ΡΡΠ΅Π½ΠΈΡ.
- ΠΡΡΠ»Π΅Π΄ΠΎΠ²Π°ΡΠ΅Π»ΡΠΌ, ΠΈΠ·ΡΡΠ°ΡΡΠΈΠΌ ΠΌΠ°ΡΠΊΠΎΠ²ΡΠΊΠΈΠ΅ ΠΏΡΠΎΡΠ΅ΡΡΡ ΠΏΡΠΈΠ½ΡΡΠΈΡ ΡΠ΅ΡΠ΅Π½ΠΈΠΉ ΠΈ ΠΈΡ
ΠΏΡΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅.
- Π‘ΡΡΠ΄Π΅Π½ΡΠ°ΠΌ ΠΈ ΠΏΡΠΎΡΠ΅ΡΡΠΈΠΎΠ½Π°Π»Π°ΠΌ, ΡΠ°Π±ΠΎΡΠ°ΡΡΠΈΠΌ Ρ Π΄ΠΈΡΠΊΡΠ΅ΡΠ½ΡΠΌΠΈ ΠΈ Π½Π΅ΠΏΡΠ΅ΡΡΠ²Π½ΡΠΌΠΈ ΠΏΡΠΎΡΡΡΠ°Π½ΡΡΠ²Π°ΠΌΠΈ Π΄Π΅ΠΉΡΡΠ²ΠΈΠΉ.
ΠΠ»ΡΡΠ΅Π²ΡΠ΅ ΠΎΡΠΎΠ±Π΅Π½Π½ΠΎΡΡΠΈ
- Π―Π·ΡΠΊ: Π ΡΡΡΠΊΠΈΠΉ
- ΠΠΎΠ»ΠΈΡΠ΅ΡΡΠ²ΠΎ ΡΡΡΠ°Π½ΠΈΡ: 496
- Π’ΠΈΠΏ ΠΎΠ±Π»ΠΎΠΆΠΊΠΈ: ΠΌΡΠ³ΠΊΠ°Ρ ΠΎΠ±Π»ΠΎΠΆΠΊΠ°
- ΠΠ·Π΄Π°ΡΠ΅Π»ΡΡΡΠ²ΠΎ: ΠΠΈΡΠ΅Ρ
- ΠΠΎΠ΄ ΠΈΠ·Π΄Π°Π½ΠΈΡ: 2020
- ISBN: 9785446110797
- Π‘Π΅ΡΠΈΡ: ΠΠ»Ρ ΠΏΡΠΎΡΠ΅ΡΡΠΈΠΎΠ½Π°Π»ΠΎΠ²
<hr>
Deep Reinforcement Learning: AlphaGo and Other Technologies
Maxim Lapan, 2020, Series: For Professionals
Overview
This book offers a detailed guide to the latest tools in deep reinforcement learning (RL) and their limitations. It covers the implementation and practical testing of cross-entropy, value iteration (Q-learning), and policy gradient methods. A wide range of RL environments are used for experiments, from classic CartPole and GridWorld to Atari emulators and continuous control systems.
Who it's for
- Professionals seeking to master the newest deep reinforcement learning tools.
- Developers interested in implementing complex deep learning models.
- Researchers studying Markov decision processes and their applications.
- Students and professionals working with discrete and continuous action spaces.
Key features
- Language: Russian
- Pages: 496
- Binding: Softcover
- Publisher: Piter
- Year: 2020
- ISBN: 9785446110797
- Series: For Professionals