Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more ■帯の有無、状態など商品画像と実際の商品とは異なる場合がございます。東京出版 大学への数学 2018年4月〜2019年3月 状態良多数 12冊 横戸宏紀/雲幸一郎/森茂樹/飯島康之/安田亨他多数 ☆ 063R1D。また、商品画像に「帯」が付いているものがありますが、中古品のため、実際の商品には付いていない場合がございます。SAPIX 小6 サピックス 算数 デイリー/スプリング/サマー/ウインターなど 通年セット 【計245回分】 2023 ★ ☆ 000L2D。 hololive - ホロライブ学力診断 中学5教科 Special Edition【特別版】2セット