強化學習導論 - 金寶書局網路書店

熱門：哈利波特不敗學習力屁屁偵探李洋星漢燦爛

目前尚無資料

目前位置：首頁 > 圖書十大分類 > 300 科學類 > 312 電腦科學 > 強化學習導論

強化學習導論

作者：邱偉育

出版社：全華圖書

出版日期：2021-11-22

語言：中文

ISBN：9789865038717

裝訂：平裝

定價：400 元

內容簡介

目錄書摘

導讀/序

作者介紹

　　近年來因人工智慧興起，帶起許多學生、工程師與學者開始投入相關技術的學習、研究和開發。早期談到人工智慧，大部分會聯想到機器學習中的監督式學習和非監督式學習。然而監督或非監督式學習較難處理動態系統，機器學習技術的另一個分支─強化學習，剛好補足此缺口。強化學習的應用相當廣，最有名的兩個例子為AlphaGo透過資料學習在圍棋比賽上屢獲佳績，以及Google利用強化學習技術，優化資料中心的運作，進而減少40%的冷卻花費。本書以奠定基本功為目的，一步步帶領讀者建構完整的強化學習知識，介紹的相關概念包含：動態規劃、蒙地卡羅法、1步時間差分法、n步時間差分法、近似解法、規劃與學習、資格跡與學習、策略梯度法。

本書特色

　　1.本書從假設與理論開始討論，再進入演算法與範例，讓讀者了解整體架構的來龍去脈。　
　　2.每章的開始先綜述該章的主要內容，讓讀者有大方向的了解，再進入細節的討論。
　　3.相關概念以圖示方式呈現，讀者較易理解與統整。
　　4.每章搭配範例與程式碼，徹底了解演算法特性。
　　5.每章結尾作重點回顧，條列該章裡重要概念，方便讀者確認學習重點。
　　6.本書適用於自學、大學或科大課程教科書與實作專題的輔助教材，以及業界工程師快速奠定強化學習基礎概念與實作能力的教學書籍。