金寶書局網路書店

 
目前位置:首頁 > 圖書十大分類 > 300 科學類 > 312 電腦科學 > 在思考和工具使用之後-利用大模型開發你的 AI 應用
圖書十大分類 > 300 科學類 > 312 電腦科學 > 在思考和工具使用之後-利用大模型開發你的 AI 應用
在思考和工具使用之後-利用大模型開發你的 AI 應用
在思考和工具使用之後-利用大模型開發你的 AI 應用
作者: 李瀚、徐斌
出版社深智數位
出版日期:2026-05-19
語言:中文
ISBN:9786267889268
裝訂:平裝
定價790
購買數量:
內容簡介
目錄書摘
導讀/序
作者介紹
☆全面迎戰 AI 2.0 時代,深度解析基座大模型訓練與選型策略。
★拆解硬核算力基礎,精準掌握 NVIDIA 與 AMD GPU 參數及選型。
☆掌握應用程式開發核心,透析上下文學習與人類回饋對齊方法。
★攻克文件前置處理難題,詳解分塊(Chunking)與詞元化策略。
☆剖析向量資料庫底層,實作相似性演算法與主流產品整合。
★突破高效微調技術瓶頸,運用開源工具打造專屬領域大模型。
☆解密推理效能最佳化,精通模型壓縮與 FlashAttention 記憶體管理。
★構建高併發部署環境,涵蓋 Web 服務、伺服器端與端側推理引擎。
☆昇華提示工程(Prompt)技術,結合 Dify 等開發工具提升精準度。
★深度實踐 RAG 與 Agent 架構,賦予大模型檢索與自主行動能力。
☆橫掃三大主流編排框架,實作 LangChain、LlamaIndex 與 Semantic Kernel。
★從環境準備到打包部署,完整解析真實大模型應用專案實戰範例。

◼本書共分 12 章,循序漸進地勾勒出大模型應用開發的完整藍圖。
第1至3章從 AI 2.0 時代的背景出發,說明基座大模型的預訓練與強化學習過程,並深度剖析 GPU 的底層知識與選型策略,奠定硬體與模型基礎。
第4至6章聚焦於資料與開發前置作業,涵蓋提示概念、文件分塊與詞元化處理,並詳細說明向量資料庫的相似性演算法與核心價值。
第7至9章直擊效能與工程部署,探討參數高效微調技術、推理效能最佳化(包含模型壓縮與多 GPU 並行化),並實作 Web 服務與伺服器/端側推理引擎的部署。
第10至12章則帶領讀者邁向應用巔峰,不僅解析提示工程的開發工具,更深度說明 RAG 與 Agent 架構的編排整合,涵蓋 LangChain 與 LlamaIndex 等主流框架,最後透過一個完整的應用範例,演示從環境準備到打包部署的實戰全過程。