實用DeepSeek技術:開發真正可用的LLM應用程式

熱門：不敗學習力 AI 世界棒球12強抗老化都市傳說

目前尚無資料

目前位置：首頁 > 圖書十大分類 > 300 科學類 > 312 電腦科學 > 實用DeepSeek技術:開發真正可用的LLM應用程式

實用DeepSeek技術:開發真正可用的LLM應用程式

作者：韓曉晨

出版社：深智數位

出版日期：2025-10-19

語言：中文

ISBN：9786267757390

裝訂：平裝

定價：880 元

內容簡介

目錄書摘

導讀/序

作者介紹

　　☆Transformer 架構與 MoE 專家路由解析
　　☆DeepSeek 系列模型架構與優化策略
　　☆FP8 混合精度與 DualPipe 平行算法實作
　　☆多頭注意力與跨節點通訊技術最佳化
　　☆程式自動生成、自動補全與偵錯技術
　　☆Prompt 工程與 Few-shot、Soft Prompt 設計
　　☆多工任務調度與跨領域特化模型應用
　　☆零售、製造等行業的訂製化實戰案例
　　☆資料構建、自監督學習與模型微調
　　☆DeepSeek-R1 自回歸快取與長上下文推理
　　☆分散式訓練與推理部署策略
　　☆API 呼叫設計、吞吐調校與系統整合

　　本書共分為十一章,涵蓋大模型核心技術與實務應用。第一章介紹大模型的演進歷程與基礎概念,說明深度學習、Transformer 與 MoE 架構的發展脈絡。第二章深入解析 DeepSeek 的核心設計,包括多頭注意力、FP8 混合精度與跨節點通訊技術。第三章建立大模型開發基礎,從 API 調用到資料準備與模型訓練。第四章聚焦對話生成與語義理解,實作多輪對話與語意分析。第五章實作從文字到程式的智慧開發流程,包含程式補全與錯誤偵測。第六章說明多工學習與跨領域應用,包括少樣本調適與領域特化。第七章系統介紹 Prompt 工程設計與調優策略。第八章探討模型最佳化與分散式部署。第九章解析資料構建與自監督學習流程。第十章展示訂製化模型開發在零售與製造業的應用案例。第十一章專章說明 DeepSeek-R1 的推理引擎與最新優化技術。全書內容完整銜接理論與實踐,適合開發者快速掌握 DeepSeek 的開發核心。

金寶書局網路書店