金寶書局網路書店

 
目前位置:首頁 > 圖書十大分類 > 300 科學類 > 312 電腦科學 > 實用DeepSeek技術:開發真正可用的LLM應用程式
圖書十大分類 > 300 科學類 > 312 電腦科學 > 實用DeepSeek技術:開發真正可用的LLM應用程式
實用DeepSeek技術:開發真正可用的LLM應用程式
實用DeepSeek技術:開發真正可用的LLM應用程式
作者: 韓曉晨
出版社深智數位
出版日期:2025-10-19
語言:中文
ISBN:9786267757390
裝訂:平裝
定價880
購買數量:
內容簡介
目錄書摘
導讀/序
作者介紹
  ☆Transformer 架構與 MoE 專家路由解析
  ☆DeepSeek 系列模型架構與優化策略
  ☆FP8 混合精度與 DualPipe 平行算法實作
  ☆多頭注意力與跨節點通訊技術最佳化
  ☆程式自動生成、自動補全與偵錯技術
  ☆Prompt 工程與 Few-shot、Soft Prompt 設計
  ☆多工任務調度與跨領域特化模型應用
  ☆零售、製造等行業的訂製化實戰案例
  ☆資料構建、自監督學習與模型微調
  ☆DeepSeek-R1 自回歸快取與長上下文推理
  ☆分散式訓練與推理部署策略
  ☆API 呼叫設計、吞吐調校與系統整合

  本書共分為十一章,涵蓋大模型核心技術與實務應用。第一章介紹大模型的演進歷程與基礎概念,說明深度學習、Transformer 與 MoE 架構的發展脈絡。第二章深入解析 DeepSeek 的核心設計,包括多頭注意力、FP8 混合精度與跨節點通訊技術。第三章建立大模型開發基礎,從 API 調用到資料準備與模型訓練。第四章聚焦對話生成與語義理解,實作多輪對話與語意分析。第五章實作從文字到程式的智慧開發流程,包含程式補全與錯誤偵測。第六章說明多工學習與跨領域應用,包括少樣本調適與領域特化。第七章系統介紹 Prompt 工程設計與調優策略。第八章探討模型最佳化與分散式部署。第九章解析資料構建與自監督學習流程。第十章展示訂製化模型開發在零售與製造業的應用案例。第十一章專章說明 DeepSeek-R1 的推理引擎與最新優化技術。全書內容完整銜接理論與實踐,適合開發者快速掌握 DeepSeek 的開發核心。