金寶書局網路書店

 
目前位置:首頁 > 圖書十大分類 > 300 科學類 > 312 電腦科學 > LLM開源大物:DeepSeek深入技術多模態開發
圖書十大分類 > 300 科學類 > 312 電腦科學 > LLM開源大物:DeepSeek深入技術多模態開發
LLM開源大物:DeepSeek深入技術多模態開發
LLM開源大物:DeepSeek深入技術多模態開發
作者: 王曉華
出版社深智數位
出版日期:2025-10-19
語言:中文
ISBN:9786267757383
裝訂:平裝
定價980
購買數量:
內容簡介
目錄書摘
導讀/序
作者介紹
  ★剖析 DeepSeek 核心架構與 MLA 注意力模組

  ★系統講解 MoE 混合專家模型的設計與調度

  ★建構完整的 PyTorch 多模態開發環境

  ★從基礎到進階掌握自注意力與位置編碼原理

  ★實作自回歸架構下的文字生成與情感分類

  ★探討 GQA、MQA、差分注意力等調優策略

  ★整合 API 調用與應用場景中的任務鏈設計

  ★部署本地多模態模型並實作 LoRA 微調

  ★實戰多模態圖文問答與交叉注意力語音轉換

  ★實現 Token 壓縮與特徵融合技術於影像識別

  ★使用 VQ-VAE 與 FSQ 進行影像與語音重建

  ★完整開發跨平台智慧客服應用與 UI 前端整合



  本書重點在於多模態大模型 DeepSeek 的核心技術架構,深入解析其高效注意力機制(如MLA、MQA、GQA)與混合專家模型(MoE)在實際應用中的設計與優化策略。內容涵蓋從PyTorch環境建置、API串接到LoRA/PEFT微調等多個開發環節,並透過情感分類、語音辨識、圖文問答、影像生成等跨模態實例,具體展示各模組在不同任務中的運行特性與效能差異。書中對於特徵融合策略、位置編碼設計、token壓縮方法等議題也有細緻探討,尤其在調優章節中,對各類注意力變種模型的適用條件與實作瓶頸提供實證分析。對於希望深入理解高性能Transformer架構、多模態任務建模及部署流程的開發者與研究者而言,本書可作為技術參考與實作指南。