LLM開源大物:DeepSeek深入技術多模態開發

熱門：AI 世界棒球12強都市傳說不敗學習力抗老化

目前尚無資料

目前位置：首頁 > 圖書十大分類 > 300 科學類 > 312 電腦科學 > LLM開源大物:DeepSeek深入技術多模態開發

LLM開源大物:DeepSeek深入技術多模態開發

作者：王曉華

出版社：深智數位

出版日期：2025-10-19

語言：中文

ISBN：9786267757383

裝訂：平裝

定價：980 元

內容簡介

目錄書摘

導讀/序

作者介紹

　　★剖析 DeepSeek 核心架構與 MLA 注意力模組

　　★系統講解 MoE 混合專家模型的設計與調度

　　★建構完整的 PyTorch 多模態開發環境

　　★從基礎到進階掌握自注意力與位置編碼原理

　　★實作自回歸架構下的文字生成與情感分類

　　★探討 GQA、MQA、差分注意力等調優策略

　　★整合 API 調用與應用場景中的任務鏈設計

　　★部署本地多模態模型並實作 LoRA 微調

　　★實戰多模態圖文問答與交叉注意力語音轉換

　　★實現 Token 壓縮與特徵融合技術於影像識別

　　★使用 VQ-VAE 與 FSQ 進行影像與語音重建

　　★完整開發跨平台智慧客服應用與 UI 前端整合

　　本書重點在於多模態大模型 DeepSeek 的核心技術架構,深入解析其高效注意力機制(如MLA、MQA、GQA)與混合專家模型(MoE)在實際應用中的設計與優化策略。內容涵蓋從PyTorch環境建置、API串接到LoRA/PEFT微調等多個開發環節,並透過情感分類、語音辨識、圖文問答、影像生成等跨模態實例,具體展示各模組在不同任務中的運行特性與效能差異。書中對於特徵融合策略、位置編碼設計、token壓縮方法等議題也有細緻探討,尤其在調優章節中,對各類注意力變種模型的適用條件與實作瓶頸提供實證分析。對於希望深入理解高性能Transformer架構、多模態任務建模及部署流程的開發者與研究者而言,本書可作為技術參考與實作指南。

金寶書局網路書店