AI
147 posts in ai
Part 12 — FDE 面試準備指南(十二):RKK 實戰——AI Agent 統計評估與品質量化
以系統設計視角拆解 AI Agent 的 Evaluation Pipeline:核心問題是什麼、RAG 評估三角怎麼設計、LLM-as-Judge 的取捨、以及怎麼讓 eval 成為持續整合的一環——含完整架構圖
Part 13 — AI 工程從零開始|Phase 6 Part 2:語音合成與音訊模型 — 讓機器開口說話
深入解析 TTS 工程架構:Tacotron/FastSpeech/VITS 聲學模型、聲碼器設計、情感語音合成、音樂生成與即時語音克隆系統
Part 13 — FDE 面試準備指南(十三):RKK 實戰——Prompt Injection 攻防與 Agent 安全
以系統設計視角拆解 AI Agent 的安全架構:Prompt Injection 的兩類攻擊、為什麼 Agent 比純 LLM 危險 10 倍、五層防禦架構怎麼設計、OAuth 授權怎麼落地——含完整攻防架構圖
Part 14 — AI 工程從零開始|Phase 7 Part 1:Transformer 架構深度解析 — 改變一切的注意力
從工程師視角完整解析 Transformer:Multi-Head Attention 矩陣計算、位置編碼、KV Cache、Flash Attention 與 MQA/GQA 生產優化
Part 14 — FDE 面試準備指南(十四):RKK 實戰——AI Agent Memory 架構設計
以系統設計視角拆解 AI Agent 的 Memory 架構:為什麼需要四種記憶、每種記憶解決什麼問題、怎麼組合、以及記憶帶來的工程挑戰——含完整架構圖與選型決策框架
Part 15 — AI 工程從零開始|Phase 7 Part 2:Transformer 訓練策略與架構變體
深入解析 Transformer 訓練:學習率 Warmup/Schedule、梯度裁剪、混合精度訓練、Encoder-only/Decoder-only/Encoder-Decoder 架構選型,以及 MoE 混合專家系統
Part 15 — FDE 面試準備指南(十五):RKK 實戰——AI Agent 規模化與 Cache 策略
以系統設計視角拆解 AI Agent 的規模化挑戰:為什麼 LLM 系統的擴展和傳統 Web 不同、三層 Cache 各解決什麼問題、Stateful Agent 怎麼做水平擴展——含完整架構圖與成本估算框架
Part 16 — AI 工程從零開始|Phase 8 Part 1:擴散模型 — 從雜訊到藝術的數學
深入解析擴散模型工程原理:DDPM/DDIM 前向與反向過程、Stable Diffusion 潛在空間架構、ControlNet/LoRA 微調、生產推論優化
Part 16 — FDE 面試準備指南(十六):RKK 實戰——Multi-Agent 狀態管理與死鎖排除
以系統設計視角拆解 Multi-Agent 的狀態管理與死鎖問題:為什麼階層式授權架構會產生死循環、State Reducer 的設計原理、分散式 Checkpoint 策略,以及如何在 LangGraph 中設計收斂的 Agent 圖
Part 17 — AI 工程從零開始|Phase 8 Part 2:GAN 與影片生成 — 對抗的藝術
深入解析 GAN 訓練動態、StyleGAN/CycleGAN 架構、影片生成系統設計,以及 GAN vs 擴散模型的工程選型決策
Part 17 — FDE 面試準備指南(十七):RKK 實戰——MCP 伺服器、Tool-Calling 安全與 OAuth 授權
以系統設計視角拆解 MCP(Model Context Protocol)的安全邊界:Agent 的工具授權架構、Human-in-the-loop OAuth 流程、Tool Input Validation 防禦層,以及如何防止 Tool Injection 攻擊
Part 18 — AI 工程從零開始|Phase 9:強化學習基礎 — RLHF 與遊戲 AI 的根基
深入解析強化學習工程原理:MDP/Q-Learning/Policy Gradient/PPO/RLHF,理解 ChatGPT 背後的對齊訓練機制
Part 18 — FDE 面試準備指南(十八):RKK 實戰——三層記憶體架構與 LLM 成本調優
以系統設計視角拆解企業級 Agent 的三層記憶體設計:Working Memory 成本控制、Semantic Long-term Memory 的異步壓縮流程、Profile Memory 的結構化提取——以及每個設計決策背後的成本與延遲 trade-off
Part 19 — AI 工程從零開始|Phase 10 Part 1:從頭構建 LLM — Tokenization 的工程藝術
深入解析 LLM Tokenization:BPE/WordPiece/SentencePiece 演算法、詞彙表大小的工程取捨、多語言 Token 效率與 Tiktoken 生產實作
Part 19 — FDE 面試準備指南(十九):RKK 實戰——Multi-Agent 系統的統計評估與細粒度追蹤
以系統設計視角拆解 Multi-Agent 系統的 Observability 架構:為什麼多 Agent 的評估比 RAG 複雜一個量級、Granular Tracing 的設計原理、Trajectory Evaluation 方法,以及如何找出是哪個 Agent 拖累了整體表現
Part 20 — AI 工程從零開始|Phase 10 Part 2:LLM 預訓練 — 萬億 Token 的工程挑戰
深入解析 LLM 預訓練工程:資料清洗管線、Scaling Laws、分散式訓練(DP/TP/PP)、梯度累積與 Chinchilla 最優計算分配
Part 20 — FDE 面試準備指南(二十):RKK 實戰——間接 Prompt Injection 與 Dual-LLM 防禦架構
以系統設計視角拆解間接 Prompt Injection(Indirect Prompt Injection)的攻擊原理與 Dual-LLM 防禦模式:為什麼權限隔離比 Pattern Matching 更根本、Trust Level 分層設計、以及零信任 AI 架構的工程實踐
Part 21 — AI 工程從零開始|Phase 10 Part 3:LLM 微調 — LoRA、QLoRA 與指令對齊
深入解析 LLM 微調策略:LoRA/QLoRA 低秩分解原理、SFT 指令資料品質、PEFT 家族比較、微調陷阱與生產部署的工程決策
Part 21 — FDE 面試準備指南(二十一):RKK 實戰——長任務 Agent 的異步分散式架構
以系統設計視角拆解需要執行 30~60 分鐘的 Agent 任務:為什麼不能讓用戶等 HTTP Response、解耦架構的設計原理、Checkpoint 斷點續傳機制,以及 GCP 上的具體落地方案
Part 22 — AI 工程從零開始|Phase 11 Part 1:LLM 推論工程 — 從實驗到每秒千次請求
深入解析 LLM 生產推論:vLLM PagedAttention、連續批次、投機解碼、量化(GPTQ/AWQ/INT4)、推論成本優化與 SLA 設計
Part 22 — FDE 面試準備指南(二十二):RKK 實戰——動態並行 Tool-Calling 與依賴解析引擎
以系統設計視角拆解 Multi-Tool 並行執行架構:為什麼順序執行是延遲瓶頸、DAG 依賴解析引擎的設計原理、動態並行 vs 靜態並行的 trade-off,以及 Google ADK Tool Registry 的落地方案
Part 23 — AI 工程從零開始|Phase 11 Part 2:RAG 系統與 LLM 評估 — 生產落地的最後一哩
深入解析 RAG 架構設計:向量資料庫選型、Hybrid Search、Re-ranking、Chunking 策略,以及 LLM 評估框架:RAGAS/G-Eval/LLM-as-Judge
Part 23 — FDE 面試準備指南(二十三):RKK 實戰——多租戶 Agent 的限流、Fair-Share 與 Token 預算控制
以系統設計視角拆解多租戶 AI Agent 系統的資源隔離問題:為什麼傳統 RPM 限流不夠、Token-Aware Rate Limiting 的設計原理、分散式令牌桶架構,以及如何防止 Noisy Neighbor Effect 影響其他租戶
Part 24 — AI 工程從零開始|Phase 12 Part 1:Vision Transformer 與多模態融合架構
深入解析 ViT 的 Patch Embedding 機制、多模態融合策略(Early/Late/Cross-Modal Fusion)、CLIP/ALIGN 對比學習與多模態生產系統設計
Part 24 — FDE 面試準備指南(二十四):RKK 實戰——混合模型路由與語意路由器設計
以系統設計視角拆解 Hybrid Model Routing 架構:Semantic Router 的設計原理、小模型 vs 大模型的路由決策框架、如何用 Eval Pipeline 確保路由器不會犧牲整體品質,以及 Gemma 與 Gemini 的混合部署策略