Engineering

Part 11 — FDE 面試準備指南（十一）：RKK 實戰——AI Agent 線上除錯與故障排除

以系統設計視角拆解 AI Agent 的 Troubleshooting：為什麼 Agent 難 debug、觀測性架構怎麼設計、五大故障模式怎麼追蹤——含完整架構圖與 Google Doc 模擬情境應答框架

Jun 3, 2026 ·17 min

Part 12 — AI 工程從零開始｜Phase 6 Part 1：自動語音辨識 — 讓機器聽懂人類

深入解析 ASR 工程架構：聲學特徵提取（MFCC/Mel Spectrogram）、CTC/Attention 解碼、Whisper 架構與生產級語音辨識系統設計

Jun 21, 2026 ·20 min

Part 12 — FDE core topic - Backpressure & Fair-Share：多租戶流量削峰與公平資源排程

深入解析 Token Bucket 反壓機制與加權公平排隊，說明多租戶 AI 平台如何在突發流量下保障每個租戶的最低吞吐量，並以 Redis Lua 腳本實現亞毫秒級限速。

Jun 8, 2026 ·18 min

Part 12 — FDE 面試準備指南（十二）：RKK 實戰——AI Agent 統計評估與品質量化

以系統設計視角拆解 AI Agent 的 Evaluation Pipeline：核心問題是什麼、RAG 評估三角怎麼設計、LLM-as-Judge 的取捨、以及怎麼讓 eval 成為持續整合的一環——含完整架構圖

Jun 3, 2026 ·15 min

Part 13 — AI 工程從零開始｜Phase 6 Part 2：語音合成與音訊模型 — 讓機器開口說話

深入解析 TTS 工程架構：Tacotron/FastSpeech/VITS 聲學模型、聲碼器設計、情感語音合成、音樂生成與即時語音克隆系統

Jun 21, 2026 ·20 min

Part 13 — FDE core topic - Idempotency & State Recovery：分佈式 Agent 的精確一次斷點續傳

深入剖析如何透過 Checkpoint + Compare-And-Swap 保證分佈式 Agent 在 Pod OOM、搶佔或網路分割後，重啟時精確跳過已完成步驟，實現零重複副作用的斷點續傳。

Jun 8, 2026 ·18 min

Part 13 — FDE 面試準備指南（十三）：RKK 實戰——Prompt Injection 攻防與 Agent 安全

以系統設計視角拆解 AI Agent 的安全架構：Prompt Injection 的兩類攻擊、為什麼 Agent 比純 LLM 危險 10 倍、五層防禦架構怎麼設計、OAuth 授權怎麼落地——含完整攻防架構圖

Jun 3, 2026 ·15 min

Part 14 — AI 工程從零開始｜Phase 7 Part 1：Transformer 架構深度解析 — 改變一切的注意力

從工程師視角完整解析 Transformer：Multi-Head Attention 矩陣計算、位置編碼、KV Cache、Flash Attention 與 MQA/GQA 生產優化

Jun 21, 2026 ·23 min

Part 14 — FDE core topic - Speculative Tool Execution：大扇出控制與投機雙發防禦

深入剖析 Agent 並行 15 個工具呼叫時如何以投機雙發（Hedged Request）壓制 P99 尾部延遲、用硬截止時間搭配優雅降級回傳部分結果，將整體等待從 30 秒壓到 1.5 秒（20 倍改善）。

Jun 8, 2026 ·18 min

Part 14 — FDE 面試準備指南（十四）：RKK 實戰——AI Agent Memory 架構設計

以系統設計視角拆解 AI Agent 的 Memory 架構：為什麼需要四種記憶、每種記憶解決什麼問題、怎麼組合、以及記憶帶來的工程挑戰——含完整架構圖與選型決策框架

Jun 3, 2026 ·15 min

Part 15 — AI 工程從零開始｜Phase 7 Part 2：Transformer 訓練策略與架構變體

深入解析 Transformer 訓練：學習率 Warmup/Schedule、梯度裁剪、混合精度訓練、Encoder-only/Decoder-only/Encoder-Decoder 架構選型，以及 MoE 混合專家系統

Jun 21, 2026 ·23 min

Part 15 — FDE core topic - Vector Drift & Blue-Green Indexing：向量圖結構健康度與零停機切換

深入解析 HNSW 向量圖在持續增量更新下的 recall 衰退機制，以及 Lambda 架構 + Blue-Green 切換如何在不停機的前提下將 recall@10 恢復至 94% 以上。

Jun 8, 2026 ·18 min

Part 15 — FDE 面試準備指南（十五）：RKK 實戰——AI Agent 規模化與 Cache 策略

以系統設計視角拆解 AI Agent 的規模化挑戰：為什麼 LLM 系統的擴展和傳統 Web 不同、三層 Cache 各解決什麼問題、Stateful Agent 怎麼做水平擴展——含完整架構圖與成本估算框架

Jun 3, 2026 ·16 min

Part 16 — AI 工程從零開始｜Phase 8 Part 1：擴散模型 — 從雜訊到藝術的數學

深入解析擴散模型工程原理：DDPM/DDIM 前向與反向過程、Stable Diffusion 潛在空間架構、ControlNet/LoRA 微調、生產推論優化

Jun 21, 2026 ·23 min

Part 16 — FDE core topic - TTFT & Throughput Optimization：首字延遲與推理吞吐量的硬體級優化

深入解析 LLM 推理服務的兩大核心指標——首字時間（TTFT）與每秒 Token 吞吐量——以及 Quantization、Continuous Batching、PagedAttention、Speculative Decoding、Flash Attention 五大硬體級優化技術的原理與取捨。

Jun 8, 2026 ·18 min