Engineering

Part 20 — AI 工程從零開始｜Phase 10 Part 2：LLM 預訓練 — 萬億 Token 的工程挑戰

深入解析 LLM 預訓練工程：資料清洗管線、Scaling Laws、分散式訓練（DP/TP/PP）、梯度累積與 Chinchilla 最優計算分配

Jun 21, 2026 ·23 min

Part 20 — FDE core topic - RAG Triad Metrics：上下文相關度、忠實度與答案相關度的可觀測性追蹤

深入解析 RAG 系統三大評估指標——Context Relevance、Groundedness、Answer Relevance——以及如何透過 OpenTelemetry 與 Grafana 建立生產級可觀測性追蹤管道。

Jun 8, 2026 ·18 min

Part 20 — FDE 面試準備指南（二十）：RKK 實戰——間接 Prompt Injection 與 Dual-LLM 防禦架構

以系統設計視角拆解間接 Prompt Injection（Indirect Prompt Injection）的攻擊原理與 Dual-LLM 防禦模式：為什麼權限隔離比 Pattern Matching 更根本、Trust Level 分層設計、以及零信任 AI 架構的工程實踐

Jun 4, 2026 ·15 min

Part 21 — AI 工程從零開始｜Phase 10 Part 3：LLM 微調 — LoRA、QLoRA 與指令對齊

深入解析 LLM 微調策略：LoRA/QLoRA 低秩分解原理、SFT 指令資料品質、PEFT 家族比較、微調陷阱與生產部署的工程決策

Jun 21, 2026 ·23 min

Part 21 — FDE core topic - Discovery to Technical Constraints：顧問工程師的高階探索問法

掌握將模糊客戶需求轉化為精確技術規格的 SCALE 探索框架，透過 5 個關鍵問題節省 5 週無效開發，以約束矩陣驅動架構決策，是 FDE 面試中判斷顧問成熟度的核心指標。

Jun 8, 2026 ·18 min

Part 21 — FDE 面試準備指南（二十一）：RKK 實戰——長任務 Agent 的異步分散式架構

以系統設計視角拆解需要執行 30~60 分鐘的 Agent 任務：為什麼不能讓用戶等 HTTP Response、解耦架構的設計原理、Checkpoint 斷點續傳機制，以及 GCP 上的具體落地方案

Jun 4, 2026 ·17 min

Part 22 — AI 工程從零開始｜Phase 11 Part 1：LLM 推論工程 — 從實驗到每秒千次請求

深入解析 LLM 生產推論：vLLM PagedAttention、連續批次、投機解碼、量化（GPTQ/AWQ/INT4）、推論成本優化與 SLA 設計

Jun 21, 2026 ·23 min

Part 22 — FDE core topic - Structured Troubleshooting：自上而下分層排錯與 AI 系統觀測方法論

系統化分層排錯方法論：從用戶症狀出發，逐層消除 AI Agent 系統故障根因，涵蓋 API Gateway、Orchestration、Tool APIs、Model Quota 四層診斷策略與 OpenTelemetry 實作。

Jun 8, 2026 ·18 min

Part 22 — FDE 面試準備指南（二十二）：RKK 實戰——動態並行 Tool-Calling 與依賴解析引擎

以系統設計視角拆解 Multi-Tool 並行執行架構：為什麼順序執行是延遲瓶頸、DAG 依賴解析引擎的設計原理、動態並行 vs 靜態並行的 trade-off，以及 Google ADK Tool Registry 的落地方案

Jun 4, 2026 ·16 min

Part 23 — AI 工程從零開始｜Phase 11 Part 2：RAG 系統與 LLM 評估 — 生產落地的最後一哩

深入解析 RAG 架構設計：向量資料庫選型、Hybrid Search、Re-ranking、Chunking 策略，以及 LLM 評估框架：RAGAS/G-Eval/LLM-as-Judge

Jun 21, 2026 ·23 min

Part 23 — FDE core topic - Stakeholder Mapping：利害關係人圖譜與決策影響力分析

深入解析企業 AI 專案中的利害關係人分類、影響力圖譜建構與針對性溝通策略，避免技術上完美的提案在最後一刻被隱形阻擋者否決。

Jun 8, 2026 ·18 min

Part 23 — FDE 面試準備指南（二十三）：RKK 實戰——多租戶 Agent 的限流、Fair-Share 與 Token 預算控制

以系統設計視角拆解多租戶 AI Agent 系統的資源隔離問題：為什麼傳統 RPM 限流不夠、Token-Aware Rate Limiting 的設計原理、分散式令牌桶架構，以及如何防止 Noisy Neighbor Effect 影響其他租戶

Jun 4, 2026 ·16 min

Part 24 — AI 工程從零開始｜Phase 12 Part 1：Vision Transformer 與多模態融合架構

深入解析 ViT 的 Patch Embedding 機制、多模態融合策略（Early/Late/Cross-Modal Fusion）、CLIP/ALIGN 對比學習與多模態生產系統設計

Jun 21, 2026 ·23 min

Part 24 — FDE core topic - POC Scoring & ROI：概念驗證評分矩陣與投資回報框架設計

深入解析如何在 AI 專案 POC 階段設計假設驅動的成功指標矩陣、ROI 計算框架，以及 Go/No-Go 決策閘，讓概念驗證成為客觀商業決策而非主觀技術辯論。

Jun 8, 2026 ·18 min

Part 24 — FDE 面試準備指南（二十四）：RKK 實戰——混合模型路由與語意路由器設計

以系統設計視角拆解 Hybrid Model Routing 架構：Semantic Router 的設計原理、小模型 vs 大模型的路由決策框架、如何用 Eval Pipeline 確保路由器不會犧牲整體品質，以及 Gemma 與 Gemini 的混合部署策略

Jun 4, 2026 ·17 min

Part 25 — AI 工程從零開始｜Phase 12 Part 2：多模態 Agent 與電腦操作 — 跨模態推理與行動

深入解析多模態 Agent 架構：OCR+VLM 文件理解、電腦視覺 UI 自動化、SeeAct/Computer Use 系統設計與安全邊界

Jun 21, 2026 ·23 min

Part 25 — FDE core topic - Value Story & Objection Handling：價值敘事架構與常見異議破解

將技術能力轉譯為業務成果的完整框架：SCRI 敘事結構、五大企業 AI 異議破解策略，以及如何用客戶數據做出讓決策者無法拒絕的 Value Story Demo。

Jun 8, 2026 ·15 min

Part 25 — FDE 面試準備指南（二十五）：RKK 實戰——Self-Reflection 與幻覺校正迴圈設計

以系統設計視角拆解 Generator-Evaluator 雙節點架構：為什麼 LLM 需要自我檢查機制、Reflexion Pattern 的設計原理、如何防止反思迴圈變成無限循環，以及收斂保證的工程實踐

Jun 4, 2026 ·17 min

Part 26 — AI 工程從零開始｜Phase 13 Part 1：MCP 與 API 整合 — AI 與真實世界的介面

深入解析 Model Context Protocol（MCP）架構、Function Calling 設計模式、工具整合生產化、API 安全與速率控制，以及 AI 系統的外部工具編排

Jun 21, 2026 ·23 min

Part 26 — FDE 面試準備指南（二十六）：顧問實戰——「我們現在用 OpenAI，為什麼要換 Vertex AI？」

以 Google FDE 顧問視角拆解競品定位對話：如何回應客戶的 OpenAI / AWS 比較、用場景驅動而非規格比較的說服框架、Vertex AI 的差異化優勢在哪裡，以及如何避免常見的定位陷阱

Jun 4, 2026 ·15 min

Part 27 — AI 工程從零開始｜Phase 13 Part 2：AI 工作流程編排 — LangChain、LlamaIndex 與生產管線

深入解析 AI 工作流程編排：LangChain/LlamaIndex/Haystack 框架比較、DAG 管線設計、有狀態工作流程、錯誤重試與生產監控

Jun 21, 2026 ·23 min

Part 27 — FDE 面試準備指南（二十七）：顧問實戰——如何在 45 分鐘內把模糊需求變成 POC 計畫

以 Google FDE 顧問視角拆解 POC Scoping 技藝：如何在客戶會議中從模糊需求提取可執行計畫、Discovery 問題的設計、Success Criteria 怎麼訂、以及如何防止 POC 變成無止境的免費諮詢

Jun 4, 2026 ·14 min

Part 28 — AI 工程從零開始｜Phase 14 Part 1：Agent 迴圈與記憶系統 — 從單次呼叫到自主行動

深入解析 AI Agent 工程基礎：ReAct/Reflexion 思考迴圈、記憶系統四層架構（感官/工作/情節/語意）、上下文管理與 Agent 狀態機設計

Jun 21, 2026 ·23 min

Part 28 — FDE 面試準備指南（二十八）：顧問實戰——生產事故診斷與客戶溝通語言

以 Google FDE 顧問視角拆解 AI 系統生產事故的處理全流程：P95 延遲異常的診斷思路、不停機排查策略、如何在技術細節與客戶語言之間切換，以及事故後的信任重建框架

Jun 4, 2026 ·16 min

Part 29 — AI 工程從零開始｜Phase 14 Part 2：Agent 規劃系統 — 從目標到行動計畫

深入解析 AI Agent 規劃架構：Tree-of-Thought/Plan-and-Execute/MCTS、任務分解策略、規劃失敗診斷與動態重規劃機制

Jun 21, 2026 ·23 min