All | YennJ12 Engineering Blog

Part 7 — Kubernetes Autoscaling Complete Guide (Part 7): Production Troubleshooting & War Stories

Part 7 of the Kubernetes Autoscaling series: Real-world production incidents, debugging workflows, common failure scenarios, and hard-learned lessons from operating autoscaling at scale. Battle-tested troubleshooting guides and postmortem analysis.

Nov 10, 2025 ·45 min

Part 8 — AI 工程從零開始｜Phase 4 Part 3：視覺語言模型、3D 視覺與世界模型

深入解析 CLIP/BLIP/LLaVA 視覺語言模型架構、NeRF/3D Gaussian Splatting 三維重建、以及 Sora 等影片生成世界模型的工程原理

Jun 21, 2026 ·23 min

Part 8 — FDE core topic - PII 去識別化與格式保留加密：資料進入 AI 管線前的隱私護欄

深入解析 PII 去識別化光譜、格式保留加密（FPE）原理、Cloud Sensitive Data Protection 整合，以及 AI 管線中隱私護欄的三個實作層次。

Jun 8, 2026 ·18 min

Part 8 — FDE 面試準備指南（八）：ML 基礎必備——從傳統機器學習到 Deep Learning

以 Google AI 工程師兼面試官的視角，系統整理 FDE 面試不能缺的 ML 基礎：Supervised Learning、評估指標、Overfitting 處理，以及從 MLP 到 Transformer 的 Deep Learning 核心概念

May 31, 2026 ·18 min

Part 8 — Kubernetes Autoscaling Complete Guide (Part 8): Security, Compliance & Governance

Part 8 of the Kubernetes Autoscaling series: Complete guide to securing autoscaling infrastructure with RBAC, policy enforcement, compliance frameworks (PCI-DSS, HIPAA, SOC2), multi-tenancy patterns, audit logging, and governance best practices for enterprise Kubernetes.

Nov 10, 2025 ·50 min

Part 9 — AI 工程從零開始｜Phase 5 Part 1：NLP 基礎 — 文字是智慧的介面

從詞袋到詞嵌入，掌握 NLP 工程師必備的文字前處理、TF-IDF、Word2Vec/GloVe/FastText 嵌入技術與文字分類生產架構

Jun 21, 2026 ·23 min

Part 9 — FDE core topic - Data Residence & Sovereign AI：金融醫療場景的地緣合規架構

深入解析資料主權架構的技術控制堆疊，涵蓋 VPC Service Controls、Organization Policy、Vertex AI 區域端點及審計證據，幫助工程師在面試中精準回答金融與醫療合規場景。

Jun 8, 2026 ·18 min

Part 9 — FDE 面試準備指南（九）：LLM 核心知識——Token、Prompt Engineering 與 Embedding

以 Google AI 工程師兼面試官的視角，整理 FDE 面試中最關鍵的 LLM 實用知識：Token 與 Context Window 的工程意涵、Prompt Engineering 五大技法，以及 Embedding 在語意搜尋中的原理與選型

May 31, 2026 ·15 min

Part 10 — AI 工程從零開始｜Phase 5 Part 2：Seq2Seq 與注意力機制 — Transformer 前夜

深入解析 RNN/LSTM/GRU 序列建模、Encoder-Decoder 架構、Bahdanau 注意力機制，理解 Transformer 取代 RNN 的工程動機

Jun 21, 2026 ·23 min

Part 10 — FDE core topic - CMEK / BYOK 信封加密：自主密鑰管理與零信任加密架構

深入解析信封加密的 DEK/KEK 機制、Cloud KMS 與外部密鑰管理器（EKM）的取捨、Confidential Computing 封存與 Vertex AI CMEK 整合，掌握企業級零信任加密的三個實作層次。

Jun 8, 2026 ·18 min

Part 10 — FDE 面試準備指南（十）：RKK 實戰——AI Agent 的 Context Management

以系統設計視角拆解 AI Agent 的 Context Management：核心問題是什麼、有哪些策略、為什麼選這個、trade-off 怎麼算——含完整架構圖與面試答題框架

Jun 3, 2026 ·16 min

Part 11 — AI 工程從零開始｜Phase 5 Part 3：進階 NLP — BERT、問答系統與語言理解

深入解析 BERT/RoBERTa/DeBERTa 預訓練策略、問答系統架構、文字摘要、機器翻譯評估與 NLP 生產系統的工程挑戰

Jun 21, 2026 ·23 min

Part 11 — FDE core topic - Async Event-Driven Pipeline：解耦同步 HTTP 與保護後端連線池

深入剖析如何以非同步訊息傳遞取代同步 HTTP 請求，防止 LLM 推論延遲（2–30 秒）耗盡 Web Server 連線池，支撐 50,000+ 並發用戶，改善幅度達 250 倍。

Jun 8, 2026 ·18 min

Part 11 — FDE 面試準備指南（十一）：RKK 實戰——AI Agent 線上除錯與故障排除

以系統設計視角拆解 AI Agent 的 Troubleshooting：為什麼 Agent 難 debug、觀測性架構怎麼設計、五大故障模式怎麼追蹤——含完整架構圖與 Google Doc 模擬情境應答框架

Jun 3, 2026 ·17 min

Part 12 — AI 工程從零開始｜Phase 6 Part 1：自動語音辨識 — 讓機器聽懂人類

深入解析 ASR 工程架構：聲學特徵提取（MFCC/Mel Spectrogram）、CTC/Attention 解碼、Whisper 架構與生產級語音辨識系統設計

Jun 21, 2026 ·20 min

Part 12 — FDE core topic - Backpressure & Fair-Share：多租戶流量削峰與公平資源排程

深入解析 Token Bucket 反壓機制與加權公平排隊，說明多租戶 AI 平台如何在突發流量下保障每個租戶的最低吞吐量，並以 Redis Lua 腳本實現亞毫秒級限速。

Jun 8, 2026 ·18 min

Part 12 — FDE 面試準備指南（十二）：RKK 實戰——AI Agent 統計評估與品質量化

以系統設計視角拆解 AI Agent 的 Evaluation Pipeline：核心問題是什麼、RAG 評估三角怎麼設計、LLM-as-Judge 的取捨、以及怎麼讓 eval 成為持續整合的一環——含完整架構圖

Jun 3, 2026 ·15 min

Part 13 — AI 工程從零開始｜Phase 6 Part 2：語音合成與音訊模型 — 讓機器開口說話

深入解析 TTS 工程架構：Tacotron/FastSpeech/VITS 聲學模型、聲碼器設計、情感語音合成、音樂生成與即時語音克隆系統

Jun 21, 2026 ·20 min

Part 13 — FDE core topic - Idempotency & State Recovery：分佈式 Agent 的精確一次斷點續傳

深入剖析如何透過 Checkpoint + Compare-And-Swap 保證分佈式 Agent 在 Pod OOM、搶佔或網路分割後，重啟時精確跳過已完成步驟，實現零重複副作用的斷點續傳。

Jun 8, 2026 ·18 min

Part 13 — FDE 面試準備指南（十三）：RKK 實戰——Prompt Injection 攻防與 Agent 安全

以系統設計視角拆解 AI Agent 的安全架構：Prompt Injection 的兩類攻擊、為什麼 Agent 比純 LLM 危險 10 倍、五層防禦架構怎麼設計、OAuth 授權怎麼落地——含完整攻防架構圖

Jun 3, 2026 ·15 min

Part 14 — AI 工程從零開始｜Phase 7 Part 1：Transformer 架構深度解析 — 改變一切的注意力

從工程師視角完整解析 Transformer：Multi-Head Attention 矩陣計算、位置編碼、KV Cache、Flash Attention 與 MQA/GQA 生產優化

Jun 21, 2026 ·23 min

Part 14 — FDE core topic - Speculative Tool Execution：大扇出控制與投機雙發防禦

深入剖析 Agent 並行 15 個工具呼叫時如何以投機雙發（Hedged Request）壓制 P99 尾部延遲、用硬截止時間搭配優雅降級回傳部分結果，將整體等待從 30 秒壓到 1.5 秒（20 倍改善）。

Jun 8, 2026 ·18 min

Part 14 — FDE 面試準備指南（十四）：RKK 實戰——AI Agent Memory 架構設計

以系統設計視角拆解 AI Agent 的 Memory 架構：為什麼需要四種記憶、每種記憶解決什麼問題、怎麼組合、以及記憶帶來的工程挑戰——含完整架構圖與選型決策框架

Jun 3, 2026 ·15 min

Part 15 — AI 工程從零開始｜Phase 7 Part 2：Transformer 訓練策略與架構變體

深入解析 Transformer 訓練：學習率 Warmup/Schedule、梯度裁剪、混合精度訓練、Encoder-only/Decoder-only/Encoder-Decoder 架構選型，以及 MoE 混合專家系統

Jun 21, 2026 ·23 min

Part 15 — FDE core topic - Vector Drift & Blue-Green Indexing：向量圖結構健康度與零停機切換

深入解析 HNSW 向量圖在持續增量更新下的 recall 衰退機制，以及 Lambda 架構 + Blue-Green 切換如何在不停機的前提下將 recall@10 恢復至 94% 以上。

Jun 8, 2026 ·18 min