all
238 posts in all
Part 9 — AI 工程從零開始|Phase 5 Part 1:NLP 基礎 — 文字是智慧的介面
從詞袋到詞嵌入,掌握 NLP 工程師必備的文字前處理、TF-IDF、Word2Vec/GloVe/FastText 嵌入技術與文字分類生產架構
Part 9 — FDE core topic - Data Residence & Sovereign AI:金融醫療場景的地緣合規架構
深入解析資料主權架構的技術控制堆疊,涵蓋 VPC Service Controls、Organization Policy、Vertex AI 區域端點及審計證據,幫助工程師在面試中精準回答金融與醫療合規場景。
Part 9 — FDE 面試準備指南(九):LLM 核心知識——Token、Prompt Engineering 與 Embedding
以 Google AI 工程師兼面試官的視角,整理 FDE 面試中最關鍵的 LLM 實用知識:Token 與 Context Window 的工程意涵、Prompt Engineering 五大技法,以及 Embedding 在語意搜尋中的原理與選型
Part 10 — AI 工程從零開始|Phase 5 Part 2:Seq2Seq 與注意力機制 — Transformer 前夜
深入解析 RNN/LSTM/GRU 序列建模、Encoder-Decoder 架構、Bahdanau 注意力機制,理解 Transformer 取代 RNN 的工程動機
Part 10 — FDE core topic - CMEK / BYOK 信封加密:自主密鑰管理與零信任加密架構
深入解析信封加密的 DEK/KEK 機制、Cloud KMS 與外部密鑰管理器(EKM)的取捨、Confidential Computing 封存與 Vertex AI CMEK 整合,掌握企業級零信任加密的三個實作層次。
Part 10 — FDE 面試準備指南(十):RKK 實戰——AI Agent 的 Context Management
以系統設計視角拆解 AI Agent 的 Context Management:核心問題是什麼、有哪些策略、為什麼選這個、trade-off 怎麼算——含完整架構圖與面試答題框架
Part 11 — AI 工程從零開始|Phase 5 Part 3:進階 NLP — BERT、問答系統與語言理解
深入解析 BERT/RoBERTa/DeBERTa 預訓練策略、問答系統架構、文字摘要、機器翻譯評估與 NLP 生產系統的工程挑戰
Part 11 — FDE core topic - Async Event-Driven Pipeline:解耦同步 HTTP 與保護後端連線池
深入剖析如何以非同步訊息傳遞取代同步 HTTP 請求,防止 LLM 推論延遲(2–30 秒)耗盡 Web Server 連線池,支撐 50,000+ 並發用戶,改善幅度達 250 倍。
Part 11 — FDE 面試準備指南(十一):RKK 實戰——AI Agent 線上除錯與故障排除
以系統設計視角拆解 AI Agent 的 Troubleshooting:為什麼 Agent 難 debug、觀測性架構怎麼設計、五大故障模式怎麼追蹤——含完整架構圖與 Google Doc 模擬情境應答框架
Part 12 — AI 工程從零開始|Phase 6 Part 1:自動語音辨識 — 讓機器聽懂人類
深入解析 ASR 工程架構:聲學特徵提取(MFCC/Mel Spectrogram)、CTC/Attention 解碼、Whisper 架構與生產級語音辨識系統設計
Part 12 — FDE core topic - Backpressure & Fair-Share:多租戶流量削峰與公平資源排程
深入解析 Token Bucket 反壓機制與加權公平排隊,說明多租戶 AI 平台如何在突發流量下保障每個租戶的最低吞吐量,並以 Redis Lua 腳本實現亞毫秒級限速。
Part 12 — FDE 面試準備指南(十二):RKK 實戰——AI Agent 統計評估與品質量化
以系統設計視角拆解 AI Agent 的 Evaluation Pipeline:核心問題是什麼、RAG 評估三角怎麼設計、LLM-as-Judge 的取捨、以及怎麼讓 eval 成為持續整合的一環——含完整架構圖
Part 13 — AI 工程從零開始|Phase 6 Part 2:語音合成與音訊模型 — 讓機器開口說話
深入解析 TTS 工程架構:Tacotron/FastSpeech/VITS 聲學模型、聲碼器設計、情感語音合成、音樂生成與即時語音克隆系統
Part 13 — FDE core topic - Idempotency & State Recovery:分佈式 Agent 的精確一次斷點續傳
深入剖析如何透過 Checkpoint + Compare-And-Swap 保證分佈式 Agent 在 Pod OOM、搶佔或網路分割後,重啟時精確跳過已完成步驟,實現零重複副作用的斷點續傳。
Part 13 — FDE 面試準備指南(十三):RKK 實戰——Prompt Injection 攻防與 Agent 安全
以系統設計視角拆解 AI Agent 的安全架構:Prompt Injection 的兩類攻擊、為什麼 Agent 比純 LLM 危險 10 倍、五層防禦架構怎麼設計、OAuth 授權怎麼落地——含完整攻防架構圖
Part 14 — AI 工程從零開始|Phase 7 Part 1:Transformer 架構深度解析 — 改變一切的注意力
從工程師視角完整解析 Transformer:Multi-Head Attention 矩陣計算、位置編碼、KV Cache、Flash Attention 與 MQA/GQA 生產優化
Part 14 — FDE core topic - Speculative Tool Execution:大扇出控制與投機雙發防禦
深入剖析 Agent 並行 15 個工具呼叫時如何以投機雙發(Hedged Request)壓制 P99 尾部延遲、用硬截止時間搭配優雅降級回傳部分結果,將整體等待從 30 秒壓到 1.5 秒(20 倍改善)。
Part 14 — FDE 面試準備指南(十四):RKK 實戰——AI Agent Memory 架構設計
以系統設計視角拆解 AI Agent 的 Memory 架構:為什麼需要四種記憶、每種記憶解決什麼問題、怎麼組合、以及記憶帶來的工程挑戰——含完整架構圖與選型決策框架
Part 15 — AI 工程從零開始|Phase 7 Part 2:Transformer 訓練策略與架構變體
深入解析 Transformer 訓練:學習率 Warmup/Schedule、梯度裁剪、混合精度訓練、Encoder-only/Decoder-only/Encoder-Decoder 架構選型,以及 MoE 混合專家系統
Part 15 — FDE core topic - Vector Drift & Blue-Green Indexing:向量圖結構健康度與零停機切換
深入解析 HNSW 向量圖在持續增量更新下的 recall 衰退機制,以及 Lambda 架構 + Blue-Green 切換如何在不停機的前提下將 recall@10 恢復至 94% 以上。
Part 15 — FDE 面試準備指南(十五):RKK 實戰——AI Agent 規模化與 Cache 策略
以系統設計視角拆解 AI Agent 的規模化挑戰:為什麼 LLM 系統的擴展和傳統 Web 不同、三層 Cache 各解決什麼問題、Stateful Agent 怎麼做水平擴展——含完整架構圖與成本估算框架
Part 16 — AI 工程從零開始|Phase 8 Part 1:擴散模型 — 從雜訊到藝術的數學
深入解析擴散模型工程原理:DDPM/DDIM 前向與反向過程、Stable Diffusion 潛在空間架構、ControlNet/LoRA 微調、生產推論優化
Part 16 — FDE core topic - TTFT & Throughput Optimization:首字延遲與推理吞吐量的硬體級優化
深入解析 LLM 推理服務的兩大核心指標——首字時間(TTFT)與每秒 Token 吞吐量——以及 Quantization、Continuous Batching、PagedAttention、Speculative Decoding、Flash Attention 五大硬體級優化技術的原理與取捨。
Part 16 — FDE 面試準備指南(十六):RKK 實戰——Multi-Agent 狀態管理與死鎖排除
以系統設計視角拆解 Multi-Agent 的狀態管理與死鎖問題:為什麼階層式授權架構會產生死循環、State Reducer 的設計原理、分散式 Checkpoint 策略,以及如何在 LangGraph 中設計收斂的 Agent 圖
Part 17 — AI 工程從零開始|Phase 8 Part 2:GAN 與影片生成 — 對抗的藝術
深入解析 GAN 訓練動態、StyleGAN/CycleGAN 架構、影片生成系統設計,以及 GAN vs 擴散模型的工程選型決策