AI
147 posts in ai
Part 25 — AI 工程從零開始|Phase 12 Part 2:多模態 Agent 與電腦操作 — 跨模態推理與行動
深入解析多模態 Agent 架構:OCR+VLM 文件理解、電腦視覺 UI 自動化、SeeAct/Computer Use 系統設計與安全邊界
Part 25 — FDE 面試準備指南(二十五):RKK 實戰——Self-Reflection 與幻覺校正迴圈設計
以系統設計視角拆解 Generator-Evaluator 雙節點架構:為什麼 LLM 需要自我檢查機制、Reflexion Pattern 的設計原理、如何防止反思迴圈變成無限循環,以及收斂保證的工程實踐
Part 26 — AI 工程從零開始|Phase 13 Part 1:MCP 與 API 整合 — AI 與真實世界的介面
深入解析 Model Context Protocol(MCP)架構、Function Calling 設計模式、工具整合生產化、API 安全與速率控制,以及 AI 系統的外部工具編排
Part 26 — FDE 面試準備指南(二十六):顧問實戰——「我們現在用 OpenAI,為什麼要換 Vertex AI?」
以 Google FDE 顧問視角拆解競品定位對話:如何回應客戶的 OpenAI / AWS 比較、用場景驅動而非規格比較的說服框架、Vertex AI 的差異化優勢在哪裡,以及如何避免常見的定位陷阱
Part 27 — AI 工程從零開始|Phase 13 Part 2:AI 工作流程編排 — LangChain、LlamaIndex 與生產管線
深入解析 AI 工作流程編排:LangChain/LlamaIndex/Haystack 框架比較、DAG 管線設計、有狀態工作流程、錯誤重試與生產監控
Part 27 — FDE 面試準備指南(二十七):顧問實戰——如何在 45 分鐘內把模糊需求變成 POC 計畫
以 Google FDE 顧問視角拆解 POC Scoping 技藝:如何在客戶會議中從模糊需求提取可執行計畫、Discovery 問題的設計、Success Criteria 怎麼訂、以及如何防止 POC 變成無止境的免費諮詢
Part 28 — AI 工程從零開始|Phase 14 Part 1:Agent 迴圈與記憶系統 — 從單次呼叫到自主行動
深入解析 AI Agent 工程基礎:ReAct/Reflexion 思考迴圈、記憶系統四層架構(感官/工作/情節/語意)、上下文管理與 Agent 狀態機設計
Part 28 — FDE 面試準備指南(二十八):顧問實戰——生產事故診斷與客戶溝通語言
以 Google FDE 顧問視角拆解 AI 系統生產事故的處理全流程:P95 延遲異常的診斷思路、不停機排查策略、如何在技術細節與客戶語言之間切換,以及事故後的信任重建框架
Part 29 — AI 工程從零開始|Phase 14 Part 2:Agent 規劃系統 — 從目標到行動計畫
深入解析 AI Agent 規劃架構:Tree-of-Thought/Plan-and-Execute/MCTS、任務分解策略、規劃失敗診斷與動態重規劃機制
Part 29 — FDE 面試準備指南(二十九):顧問實戰——AI 系統 TCO 估算與 ROI 說服框架
以 Google FDE 顧問視角拆解 AI 系統的總持有成本(TCO)估算方法:Token 成本、Infra 成本、人力成本的計算框架、如何用 ROI 語言說服財務決策者,以及 Vertex AI 定價模型的實際試算
Part 30 — AI 工程從零開始|Phase 14 Part 3:Agent 框架全景 — AutoGen、CrewAI 與自建的取捨
深入比較主流 Agent 框架:AutoGen/CrewAI/LangGraph/Semantic Kernel 的架構差異、適用場景與生產成熟度,以及何時應該自建框架
Part 30 — FDE 面試準備指南(三十):顧問實戰——Constraint-First 架構設計:VPC 限制下的 GCP AI 系統
以 Google FDE 顧問視角拆解限制驅動的 AI 架構設計:當客戶說「所有資料不能離開我們的 VPC」,你的 Vertex AI 架構要怎麼調整、VPC Service Controls 的設計原理、Private Service Connect 的部署模式,以及金融與政府客戶常見的合規限制應對
Part 31 — AI 工程從零開始|Phase 14 Part 4:Agent 生產化 — 可靠性、可觀測性與成本控制
深入解析 Agent 生產部署工程:執行追蹤、成本預算控制、並發限流、Guardrails 安全防護、A/B 測試框架與 Agent 監控告警設計
Part 31 — FDE 面試準備指南(三十一):RKK 實戰——Google ADK 深度設計:Agent 類型、Tool 宣告與 Multi-Agent 協調
以系統設計視角深度拆解 Google Agent Development Kit(ADK):四種 Agent 類型的選擇邏輯、Tool 宣告系統的設計原理、Multi-Agent 的狀態共享機制,以及 ADK 在 Vertex AI 上的部署模式與 LangGraph 的根本差異
Part 32 — AI 工程從零開始|Phase 15 Part 1:長時程自主系統 — 跨天任務的 Agent 工程
深入解析長時程 Agent 工程挑戰:跨會話記憶持久化、多步驟任務分解、進度恢復、人機協作設計與長時程 Agent 的可靠性保障
Part 32 — FDE 面試準備指南(三十二):RKK 實戰——Vertex AI 產品棧全解析:Agent Builder、Vertex AI Search、Gemini API 與部署架構
以 Google FDE 視角完整拆解 Vertex AI AI 產品棧:何時選 Agent Builder vs 自建、Vertex AI Search 和 DIY RAG 的根本差異、Gemini API 四個關鍵特性(system instruction、tool use、grounding、context caching),以及企業 AI 系統的 GCP 部署架構
Part 33 — AI 工程從零開始|Phase 15 Part 2:自我改進與 2026 安全技術棧
深入解析 AI 自我改進機制:Constitutional AI/Self-Refinement/RLVR,以及 2026 年生產安全技術棧:越獄防禦/提示注入防護/行動沙箱
Part 33 — FDE 面試準備指南(三十三):RKK 面試解剖——面試官怎麼看你、怎麼評分、什麼叫做強力雇用
以 Google RKK 面試官的第一人稱視角,完整拆解 FDE RKK 面試的時間結構、五個評分維度、四個面試階段、「雇用」和「強力雇用」的實際差距,以及最常見的七個失敗模式
Part 34 — AI 工程從零開始|Phase 16 Part 1:多 Agent 協調 — 分工、通訊與共識
深入解析多 Agent 系統協調工程:Supervisor/Peer-to-Peer/Market 協調模式、Agent 間通訊協議、衝突解決、任務分配與共識機制
Part 34 — FDE 面試準備指南(三十四):RKK 實戰演練——六個端對端 Mock 情境題與模範答案
六個完整的 FDE RKK 面試 Mock 情境,每題包含客戶場景與限制條件、面試官的追問鏈、模範答案架構,以及最常見的失分點——涵蓋金融合規、保險多 Agent、醫療 VPC、零售推薦、政府法規、教育 SaaS 六個垂直場景
Part 35 — AI 工程從零開始|Phase 16 Part 2:湧現與集體智慧 — 群體行為的工程設計
深入解析多 Agent 系統的湧現行為:群智優化、集體推理、辯論機制、Mixture of Agents 架構與集體智慧的工程可控性
Part 35 — FDE 面試準備指南(三十五):RKK 實戰——生產級可觀測性設計:Granular Tracing、Span 樹與 Cloud Trace 整合
以系統設計視角拆解 Agentic AI 系統的可觀測性:為什麼 Log 不夠、Span 樹的結構設計、OpenTelemetry 與 Cloud Trace 的整合模式、Sampling 策略的 Trade-off,以及一條 Trace 應該回答哪五個診斷問題
Part 36 — AI 工程從零開始|Phase 17 Part 1:AI 推論服務架構 — 從單機到全球部署
深入解析 AI 推論服務工程:模型服務器選型(Triton/TorchServe/vLLM)、負載均衡、自動擴縮容、GPU 共享與多租戶隔離架構
Part 36 — FDE 面試準備指南(三十六):RKK 實戰——生產級 AI Evaluation Pipeline:從黃金資料集到 CI/CD 品質閘門
以系統設計視角拆解生產級 AI 評估管線:黃金資料集的建立原則、離線評估架構(RAGAS vs Vertex AI Evaluation Service)、CI/CD 品質閘門設計、Safety 作為獨立評估維度,以及線上評估的抽樣策略與 Trade-off
Part 37 — AI 工程從零開始|Phase 17 Part 2:AI 系統可觀測性 — 當模型行為成為監控對象
深入解析 AI 系統可觀測性工程:LLM 追蹤(Traces/Spans)、提示版本管理、模型效能漂移偵測、成本歸因分析與 AI 告警策略