AI
147 posts in ai
Part 37 — FDE 面試準備指南(三十七):RKK 實戰——企業 AI 的「連接組織」:Legacy 系統整合、API 橋接與安全邊界設計
以系統設計視角拆解 FDE 最常遇到的現場問題:如何把 ADK Agent 接上 SAP、Oracle DB、Mainframe CSV 等 Legacy 資料孤島;API 橋接層的選型邏輯;安全邊界連接工程(Private Service Connect、VPC-SC、CMEK);以及每種整合模式對系統效能、穩定性、成本和風險的影響
Part 38 — AI 工程從零開始|Phase 17 Part 3:AI 成本優化與規模化 — 把每美元壓榨到極限
深入解析 AI 生產成本工程:Token 成本分解、快取策略(Semantic Cache/Prompt Cache)、模型路由、批次推論、Spot GPU 與 FinOps for AI
Part 38 — FDE 面試準備指南(三十八):RKK 實戰——從 POC 到 Production:AI 系統的五個生產化差距與 Rollback 設計
以系統設計視角拆解 AI 系統從 POC 到生產最容易失敗的五個差距:Token Budget 失控、延遲 SLA 差距、Session State 消失、錯誤處理不完整、Rollback 機制缺席;包含生產化 Go-Live 清單、Prompt 版本控制、模型版本釘選、Canary 部署設計,以及每個差距對系統效能和穩定性的量化影響
Part 39 — AI 工程從零開始|Phase 18 Part 1:AI 技術安全 — 讓模型行為符合人類意圖
深入解析 AI 技術安全工程:對齊問題的技術根源、紅隊測試方法論、越獄攻擊分類、毒化攻擊防禦、模型可解釋性與安全評估框架
Part 39 — FDE 面試準備指南(三十九):RKK 實戰——從 10,000 到百萬用戶:AI 系統的橫向擴展架構設計
以系統設計視角拆解 AI 系統從內部試點到百萬外部用戶的擴展挑戰:三個演進階段的完整架構圖、無狀態服務設計、非同步佇列、語意快取、三層速率限制、Auto-scaling 策略,以及每個關鍵技術選型的 Why X not Y 決策邏輯
Part 40 — AI 工程從零開始|Phase 18 Part 2:AI 治理與倫理 — 工程師的責任邊界
深入解析 AI 治理工程:EU AI Act/NIST AI RMF 合規架構、偏見偵測與緩解技術、資料隱私工程(差分隱私/聯邦學習)與 AI 稽核框架
Part 40 — FDE 面試準備指南(四十):RKK 實戰——AI 系統的 PII 保護:假名化設計、最小存取原則與合規稽核
以系統設計視角拆解 AI 系統的 PII 保護:三個安全強化階段(POC → MVP → Enterprise)、PII 敏感度分類矩陣、假名化架構、RBAC 最小存取、Why X not Y 技術選型決策(假名化 vs 匿名化、CMEK vs 預設加密、NER+Regex vs 純規則),以及 AI 系統 PII 保護的代價與回報量化
Part 41 — AI 工程從零開始|Phase 19 Part 1:Capstone — 企業級 RAG 知識庫系統端對端實作
端對端構建企業級 RAG 系統:從需求分析到生產部署,涵蓋文件解析管線、Hybrid Search、Re-ranking、LLM 評估框架與 30 天迭代路線圖
Part 41 — FDE 面試準備指南(四十一):RKK 實戰——分散式 AI 系統的故障排查:結構化診斷框架與五種常見失效模式
以系統設計視角拆解分散式 AI 系統的故障排查:三個可觀測性成熟度階段、五步驟結構化診斷框架、症狀分類矩陣、完整決策樹圖、五種 AI 系統常見失效模式與特徵信號、SLO 與 Error Budget 設計,以及 Why X not Y 的關鍵可觀測性技術選型
Part 42 — AI 工程從零開始|Phase 19 Part 2:Capstone — 生產級 AI Agent 產品端對端實作
端對端構建生產級 AI Agent 產品:從架構設計到上線,涵蓋 ReAct 迴圈、工具整合、記憶系統、Guardrails、可觀測性與商業指標追蹤
Part 42 — FDE 面試準備指南(四十二):RKK 實戰——顧問技能:從「要 AI」到 POC 範圍定義的 Discovery 框架
以顧問視角拆解 FDE 的核心軟技能:三個顧問參與階段(Discovery → Technical Assessment → POC Proposal)、利害關係人影響力地圖、需求挖掘五個核心問題、POC 場景評分矩陣、Value Story 框架、常見客戶異議處理,以及 Why X not Y 的顧問方法論選型決策
Part 43 — AI 工程從零開始|Phase 19 Part 3:Capstone — 多模態 AI 應用端對端實作與系列總結
端對端構建多模態 AI 應用:圖文理解、語音介面、文件分析三合一系統的架構設計、模態融合策略、延遲優化與系列學習路線總結
Part 44 — FDE 面試準備指南(四十四):RKK 實戰——長文本 LLM 與 RAG 動態混合路由架構設計
深度拆解長文本 LLM(200 萬 Token 上下文)與傳統 RAG 的動態混合架構:為什麼超大 Context Window 仍需 RAG、如何設計智能上下文管理器(Dynamic Hybrid Router)、Vertex AI Context Caching Registry 快取策略、成本矩陣($2.50 vs $0.001)、降級策略、RRF 融合機制,以及 Staff 級 FDE 面試的完整答題框架
Career-Ops 完全使用指南:AI 驅動的智能求職系統
深入講解 Career-Ops,一個由 AI 驅動的求職系統,幫助你在數百個工作機會中找到最適合的職位。涵蓋安裝、配置、使用技巧和策略,助力你高效求職。
Harness 工程入門指南:AI 時代的基礎設施自動化
深入探討 Harness 在 AI 時代的角色,從基本概念、核心功能到實戰應用,幫助工程團隊建立高效的自動化部署流程,加速 AI 應用的上線速度。
Hermes Agent 完全入門指南:自我改進的 AI 智能體
詳細介紹 Hermes Agent,一個具有自我學習和改進能力的 AI 系統。涵蓋核心功能、安裝步驟、配置方式和實際應用,幫助你快速上手這個強大的自主 AI 系統。
LangGraph + AI 後端實戰:構建智能客服工單處理系統
詳細講解如何使用 LangGraph 和 AI 構建生產級的智能客服工單處理系統,涵蓋架構設計、Agent 定義、狀態管理、錯誤處理和實際案例,幫助你快速上線 AI 驅動的客服系統。
LangGraph + LangChain 完全入門指南:從基礎到生產
全面介紹 LangChain 和 LangGraph 的核心概念、架構和實戰應用,涵蓋從簡單的 Chain 到複雜的多 Agent 工作流,幫助開發者快速掌握現代 AI 應用開發框架。
LangGraph AI 後端創意應用:10 個生產級案例和未來方向
探索 LangGraph AI 後端在 10 個不同行業和場景的創意應用,從客服系統到內容創作、從數據分析到程式碼生成,展示 LangGraph 的真正潛力和未來發展方向。
LangGraph AI 後端架構設計模式:從單體到分佈式
深入講解如何設計可擴展、高性能的 LangGraph AI 後端架構,涵蓋從單體應用到微服務的演進,包括 Agent 拓撲、數據流、錯誤恢復、分佈式協調等生產級設計模式。
LangGraph AI 後端核心代碼實現:生產級代碼範本
提供可直接用於生產環境的 LangGraph AI 後端核心代碼實現,包括完整的 FastAPI 集成、持久化層、錯誤處理、監控日誌等,幫助開發者快速構建產品級應用。
LangGraph AI 後端邏輯設計:狀態流、決策路由和條件轉移
深入探討 LangGraph 工作流的邏輯設計,包括狀態定義、決策路由、條件轉移、複雜路徑選擇等,透過實戰案例展示如何設計清晰、高效、易維護的 AI 後端邏輯。
在 Mac 本地運行 Google Gemini 4 模型:完整指南
詳細講解如何在 Mac 上本地運行 Google Gemini 4 模型,涵蓋環境配置、模型下載、優化技巧和實際應用,幫助你在不依賴雲服務的情況下使用強大的 Gemini 模型。
多 Agent Token 優化系列 pt.7:專責化 Agent 協作模式 — 從團隊設計到生產級協調
多 Agent Token 優化系列 pt.7:深入探討專責化 Agent 的協作模式,涵蓋團隊組織架構、動態路由、任務分解策略、狀態管理、錯誤處理等生產級實作,幫助你打造高效協調的 Agent 團隊。
開源 LLM Post-Training 全攻略:從 SFT 到 RLHF,手把手帶你訓練 Qwen
全面介紹開源 LLM 的 Post-Training 方法,包含 SFT、RLHF、DPO、ORPO、持續預訓練等技術,以 Qwen 為範例,深入分析各方法的優缺點、所需資源與適用場景,幫助你選擇最合適的訓練策略。