FDE 面試準備指南（三十四）：RKK 實戰演練——六個端對端 Mock 情境題與模範答案

June 5, 2026 • 25 min read • Yen

AI FDE RKK Mock Interview System Design Google Playbook Interview

這篇的用法：
每個情境，先蓋住「模範答案」，自己練習說 2-3 分鐘，
再對照模範答案看哪裡說得不夠深。
不要只用眼睛「讀」，要用嘴巴「說」——面試是口頭表達，不是閱讀測驗。

如何使用這個情境庫

每個情境的結構：

  客戶場景        → 你收到的原始問題
  隱藏的限制條件  → 面試官設計的陷阱，你要靠「問問題」發現它
  追問鏈          → 面試官會按這個順序追問（難度遞增）
  模範答案架構    → 拿到 3-4 分的回答應該包含什麼
  最常見失分點    → 哪些地方最多人在這個情境答錯

情境一：金融科技客服 Agent（RAG + 合規限制）

客戶場景

客戶：一家有 200 萬用戶的數位銀行
背景：客服團隊有 50 人，每天處理 30,000 個 ticket
      60% 是重複性的 FAQ（帳戶查詢、匯款規則、費率說明）
      客戶希望用 AI 自動處理 FAQ，讓人工客服專注複雜問題

面試官說：「請設計這個 AI 客服系統。」

隱藏的限制條件（要靠問問題才能發現）

如果你問到「有沒有合規要求？」→ 面試官說：
  「是的，這家銀行受金融監管，所有客戶資料不能離開台灣。」

如果你問到「不同客服問題的差異？」→ 面試官說：
  「有一類問題是個人帳戶查詢（需要驗證身分），
   另一類是一般 FAQ（不需要身分驗證），兩類要分開處理。」

追問鏈（難度遞增）

Q1：「你的 RBAC 設計是在哪個環節做過濾？為什麼？」

Q2：「客戶資料不能出台灣，你的 Vertex AI 呼叫怎麼設計？」

Q3：「AI 回答了一個帳戶問題，但答案是錯的。客戶打電話來投訴。
     你的系統有什麼設計可以讓這個問題可以追溯？」

Q4：「這個系統的月成本大概是多少？客戶的 CFO 要看一個數字。」

Q5（顧問題）：「客戶的法遵長說，所有 AI 的回答都必須有人工審核才能發出。
              你怎麼處理這個需求？」

模範答案架構

釐清需求（問兩個問題）：
「在開始設計前，我想確認兩件事：
 第一，這個系統有合規要求嗎？資料能放在 GCP 嗎，還是有地理限制？
 第二，個人帳戶查詢和 FAQ 查詢，處理邏輯有沒有不同？」
→ 拿到：台灣 region 限制 + 兩類問題的分流需求

架構設計：
「我的架構分三層：

 第一層：API Gateway + 身分驗證
  用 Google Cloud Identity 驗證用戶身分，
  區分「已驗證用戶的帳戶查詢」和「匿名 FAQ 查詢」兩條路徑。

 第二層：Router
  帳戶查詢 → CRM Tool（只讀，帶用戶 token）
  FAQ 查詢 → RAG Pipeline（查知識庫）
  兩者的 LLM 回答都會帶 citation（引用了哪個文件或哪個帳戶欄位）

 第三層：Compliance Layer
  所有 Vertex AI 呼叫限定 asia-east1（台灣節點）
  用 VPC Service Controls 確保資料不出 Region
  每個 AI 呼叫記錄到 Cloud Audit Logs」

追問回答：

Q1（RBAC）：
「RBAC 在查詢向量 DB 時就過濾，不是查完再過濾。
 Post-filter 可能讓 Top-K 全被過濾掉，LLM 拿到的 context 品質不穩定。
 Pre-filter 讓向量搜尋只在用戶有權限的文件空間裡進行。」

Q3（可追溯）：
「我的設計是：每個 AI 回答都帶一個 response_id，
 response_id 對應到 Cloud Logging 的一筆記錄，
 記錄了：哪個 query、查了哪些文件、LLM 的完整 prompt 和 response。
 如果客戶投訴，工程師可以用 response_id 還原完整的推理過程。」

Q5（法遵長要人工審核）：
「這個需求讓系統的設計發生根本性的改變——
 它把『即時回答』變成了『非同步審核後回答』。
 我的回應是：先問法遵長，審核的頻率和範圍是什麼？
 是 100% 審核還是抽查 5%？
 如果是抽查，可以設計一個 Shadow Mode——
 AI 即時回答用戶，但所有回答存到 Review Queue，
 法遵團隊異步審核，有問題時 flag 並觸發系統改善。
 如果真的需要 100% 人工審核才發出，
 我會和客戶討論這是否符合用戶體驗的預期——
 因為這意味著回應時間從秒級變成小時級。」

最常見失分點

❌ 沒有問「資料合規要求」→ 設計出來的架構不能上線
❌ RBAC 做 post-filter，被追問後說不清楚為什麼不對
❌ 顧問題只說「這樣做技術上可行」，沒有說「我會和客戶討論 UX 代價」

情境二：保險公司理賠審核 Multi-Agent（ADK + 並行執行）

客戶場景

客戶：台灣前三大保險公司
背景：人工理賠審核需要查三個系統（核保資料庫、醫療記錄、詐欺偵測），
      每個 case 平均需要 3 小時，目標是降到 15 分鐘
      客戶已在 GCP 上有所有三個系統的 API

面試官說：「請設計這個 AI 理賠審核系統，並告訴我你的 ADK 架構。」

隱藏的限制條件

如果你問「高風險或不確定的 case 怎麼處理？」→ 面試官說：
  「理賠金額超過 500 萬的 case，最終決定必須有人工審核。」

如果你問「三個系統的延遲分別是多少？」→ 面試官說：
  「核保 DB 200ms，醫療記錄 800ms，詐欺偵測 1.5 秒。」

追問鏈

Q1：「你為什麼選 ADK 而不是 LangGraph？這個場景有什麼特性支持你的選擇？」

Q2：「三個系統的延遲是 200ms、800ms、1.5 秒。你的並行設計，
     整個 pipeline 的 P95 延遲大概是多少？」

Q3：「ADK 的 Session State，這個 case 的中間結果要存在哪個 scope？為什麼？」

Q4：「詐欺偵測系統突然掛掉了。你的 Agent 怎麼處理？」

Q5（顧問題）：「系統上線一個月後，客戶發現 AI 的誤判率（把詐欺 case 放行）
              是 3%，比人工的 1% 高。你怎麼回應客戶？」

模範答案架構

ADK 架構選擇：
「我選 ADK 因為三個原因：
 第一，客戶在 GCP，ADK 原生整合 Vertex AI，部署到 Agent Engine 省掉 Infra 配置。
 第二，這個工作流的結構清楚——並行查三個系統 + 決策——
 ADK 的 ParallelAgent + LlmAgent 直接對應，不需要從頭設計控制流程。
 第三，Client 沒有 AI 工程師，ADK 的 boilerplate 少，維護成本低。
 如果這個流程需要和非 Gemini 模型混用，我才會考慮 LangGraph。」

ADK 架構設計：
「最外層是一個 SequentialAgent，兩個步驟：

 Step 1：ParallelAgent，三個 LlmAgent 同時執行：
   policy_agent → 查核保 DB → 寫入 session:policy_result
   medical_agent → 查醫療記錄 → 寫入 session:medical_result
   fraud_agent → 跑詐欺偵測 → 寫入 session:fraud_score

 Step 2：decision_agent（LlmAgent），
   讀取三份 session state，用 Gemini Pro 做最終決策。
   如果理賠金額超過 500 萬 → 呼叫 require_human_approval Tool，
   暫停 Agent，等審核人員在 5 分鐘內確認。
   超時未確認 → 降級到人工處理隊列，記錄 case。」

延遲回答（Q2）：
「並行執行的瓶頸是最慢的那個——詐欺偵測 1.5 秒。
 加上 decision_agent 的 LLM 呼叫約 1-2 秒，
 總 pipeline 約 3-3.5 秒，目標的 15 分鐘輕鬆達成。
 如果詐欺偵測 timeout（例如超過 3 秒）有一個 fallback：
 先輸出『詐欺評分待確認』的中間結果，
 異步補跑詐欺偵測後更新審核結論。」

顧問題回應（Q5）：
「3% 誤判率和 1% 的人工差距，我的第一個問題是：
 這 3% 的誤判，是哪種類型的 case 出錯的最多？
 是詐欺評分模型的問題，還是 decision_agent 的 Prompt 問題？
 我不會承諾立刻降到 1%——這需要更多資料分析。

 我的建議是：在接下來 2 週，把所有誤判的 case 拿出來，
 看 fraud_score 的分佈——是 AI 打了低分但還是放行，
 還是詐欺偵測系統本身準確率就只有這樣？
 如果是前者，調整 decision_agent 的判斷閾值可以快速改善。
 如果是後者，是詐欺偵測系統的問題，不是 AI 的問題——
 那這個 3% 不是 AI 造成的，是原系統的既有問題。
 這個區分對客戶的後續決策很重要。」

最常見失分點

❌ 選了 ADK 但說不出為什麼不選 LangGraph
❌ 沒有做並行設計，用 Sequential 跑三個系統（延遲 200+800+1500=2500ms）
❌ Session State scope 沒有想清楚，把敏感醫療資料存到 user: scope
❌ 顧問題只回答「我來優化模型」，沒有先分析誤判的根因

情境三：醫療機構臨床文件助理（VPC 隔離 + Self-Reflection）

客戶場景

客戶：一家擁有 5,000 位醫師的大型醫療集團
背景：醫師每天要看 30-50 份病歷，想要 AI 幫助摘要和提取關鍵資訊
      病歷含有大量 PII（姓名、身份證、診斷）
      客戶的 IT 政策：「所有病歷資料不能上雲。」

面試官說：「請設計這個系統。你的資料安全設計是什麼？」

隱藏的限制條件

如果你進一步問「『不能上雲』指的是什麼？」→ 面試官說：
  「IT 的解釋是：原始病歷資料不能傳送到 Google 的伺服器。
   但他們已經在用 Google Workspace，而且願意評估 GCP。」

追問鏈

Q1：「病歷摘要偶爾會有錯誤——提取了不存在的診斷。
     你怎麼在架構上減少這個問題？」

Q2：「你說資料要留在醫院的 VPC，但 Vertex AI 的 Gemini API 呼叫怎麼設計？」

Q3：「一份病歷 20,000 字，超過了你的 context window。你怎麼處理？」

Q4：「PII 的處理，你在架構的哪個位置做 Tokenization？為什麼？」

Q5（顧問題）：「醫師說 AI 摘要有時候漏掉了很重要的用藥紀錄。
              這對病患安全有影響。你怎麼回應這個風險？」

模範答案架構

釐清「不能上雲」的定義（關鍵第一步）：
「IT 說資料不能上雲，我想先確認這個限制的範圍。
 是原始病歷資料，還是也包括匿名化後的資料？
 是不能傳送到 Google 的任何服務，還是在 GCP 的特定 Region 是可以接受的？」
→ 拿到：原始資料不出去，但 GCP 的 VPC 內部是可以的

架構設計：
「我的設計有兩層隔離：

 第一層：PII Tokenization（在院內完成）
  病歷進入 AI Pipeline 之前，院內的 Cloud DLP 服務
  把所有 PII（姓名→P001、身份證→ID001、診斷→D001）替換成匿名 token。
  原始 PII 和 token 的對應表存在院內的加密 DB，不出院外。

 第二層：VPC Service Controls + Private Service Connect
  Tokenized 病歷傳送到 GCP 的 asia-east1 Region，
  透過 Private Service Connect 呼叫 Vertex AI Gemini API，
  整個路徑不經過公共網路。
  VPC-SC Perimeter 確保資料不能從 VPC 外部存取。

 AI 回答生成後，再把 token 替換回原始 PII，
 結果只顯示在院內的顯示層，不存儲在 GCP 上。」

Self-Reflection（Q1）：
「提取不存在的診斷是典型的幻覺問題。
 我設計 Generator-Evaluator 架構：
 Generator Agent 先生成摘要，
 Evaluator Agent（不同的 System Prompt，扮演嚴格的醫療審查者）
 比對摘要和原始病歷，找出不一致或無法驗證的描述，
 回饋給 Generator 修正。
 最多迭代 2 次，2 次後仍有 flag 的項目標記為『需要醫師確認』。」

顧問題回應（Q5）：
「漏掉用藥紀錄是高風險的問題，我不會輕描淡寫。
 我的第一個回應是：立刻加一個『用藥紀錄』的 mandatory check——
 在每份摘要生成後，強制執行一個驗證步驟：
 對照原始病歷，確認所有藥物名稱都出現在摘要裡。
 這不依賴 LLM 判斷，是規則式的比對，不會有幻覺。

 同時，我會建議客戶在這段時間採用『AI 輔助』而不是『AI 決策』——
 AI 生成摘要，醫師在確認前 review，而不是直接信任。
 這個問題的根本解決需要更多 case 分析和 Eval Pipeline，
 不是今天能立刻修好的。
 但規則式用藥比對可以今天就上線，把最高風險的問題先擋住。」

最常見失分點

❌ 沒有問清楚「不能上雲」的具體含義，直接說「只能用 On-premise 部署」
❌ PII 處理放在 GCP 端（應該在院內完成 Tokenization 再出去）
❌ 顧問題只說「我來修 bug」，沒有提「先用規則式比對擋住最高風險」
❌ 20,000 字病歷沒有提 Map-Reduce 或 Parent-Child chunking

情境四：零售業即時推薦 Agent（Scale + Cost + GKE）

客戶場景

客戶：東南亞最大的電商平台之一
背景：每日活躍用戶 2,000 萬，每秒峰值 50,000 queries
      目前的推薦系統是規則式的，轉換率低
      希望用 LLM 生成個性化推薦理由，提升轉換率
      工程團隊強，有自己的 ML 工程師

面試官說：「設計這個 AI 推薦系統，以及你怎麼讓它在這個規模下運行。」

隱藏的限制條件

如果你問到 Latency 要求 → 面試官說：
  「推薦需要在 200ms 內完成，用戶才不會感覺到延遲。」

如果你問到 Budget → 面試官說：
  「工程主管說 LLM 的成本不能超過現在推薦系統的 3 倍。」

追問鏈

Q1：「200ms 的限制，你怎麼實現？直接呼叫 Gemini API 的 P95 大概是 1-2 秒。」

Q2：「LLM 成本不能超過 3 倍，你怎麼控制？50,000 QPS 的規模，token 成本怎麼算？」

Q3：「你的系統要部署在哪裡？Cloud Run 行嗎？」

Q4：「推薦品質如何評估？Offline 指標和 Online 指標你用哪個？」

Q5（顧問題）：「上線兩週後，轉換率上升了 2%，但 LLM 成本超出預算 40%。
              你怎麼辦？」

模範答案架構

架構設計：
「這個規模的 LLM 推薦系統，不能每個 query 都即時呼叫 LLM——
 200ms 的延遲要求 + 50,000 QPS = 不可能同步呼叫 Gemini API。

 我的設計是預計算（Pre-computation）架構：

 離線階段（每小時執行一次）：
   對 Top-10,000 個熱門商品 × 主要用戶 Persona（100 個）
   預先生成推薦理由文字 → 存入 Redis Cache

 即時階段（用戶 query 時）：
   先從現有推薦系統拿到候選商品列表（快，毫秒級）
   對每個商品查 Redis Cache 取推薦理由（1-5ms）
   組合成個性化推薦頁面 → 200ms 以內完成

 對沒有預計算理由的長尾商品：
   顯示通用推薦理由（規則式），不呼叫 LLM
   這部分商品的曝光量不高，對整體指標影響小」

成本控制（Q2）：
「預計算架構讓呼叫量從 50,000 QPS 降到 10,000 商品 × 100 Persona = 100 萬次/天。
 和 50,000 QPS × 86,400 秒 = 43 億次/天 相比，
 成本降了 4,000 倍以上。」

部署（Q3）：
「Cloud Run 不適合這個規模：
 50,000 QPS 在 Cloud Run 的冷啟動和實例管理上會有問題，
 而且 Redis Cache 的高頻讀寫需要低延遲網路連接。
 我選 GKE——Deployment + HPA（Horizontal Pod Autoscaler），
 根據 QPS 自動擴縮容，Redis 部署在同一個 VPC 的 Cloud Memorystore。」

顧問題（Q5）：
「成本超 40% 是因為預計算的範圍設太廣，
 或者 LLM 呼叫的 token 數比預估高。
 第一步：看成本分佈——哪 20% 的商品造成了 80% 的成本？
 通常是長尾商品被過度預計算了。
 解法：只對 Top-1,000 熱門商品做 Gemini Pro 預計算，
 其他商品改用 Gemini Flash（成本低 5 倍），
 或者用規則式文字模板。
 目標：把成本壓回 2 倍以內，同時保留 Top 商品的 AI 推薦品質。」

最常見失分點

❌ 設計了即時 LLM 呼叫但沒有考慮 200ms 限制
❌ 成本計算沒有量化（「用 Flash 應該比較便宜」不夠）
❌ 選了 Cloud Run 但說不出為什麼不適合高 QPS 長連接
❌ 顧問題只說「優化 Prompt 降低 token」，沒有分析成本來源

情境五：政府機關法規查詢系統（On-premise 限制 + Vertex AI Search vs DIY RAG）

客戶場景

客戶：某部會的數位轉型辦公室
背景：公務員每天需要查詢數千份法規文件，目前用關鍵字搜尋
      希望升級為自然語言問答
      IT 規定：「所有系統必須部署在政府的私有雲（On-premise），不能使用公有雲。」

面試官說：「你怎麼設計這個系統？在這個限制下，你的 Vertex AI 和 GCP 還能用嗎？」

隱藏的限制條件

如果你進一步問 IT 限制的細節 → 面試官說：
  「其實他們有一個政府私有雲，基礎設施是和 Google Cloud 合作建的
   （類似 Google Distributed Cloud），
   可以使用 Vertex AI 的部分功能，但資料不能到公共 GCP。」

追問鏈

Q1：「你會選 Vertex AI Search 還是自建 RAG？為什麼？」

Q2：「法規文件有版本問題——同一個法規可能有 2020 版和 2023 版。
     你的 RAG 系統怎麼設計來處理版本問題？」

Q3：「公務員問了一個問題，但這個問題的答案跨越三個不同的法規文件，
     而且三個文件的說法有輕微矛盾。你的系統怎麼處理？」

Q4：「如何評估這個系統對公務員工作效率的實際影響？」

Q5（顧問題）：「系統上線後，有公務員說某個法規問答的答案和他記憶中的不一樣，
              但其實是他記錯了。他向長官投訴說 AI 不可信。
              你怎麼處理這個溝通問題？」

模範答案架構

「On-premise」的邊界釐清（第一件事）：
「在開始設計前，我需要先確認這個 On-premise 限制的具體邊界。
 是完全不能用 Google 的任何服務，
 還是他們有 Google Distributed Cloud 這類的私有部署方案？
 這個答案完全決定了我能用哪些工具。」

架構選擇（基於 GDC 可用）：
「在 Google Distributed Cloud 環境下，我選自建 RAG 而不是 Vertex AI Search。
 原因是這個場景對 Retrieval 的精準度要求極高——
 法規查詢的錯誤代價很高，需要能深度控制 Retrieval 邏輯。
 Vertex AI Search 的搜尋邏輯是 black box，
 如果準確率不達標，我沒有辦法 debug。」

版本問題（Q2）：
「每份文件的 metadata 包含 version_date 和 status（現行/廢止）。
 向量 DB 的查詢加上 metadata filter：
 where status == 'current' 或 where version_date == '2023'
 同時建立一個版本對照表——當查詢到舊版法規時，
 系統自動提示『此法規已於 2023 年修正，以下為最新版本』。」

矛盾文件（Q3）：
「三個文件說法不同時，不應該讓 LLM 自行決定哪個正確。
 我設計一個矛盾偵測機制：
 Generator 生成回答後，Evaluator Agent 檢查答案和三份文件的一致性，
 如果發現矛盾，強制輸出格式變成：
 『三份相關法規在這個問題上存在不一致之處。
   文件 A 說 X，文件 B 說 Y，文件 C 說 Z。
   建議諮詢法律顧問確認適用的法規版本。』
 不做決策，把判斷責任還給人。」

顧問題（Q5）：
「這個投訴的核心不是技術問題，是信任問題。
 我的處理方式有兩步：

 短期：讓系統自動附上 Citation——
 每個回答後面列出「依據法規：XX 法第 Y 條」，
 讓公務員可以自己點開原始文件確認。
 這樣之後再有人說答案不對，
 他能看到 AI 的答案有法律依據，他可以決定要不要相信。

 長期：請客戶的法規專家評估前 50 個最常見問題的回答品質，
 建立一個官方認可的 QA 資料集。
 這個資料集既是 Fine-tuning 的素材，也是對外溝通的公信力依據：
 『這個系統的回答已經由 X 部法規專家審核 50 個標準問題，
   準確率 Y%。』」

最常見失分點

❌ 聽到「On-premise」就直接放棄 GCP，沒有問是否有 GDC 選項
❌ 版本問題沒有設計 metadata filter
❌ 矛盾文件讓 LLM 自行決定哪個正確（高風險設計）
❌ 顧問題只說「加強技術」，沒有認識到這是信任問題，需要溝通策略

情境六：教育 SaaS 平台 AI 導師（Multi-turn + Memory + 成本）

客戶場景

客戶：一家有 50 萬學生用戶的線上教育平台
背景：學生在學習過程中可以問問題，目前是真人導師回答（反應慢、成本高）
      希望用 AI 導師處理 80% 的問題，讓真人專注複雜問題
      學生可能和 AI 導師有幾十輪對話，討論同一個學習主題
      
面試官說：「設計這個 AI 導師系統，特別說明你的 Memory 設計。」

隱藏的限制條件

如果你問到「學生的資料是否敏感？」→ 面試官說：
  「有大量未成年學生，資料保護要求嚴格，不能存儲任何可識別個人的學習記錄到第三方。」

如果你問到成本 → 面試官說：
  「每個學生每月平均 200 輪對話，月費只有 150 台幣，LLM 成本要控制在月費的 15% 以內。」

追問鏈

Q1：「一個學生和 AI 導師聊了 50 輪，context 怎麼管理？」

Q2：「你設計的 Memory 系統，如何確保不同學生的資料完全隔離？」

Q3：「學生問了一個超出課程範圍的問題（例如問政治或宗教）。
     你的系統怎麼處理？」

Q4：「月費 150 台幣，LLM 成本要在 15% 以內，也就是約 22 台幣。
     你的 Token 預算怎麼設計？」

Q5（顧問題）：「一位家長投訴說 AI 導師給了他孩子一個數學公式的錯誤答案，
              孩子考試因此失誤。你怎麼回應？」

模範答案架構

成本計算先行（這題成本是核心設計 constraint）：
「22 台幣 / 200 輪對話 = 每輪對話 0.11 台幣 ≈ $0.003 USD。
 用 Gemini Flash：Input $0.075/1M，Output $0.30/1M。
 每輪對話假設 1,000 input tokens + 300 output tokens：
 成本 = 0.075/1000 + 0.09/1000 = $0.000165 per 輪
 200 輪 = $0.033 ≈ 約 1 台幣，遠低於 22 台幣的上限。
 這讓我知道：Gemini Flash 足夠，不需要 Pro。」

Memory 設計：
「三層記憶：

 In-Context（最近 5 輪）：
  完整的問答記錄，保持對話連貫性

 Summary Buffer（5-20 輪）：
  超過 5 輪的歷史，用 Gemini Flash 壓縮成學習摘要
  例如：『學生目前學習到微積分的連鎖律，
          對合成函數的概念理解有困難，
          已解釋過 3 次，需要更多練習題』

 Long-term Learning Profile（跨 session）：
  每位學生的學習進度、薄弱點、已完成的章節
  存在 Firestore，按 student_id 隔離
  不存任何可識別個人身分的資訊（名字、學校），只存學習狀態」

資料隔離（Q2）：
「每個 session 的資料 key 是 session_id（UUID），不是 student_id。
 學習 profile 存在 Firestore，key 是 anonymized_id（學生 ID 的 hash，不可逆）。
 即使 Firestore 被存取，拿到的是 hash，無法對應到真實學生。
 Session State 用 session: scope，session 結束後自動清除。」

顧問題（Q5）：
「家長投訴這件事要認真對待。我的回應分三個層次：

 立刻：承認問題，不辯解——
 『您反映的問題非常重要，我們正在調查，
   會在 24 小時內給您一個具體的回應。』

 48 小時內：找出具體的 case——
 用 response_id 找到那次對話的完整記錄，
 確認是 LLM 的幻覺，還是 Prompt 設計問題，還是資料問題。
 給家長一個有事實依據的解釋，不是含糊的道歉。

 根本改善：對數學計算類問題加 code_execution Tool——
 數學答案不依賴 LLM 的語言生成，
 改為 LLM 生成解題思路 + Python 執行數值計算，
 計算結果是確定的，不會有幻覺。
 這個改進可以防止同類問題再發生。」

最常見失分點

❌ 沒有先算成本，設計了 Gemini Pro 的架構但成本超出 10 倍
❌ Memory 設計裡存了 student_id 和姓名，沒有考慮未成年資料保護
❌ 超出範圍問題（政治/宗教）的處理沒有設計，被面試官追問後臨時想
❌ 顧問題只道歉沒有提根本解（code_execution 讓數學計算不依賴 LLM）

練習指南

建議的練習方式：

週 1（建立基礎）：
  情境一（金融合規）+ 情境五（政府 On-premise）
  → 練習「釐清需求」和「合規限制下的架構設計」

週 2（深化技術）：
  情境二（ADK Multi-Agent）+ 情境三（VPC + Self-Reflection）
  → 練習 ADK 架構說明 + 安全設計

週 3（顧問技能）：
  情境四（Scale + Cost）+ 情境六（Memory + 成本計算）
  → 練習成本估算 + 顧問情境回應

每個情境的練習流程：
  1. 自己先說 3 分鐘（不看答案），錄音
  2. 對照模範答案，找出你沒說到的點
  3. 用「追問鏈」和朋友或同事做 Mock 對話
  4. 特別練習「顧問題」——這是最多人失分的地方

判斷自己是否準備好的標準：
  □ 能說出每個情境的 2 個「隱藏限制條件」問題
  □ 每個架構設計都有至少一句「我的假設是 X，如果 X 不成立...」
  □ 每個顧問題都有「技術 + 業務語言 + 下一步行動」三個層次
  □ 說任何 GCP 工具，都能說出「適合這個工具的場景」和「不適合的場景」

六個情境覆蓋了 FDE RKK 最常見的考題類型。
但真正的面試題永遠比這裡的更複雜、更模糊——
練習這些情境，練的不是「背答案」，而是「在模糊中快速找到關鍵 constraint 的能力」。

如何使用這個情境庫

情境一：金融科技客服 Agent（RAG + 合規限制）

客戶場景

隱藏的限制條件（要靠問問題才能發現）

追問鏈（難度遞增）

模範答案架構

最常見失分點

情境二：保險公司理賠審核 Multi-Agent（ADK + 並行執行）

客戶場景

隱藏的限制條件

追問鏈

模範答案架構

最常見失分點

情境三：醫療機構臨床文件助理（VPC 隔離 + Self-Reflection）

客戶場景

隱藏的限制條件

追問鏈

模範答案架構

最常見失分點

情境四：零售業即時推薦 Agent（Scale + Cost + GKE）

客戶場景

隱藏的限制條件

追問鏈

模範答案架構

最常見失分點

情境五：政府機關法規查詢系統（On-premise 限制 + Vertex AI Search vs DIY RAG）

客戶場景

隱藏的限制條件

追問鏈

模範答案架構

最常見失分點

情境六：教育 SaaS 平台 AI 導師（Multi-turn + Memory + 成本）

客戶場景

隱藏的限制條件

追問鏈

模範答案架構

最常見失分點

練習指南

Yen

Related Articles

FDE 面試準備指南（三十三）：RKK 面試解剖——面試官怎麼看你、怎麼評分、什麼叫做強力雇用

FDE 面試準備指南（三十二）：RKK 實戰——Vertex AI 產品棧全解析：Agent Builder、Vertex AI Search、Gemini API 與部署架構

FDE 面試準備指南（三十一）：RKK 實戰——Google ADK 深度設計：Agent 類型、Tool 宣告與 Multi-Agent 協調