AI Agent 的第一關,不是模型,而是技術路徑選擇

AI Agent 連接文件、報表、CRM 與日常工作流程的主視覺

最近我一邊整理國外 AI Agent 的案例,一邊也在做兩個自己的 AI 工具專案。

一個比較像企業內部的 AI 助理,處理公司知識、文件問答和員工怎麼把需求講清楚。另一個比較像 AI 報表工具,思考報表能不能不只是給人看數字,而是開始偵測異常、整理證據、留下記錄。

我還在學,也不敢說這是什麼定論。但這幾件事放在一起看,有一個想法慢慢變清楚:

AI Agent 的第一關,可能不是模型,而是技術路徑選擇。

很多人聽到 AI Agent,一些比較基本的反應會是:要用 ChatGPT、Claude、Gemini,如果有些涉獵的人會講還是 Google Vertex AI?要不要用 n8n、Make、Zapier?還是乾脆自己寫一套?

這些說法可能都很接近,但我現在比較重視的是另一個問題:

我到底要讓 AI 進入哪一種工作現場?這條路,我自己駕馭得住嗎?

如果這件事沒有先想清楚,模型再強,也可能只是多一個看起來很厲害、但最後沒有人維護的聊天框。

AI Agent 的第一關不是模型,而是工作現場、資料、權限、驗收與維護能力
圖卡 01:這篇文章想先處理的不是模型排行榜,而是 AI 能不能接進真實工作流。

我們感受到 Agent,但多半是在少數工具裡

很多人第一次感受到 AI Agent 的威力,不是在公司系統裡,多數在 Claude、Cursor、Codex 這類工具裡。

在這些環境裡,AI 不只是回答問題。它可以讀上下文、拆任務、改檔案、檢查結果,甚至一步一步把工作往前推。

這也是為什麼工程師、產品人,會比較早感受到 Agent 的威力。因為他們的工作標的比較清楚:程式碼、文件、任務、資料夾、測試結果。

但大多數企業員工每天打開的不是 Claude Code。

他們打開的是 LINE、Email、Excel、Google Drive、CRM、ERP、客服系統、BI 報表、專案管理工具。

在這些地方,AI 很多時候還停在「幫我摘要」「幫我寫一封信」「幫我整理會議紀錄」「幫我問公司文件在哪裡」。

這些功能有用,但離真正的 Agent 還有一段距離。

所以我不覺得多數人感受不到 AI Agent 是錯覺。比較準確的說法是:AI Agent 的威力,目前還被困在少數高密度工作環境裡,還沒有真正住進多數人的日常工作工具。

同樣叫 AI Agent,背後可能是不同承諾

我覺得現在最容易混亂的地方,是同樣一句「我們要做 AI Agent」,背後可能代表完全不同的承諾。

有些公司其實只是想讓員工寫信、整理資料快一點。 有些公司想把固定通知、表單同步、報表寄送自動化。 有些公司想讓內部文件可以被查詢和問答。 也有些公司期待 AI 真的能跨系統查資料、做判斷、推進任務。

這些都可以用到 AI,但它們不是同一種工程,也不是同一種風險。

如果只是固定寄通知,不需要硬上 Agent。 如果只是查公司文件,可能先整理知識庫和資料來源就夠。 如果要讓 AI 幫你跨系統處理客戶、報表或任務,那才會進入 Agent 的問題。

所以在談技術之前,我會先問幾個比較土、但比較實際的問題:

  • 這件事只是固定重複,還是每次都需要判斷?
  • AI 只需要回答問題,還是要真的操作系統?
  • 做錯時只是重產一份文件,還是會影響客戶、金額或資料?
  • 這個流程有沒有人能驗收?
  • 如果 AI 不確定,應該停下來問人,還是自己繼續做?

這些問題比「用哪個模型」更早。

技術路徑不是 LLM 說了算

現在有一個現象很容易發生。

你問 LLM:「我要做一個企業 AI Agent,該怎麼設計?」

它很容易給你一個看起來很完整的方案:用 Google Vertex AI,接 BigQuery,部署 Cloud Run,做 RAG,接 Slack,加 workflow,做 dashboard,再接 CRM。

這些東西不一定錯。

但對技術小白或小團隊來說,真正要問的是:這條路我維護得了嗎?驗收得了嗎?出錯時我救得回來嗎?

我現在會先把技術路徑粗分成幾種:

AI Agent 技術路徑從個人工具、流程自動化、企業平台到自建系統,各自有不同責任
圖卡 02:技術路徑不是誰比較高級,而是每條路背後要承擔的責任不同。
技術路徑 適合誰 主要風險
ChatGPT / Claude / Gemini 個人工作者、主管、內容工作者 容易停在個人效率,難進公司流程
Cursor / Codex / Claude Code 工程師、產品技術團隊 非工程團隊不容易直接承接
Make / Zapier / n8n 營運、行銷、No-code 團隊 一複雜就難除錯,流程會變黑盒
Google Vertex AI / Agent Builder 有雲端和資料能力的團隊 權限、資料治理、部署與成本門檻較高
Microsoft Copilot / Power Platform Microsoft 365 生態公司 很吃既有 Microsoft 流程與資料整理程度
自建系統 要做產品級能力的團隊 可控性高,但需要工程、測試、監控與維護能力

這張表不是要說哪條最好,而是提醒自己:不同路徑代表不同責任。

技術小白不是不能做 AI Agent。但不能讓 LLM 替自己決定技術路線。至少要知道哪條路只是個人工具,哪條路是流程自動化,哪條路需要工程團隊,哪條路只能做 demo,哪條路一出錯自己救不回來。

Agent 不是一個模型扛全部

還有一件事,我以前也沒有想得很清楚。

真正的 Agent 系統,不一定是叫同一個 LLM 從頭做到尾。

更實際的做法,通常是把不同工作拆開,交給不同模型、工具或流程承擔。

有些任務需要強推理,例如拆需求、判斷風險、設計流程。 有些任務只是整理格式、分類、摘要,未必需要最貴、最強的模型。 有些任務甚至不該交給 LLM,而應該用規則、SQL、API 或固定流程處理。

這也是台灣企業目前更現實的限制。

我們多半不是自己訓練底層模型,而是使用別人已經做好的 LLM 和平台能力。既然如此,重點就不是幻想自己擁有模型,而是學會怎麼分配任務、控制成本、設計流程、安排驗收。

我會把它想成一個分工問題:

AI Agent 系統需要把推理、整理、查資料、操作與驗收拆給不同工具和人處理
圖卡 03:Agent 系統比較像分工,不像把全部事情丟給同一個模型。
任務類型 比較適合的處理方式 重點
高風險決策、複雜拆解 強模型 + 人工覆核 不求全自動,先求判斷可靠
大量分類、摘要、格式整理 便宜模型或固定流程 成本和速度比模型炫技重要
查資料、抓數字、更新狀態 API / SQL / automation 能不用 LLM 就不要硬用 LLM
對外訊息、客戶承諾 LLM 草稿 + 人類審核 責任不能丟給模型
長期改善流程 Agent loop + 記憶 + 回饋 要能記住結果,不只是單次回答

這裡的門檻,不是每家公司都要會訓練模型。

真正的門檻是:你能不能看懂任務的複雜性,知道哪一段該交給模型、哪一段該交給規則、哪一段要留給人。

我最近做的工具,其實都在補中間層

我最近做的兩個工具,讓我更能理解這件事。

第一個是企業內部 AI 助理。它的目標不是一開始就做一個無所不能的 Agent,而是先解決一個很現實的問題:公司知識散在文件、會議、教材、系統裡,員工不知道去哪裡找,也不知道怎麼把需求問清楚。

所以它第一步要做的,不是自動幫人完成所有事,而是先讓員工問得到、看得懂、查得到來源,並且慢慢學會把「我想做一件事」講成 AI 可以接住的任務。

第二個是 AI 報表工具。我不希望它只是 dashboard 加一個聊天框。真正有價值的方向,應該是讓報表系統慢慢具備偵測資料異常、整理證據、產生警示、留下記錄的能力。

這兩件事都還不是成熟的 autonomous agent。

但它們讓我看到一個很重要的中間層:

企業要讓 Agent 進來,不是先買一個會聊天的 AI,而是先把知識、資料、流程、權限、驗收整理成 AI 可以工作的形狀。

這句話對我來說,比「要不要導入 AI Agent」更接近現在台灣企業的真實問題。

國外走得比較快,但這不是終局

我最近整理一場 SaaStr 的 AI Agent 演講,裡面提到國外成熟 SaaS 場景已經在談 AI Agent 怎麼處理 inbound、怎麼篩選 leads、怎麼約會議、怎麼重新開發過去沒人追的 B leads。

B leads 不是爛名單,而是有潛力、但以前人工處理成本太高,所以業務不會穩定追的名單。

這很有啟發,但我不會把它看成終局。

它比較像是一個走得比較快的過程。他們的資料、CRM、銷售流程、產品指標、團隊分工已經比較成熟,所以 Agent 可以比較快被放進真實商業流程裡。

台灣多數企業不是不需要這件事,而是還在更前面的階段。

我們常見的狀態是:資料還散著、流程還靠人記、系統之間沒有接好、驗收標準也不清楚。這種情況下,如果直接跳到「AI Agent 幫你約會議、追商機、產生收入」,中間會斷很多層。

所以我現在比較會把 SaaStr 的案例當成參照,而不是當成明天就能照抄的答案。

它提醒我一件事:

Agent 最適合先放在人類組織的注意力缺口。

也就是那些有價值,但人類覺得麻煩、不急、不值得、容易忘記的地方。

放到台灣企業現場,不一定是 B leads。可能是客戶問題散在 LINE 和 Email 裡,SOP 寫了但沒人找得到,報表有異常但沒人每天看,CRM 有資料但沒人追停滯商機,或每週報表有產出但沒有變成下一步決策。

這些地方,才是台灣企業更實際的 Agent 起點。

台灣企業導入 AI Agent 的實際起點可能是 LINE、Email、SOP、報表與 CRM 裡的注意力缺口
圖卡 04:台灣企業不一定從 B leads 開始,而是先找那些有價值、但沒人穩定追的注意力缺口。

Agent 不只是改善流程,也可能重新融合場景

所以我現在會用另一個問題看 Agent:

我想改善的事情,原本是不是已經有具體脈絡?Agent 是在修補原流程,還是在重新融合一個新場景?

如果一個流程本來就很清楚,只是固定、重複、低風險,那也許 automation 就夠了,不一定要上 Agent。

但如果一件事牽涉到多個資料來源、多個工具、多種判斷、不同角色的責任,而且原本流程很破碎,Agent 的價值就不只是「加速」。

它可能是在重新融合一個新的工作場景。

傳統 contact form 只是收資料,Agent 可以把訪客問題、資格判斷、CRM 狀態、會議預約重新接成一條即時流程。

傳統 dashboard 只是給人看數字,Agent 可以把異常偵測、證據整理、警示、下一步檢查重新接成一條營運流程。

傳統內部知識庫只是放文件,Agent 可以把搜尋、問答、來源引用、任務整理重新接成員工入口。

所以 Agent 的問題不是「這件事能不能自動化」而已。

更深的問題是:原本分散在不同工具、不同人、不同時間點的工作,能不能被重新融合成一個新的場景?

如果答案是 yes,才比較接近 Agent 真正有價值的地方。

最後還是回到一個很基本的問題

企業導入 AI Agent,最後一定會回到幾個很基本的問題:

它可以看哪些資料? 它可以改哪些資料? 它做完怎樣算成功? 誰負責檢查? 錯了怎麼追? 成本怎麼算? 哪些事情必須回到人?

這些問題聽起來沒有「AI Agent」四個字那麼炫,但它們才是企業真的會卡住的地方。

因為 Agent 一旦能執行任務,它就不是單純聊天工具。

它會變成一個帶權限的工作者。

如果資料、權限、流程、驗收沒有設計好,AI 不只是幫你自動化,也可能幫你把混亂放大。

所以我現在不太會把 AI Agent 的第一步看成「選最強模型」。

我會先問:

我們目前的工作流程,有沒有清楚到可以讓 AI 接手一部分?

我們的資料,有沒有整理到 AI 可以使用?

我們的團隊,有沒有能力判斷 AI 做得對不對?

我們選的技術路徑,自己維護得起嗎?

如果答案都還不清楚,那也許現在不該急著做完整 Agent。

比較務實的做法,是先把工作分層:哪些只是固定自動化?哪些需要 AI 幫忙判斷或整理?哪些需要多步驟流程?哪些需要跨工具執行?哪些牽涉權限、風險與責任,暫時不能自動化?

分清楚之後,再選技術路徑。

這樣 AI 才不是一個新的黑盒子,而是一步一步進入公司工作流的能力。

我會把這週的觀察收斂成一句話:

AI Agent 真正成熟的第一步,不是選到最強模型,而是選對一條自己能維護、能驗收、也能承擔責任的技術路徑。

參考來源

  • SaaStr AI Annual 2026 Final Day 影片與整理筆記
  • Simon Willison 關於 AI Agent 商業化、安全邊界與治理的文章
  • 個人工作觀察:企業內部 AI Assistant、AI 報表工具與 Agent-ready 工作流整理