部落格

  • 2026-06-23 數位新聞雷達:代理商務與零售數據的閉環轉型

    2026-06-23 數位新聞雷達:代理商務與零售數據的閉環轉型

    2026-06-23 數位新聞雷達
    2026-06-23 數位新聞雷達:代理商務與零售數據的閉環轉型

    2026 年 6 月的數位訊號集中在三條線:Getty Images 與 OpenAI 授權合作,讓 AI 搜尋更重視合法影像來源;Google ADK 與 BigQuery Python UDF 推進多代理協作與資料管道;Shopify、Amazon、Walmart 則把零售競爭推向代理式商務與第一方數據閉環。

    本期雷達將解答以下關鍵問題:
    • 生成式 AI 與版權合規:Getty Images 與 OpenAI 合作如何重塑未來的圖片檢索與行銷配圖工作流?
    • 跨語言 Multi-Agent 協作:Google 推出 Agent Development Kit (ADK) 對於一人事業的自動化架構有何影響?
    • 代理式商務 Agentic Commerce:Shopify 通用商業協定與 Scripts 廢除,對零售品牌有何立即性的調整要求?
    2026-06-23 當日精選 rss-reader MCP / Google Cloud / SaaStr / Shopify / Amazon / Walmart / Getty Images 國際觀點
    AI

    一、AI 領域

    本期 AI 領域的訊號顯示 AI 應用正全面與商業實體對接。從 Getty Images 與 OpenAI 展開版權授權,到 Google 揭露 NotebookLM 大學實戰案例,甚至 Rippling 押注資料圖譜作為 AI 時代的護城河,都說明 AI 的商業重心已經從模型演算法本身,轉移到第一方數據產權與結構化應用。

    01
    The Times · 2026-06-21 08:34
    👉 與你相關

    這攸關未來我們的內容行銷與自動化配圖工作流。當客戶需要進行大量社群發布時,版權合規是首要考量。

    📌 核心重點

    Getty Images 聯手 OpenAI 展開版權授權合作,將 licensed 影像引進 ChatGPT 搜尋結果,是 AI 搜尋合規化的關鍵突破。

    🚀 行動指南

    在我們設計自動化行銷或配圖流程時,開始評估並導入合規授權的 AI 圖片資源,避免未授權版權風險。

    02
    Google The Keyword · 2026-06-22 16:00
    👉 與你相關

    這直接驗證了我們目前為一人事業打造的 RAG 個人知識庫方向,也能作為未來向客戶提案知識庫產品時的實證。

    📌 核心重點

    Google 揭露 NotebookLM 在佛羅里達州立大學(FSU)的實戰案例,證明結構化且低幻覺的 RAG 檢索工具極具商業應用成效。

    🚀 行動指南

    持續優化我們本地的 `knowledge-base` 技能,將其設計成與 FSU 案例相似的個人與企業學習管理工具。

    03
    SaaStr · 2026-06-22 09:51
    👉 與你相關

    我們在規劃內部 CRM 系統與商機看板時,數據之間的關係連結(即資料圖譜)才是讓 AI 代理人做對決策的關鍵。

    📌 核心重點

    SaaStr 剖析 Rippling 戰略,指出 AI 時代軟體的護城河不再是演算法,而是跨系統關聯的資料圖譜。

    🚀 行動指南

    在規劃 CRM 數據關聯時,優先以資料圖譜邏輯來建構資料庫標籤與欄位關係,為後續 AI 導入打好底子。

    Tech

    二、資訊科技與技術

    在資訊科技技術層,Google 發布的跨語言 Multi-Agent 開發套件(ADK)正簡化多代理人協作流程,而 BigQuery Python UDFs 的正式 GA 更拉近了資料庫與複雜運算層的距離。這提醒我們技術開發應往服務架構整合與資料管道效能優化收斂。

    01
    Google Developers Blog · 2026-06-22 18:10
    👉 與你相關

    這對於我們一人事業多 Agent 協作(如新聞收集、發布、任務同步)提供了現成且具備高擴充性的跨語言架構。

    📌 核心重點

    Google 釋出支援 Python 與 Node.js 跨語言多代理協作的開發套件(ADK),大幅降低複雜 Multi-Agent 架構的開發難度。

    🚀 行動指南

    查閱 Google 開源專案與樣板代碼,評估是否能將我們現有的 node/python wrappers 轉為標準代理協定。

    02
    Google Cloud Blog · 2026-06-22 17:00
    👉 與你相關

    這對我們的代營運客戶數據派報大量使用 BigQuery 有優化空間,能將複雜運算移入 BQ 內部執行。

    📌 核心重點

    Google Cloud 宣布 BigQuery 託管 Python UDF 正式進入 GA,開發者可直接在 BQ SQL 中執行 Python 程式碼進行複雜計算。

    🚀 行動指南

    評估是否重構派報中複雜的達成率或次月預演(Projection)邏輯,將計算負載移入 BQ 內部以提升效率。

    03
    The Cloudflare Blog · 2026-06-22 18:00
    👉 與你相關

    雖然屬於 Rust 底層通訊庫除錯,但理解底層連線漏洞有助於在我們執行大量 API 抓取時,規劃超時與重試機制。

    📌 核心重點

    Cloudflare 揭露他們如何在 Rust hyper HTTP 函式庫中找到連線漏洞,展示了高併發通訊下的穩定性挑戰。

    🚀 行動指南

    確認我們 Node wrapper 或 Python report 腳本使用的底層 HTTP 庫已更新,並落實 API 的超時機制。

    Retail / Commerce

    三、零售與電商

    零售與電商領域迎來了重大的促銷與架構交會。Amazon 提前開跑的 Prime Day 2026 成為 AI 導購的終極考驗,Shopify 則透過通用商業協定將商品目錄送入 AI 搜尋;與此同時,Walmart 整合全球廣告網路,全面強化第一方數據的閉環成效測量地位。

    01
    Shopify News · 2026-06-22 10:00
    👉 與你相關

    這對於我們的品牌電商代營運客戶非常關鍵。我們必須主動幫客戶規劃如何讓商品被 AI 順利推薦。

    📌 核心重點

    Shopify 發布通用商業協定,使商品目錄能直接結構化提供給 AI 代理。同時提醒 Shopify Scripts 將於 6 月 30 日廢除。

    🚀 行動指南

    提醒客戶關於 Scripts 廢除時程,並開始針對現有商品 JSON-LD 進行結構化豐富化,為 AI 檢索做準備。

    02
    Amazon News · 2026-06-22 12:00
    👉 與你相關

    這能為客戶的年度行銷促銷提供大促節奏參考,且能實際驗證 AI 導購工具與大語言模型對購物車轉換率的影響。

    📌 核心重點

    亞馬遜將年度大促提前至 6 月 23-26 日,全面導入 Alexa AI 與購物決策 AI。數據指出 Amazon 總營收已超車 Walmart。

    🚀 行動指南

    追蹤 Prime Day 期間消費者的 AI 購物體驗回饋與轉換率數據,評估客戶是否在 7 月跟進促銷節奏。

    03
    Walmart Corporate · 2026-06-22 14:00
    👉 與你相關

    第一方數據(CDP)與零售媒體網路是 MarTech 核心,這能作為向大品牌客戶提案數據閉環成效測量時的經典案例。

    📌 核心重點

    沃爾瑪整合其全球第一方數據廣告系統,提供閉環成效測量,利用零售大數據的優勢挑戰亞馬遜在 RMN 廣告的霸主地位。

    🚀 行動指南

    在與客戶討論 CDP 會員數據應用時,引用此案例說明曝光至購買的第一方數據閉環測量對 ROAS 的商用價值。

    Matrix

    產業趨勢與 MarTech 決策矩陣

    趨勢方向 代表事件 對 MarTech / 電商的意義 下一步觀察重點
    AI 代理與商品對接 Shopify 發布 Universal Commerce Protocol 商品 feeds 需朝向 AI 檢索友好的語意與結構化方向優化,傳統 SEO 將逐步轉為 GEO (生成式引擎優化)。 AI 語意檢索商品 feeds 的具體 JSON 規格與各大 AI 模型的串接狀態。
    第一方廣告閉環 Walmart 整合全球第一方數據廣告系統 Cookie 消失後,第一方數據閉環成效測量是零售巨頭最厚的護城河與變現工具。 Walmart 採用的 Clean Room 數據安全共享技術以及其對 ROAS 的測量標準。
    FAQ

    常見問答 (FAQ)

    Q1: Shopify Scripts 廢除對品牌有什麼立即影響?

    Shopify Scripts 將於 6 月 30 日完全停用。如果品牌網店有客製化折扣、運費計算或結帳邏輯,必須在下週前將代碼完全移轉至 Shopify Functions,否則這些邏輯將直接失效。

    Q2: 什麼是 Agentic Commerce (代理式商務)?

    這是指消費者不再手動瀏覽網站,而是授權 AI 代理人去各平台檢索、比較商品並直接完成購物。Shopify 的 Universal Commerce Protocol 就是為了讓 AI 代理人能無縫讀取商品目錄而設計的基礎建設。

    Evidence

    參考來源

  • 2026-06-21|數位新聞雷達:AI 應用全面進入 Agent 實體工作現場

    2026-06-21|數位新聞雷達:AI 應用全面進入 Agent 實體工作現場

    2026-06-21 數位新聞雷達
    2026-06-21 數位新聞雷達:AI 應用全面進入 Agent 實體工作現場

    這週 AI 圈釋出了一個強烈訊號:AI Agent 已經跨過「純聊天」的階段,開始直接插手第一方數據和廣告投放系統。當傳統 BI Dashboard 逐漸被自然語言對話取代,MarTech 顧問與開發者的工作重心就必須轉向「語意數據層 (Semantic Layer)」與「安全沙盒 (Sandbox)」。此外,Cloudflare 的臨時帳戶與 Atlassian 的計費架構,正是這波 AI 原生基礎設施落地的重要拼圖。

    本期雷達將解答以下關鍵問題:
    • AI Agent 實體工作落地:AI Agent 這週最重要的落地訊號是什麼?
    • MarTech 基礎設施:企業導入 AI Agent 需要先注意哪些安全與計費基礎設施?
    • 電商與零售營運:電商與行銷人該如何利用語意字典與 ID 匹配應對 Cookieless 變局?
    2026-06-21
    AI

    一、AI 領域

    AI 正在從「純問答聊天」走向「Agent 執行權授權」時代。這代表我們的防線不只是防止輸出幻覺,而是要阻擋惡意的「提示詞注入攻擊」操縱 Agent 去操作本機或資料庫。同時,蘋果 WWDC 發布的端側 Core AI 框架與 Bedrock 上 Claude 新條款,正在把 AI 分流為端側高隱私、雲端高溢價的混合架構。

    01
    Turing Post · 2026-06-20 18:00
    👉 與你相關

    對於 MarTech 系統開發與一人事業而言,這影響了我們如何安全地授權 AI 代理人執行交易、寫入資料庫及呼叫 API。

    📌 核心重點

    AI Agent 時代的資安核心已從防範「模型幻覺與有害輸出」轉移到「執行權限的授權」與如何阻擋「提示詞注入攻擊 (Prompt Injection)」。

    🚀 行動指南

    未來在建構 AI 協同工作流時,必須導入「安全沙盒 (Sandbox) 隔離執行」與「雙重確認機制(如 Lobster Approval 流程)」,不能讓 Agent 直接擁有高危寫入權限。

    02
    InfoQ · 2026-06-20 11:00
    👉 與你相關

    這將直接影響我們建構日常助理與敏感數據處理工具時的運算選型,尤其是注重數據隱私的個人知識庫。

    📌 核心重點

    蘋果 WWDC 推出 Core AI,代表「端側生成式 AI」正式實用化。高頻、高隱私的任務可留在 Mac 本地運行輕量模型。

    🚀 行動指南

    採取「混合式 AI」架構,以本地端側模型處理日常代碼、敏感筆記與日常排程;僅將需要全局運算的主題交付雲端大模型,藉此最大化降低 Token 成本。

    03
    InfoQ · 2026-06-20 09:03
    👉 與你相關

    當我們串接外部大模型處理企業或個人敏感的 CRM、行銷數據時,必須重新審視服務商的隱私條款。

    📌 核心重點

    AWS Bedrock 的新條約要求共享推理數據,凸顯了 AI 巨頭在高質量訓練數據資源緊繃下的數據爭奪。

    🚀 行動指南

    處理核心商業機密或行銷個資時,應優先選用具備明確「零數據保留 (ZDR)」保證的 API,或是改採本地部署的開源私有化模型。

    Tech

    二、資訊科技與技術

    技術層面的變革正在解決 Agent 大規模落地的基礎設施痛點。Cloudflare 的臨時帳戶為 Agent 的執行安全提供隔離環境;Atlassian 的 Forge Billing 則展示了如何在大規模分布式架構中精確追蹤計費;GitHub 的 Data Agent 案例則提供了將 Metadata 和語意層結合的實用方法,將「Chat to Database」落地為生產力工具。

    01
    InfoQ · 2026-06-20 14:21
    👉 與你相關

    如果你打算開發計費型的 SaaS 產品、點數/優惠券發放系統等 MarTech 應用,這攸關系統寫入的可靠度。

    📌 核心重點

    Atlassian 揭露其大規模計費架構,透過事件流與「僅一次處理 (Exactly-Once Processing)」保證,解決了分散式高流量下的重複扣款與漏計帳痛點。

    🚀 行動指南

    設計與金流、點數相關的行銷工具時,應優先採用事件驅動架構 (Event-driven) 搭配冪等性 (Idempotency) 設計,確保網路瞬斷時系統仍具備高容錯力。

    02
    The Cloudflare Blog · 2026-06-19 13:00
    👉 與你相關

    這解決了我們在讓 AI Agent 執行自訂程式碼或串接第三方服務時,如何避免主體帳戶憑證被安全隔離的問題。

    📌 核心重點

    Cloudflare 推出動態生成且執行完即銷毀的「臨時帳戶」,代表雲端基礎設施正在朝向「Agent 原生」與「拋棄式隔離環境」演進。

    🚀 行動指南

    當 AI Agent 需要動態編譯程式碼或運行 ad-hoc 腳本時,應將執行環境託管於邊緣 Worker 的拋棄式 Sandbox,杜絕敏感 Token 外洩的可能。

    03
    The GitHub Blog · 2026-06-19 16:00
    👉 與你相關

    這正是我們在實現「對話式數據分析 (Chat to DB)」或搭建行銷數據看板時,必經的工程挑戰。

    📌 核心重點

    GitHub 成功落地內部數據分析 Agent,減少非技術團隊查詢 SQL 的負擔。其核心在於建立優質的「語意字典 (Semantic Layer)」與 Metadata 對譯。

    🚀 行動指南

    不要盲信 LLM 寫 SQL 的能力;落地 Chat to DB 的關鍵在於前期為資料庫建構完善的語意定義(如明確定義何謂「有效訂單」),在 LLM 與資料庫間做好名詞對譯。

    Retail / Commerce

    三、零售與電商

    行銷與零售電商的最前線,正在被原生的「語意查詢與自動投放 Agent」改寫。Snowflake 行銷長開始用自然語言代替傳統 Dashboard;Google 原生引入 Ask Ad Manager 協助廣告分析與投放。這意味著在 Cookieless 與第一方數據為王的時代,CDP 與第一方 Identity Resolution (ID 識別) 的隱私匹配,將成為電商最核心的數據壁壘。

    01
    SaaStr · 2026-06-19 22:29
    👉 與你相關

    影響了我們未來向客戶或自己交付數據分析結果的呈現方式——不要只做 Dashboard,要做「能對話的洞察」。

    📌 核心重點

    Snowflake 行銷長每日以自然語言直接對數據提問代替看 Dashboard。高階決策者需要的是「直接的判斷與結論」,而非複雜圖表。

    🚀 行動指南

    行銷團隊的核心競爭力將從「報表製作」轉移到「商業問題的提問能力」與「Prompt 結構設計」。在做自動化晨檢和日報時,應聚焦在生成直接的行動建議。

    02
    The Keyword (blog.google) · 2026-06-18 13:00
    👉 與你相關

    這改變了廣告投放、GA4 數據調度與成效優化的日常工作流。

    📌 核心重點

    Google 推出 Ask Ad Manager,宣告 SaaS 工具終局正在走向對話式介面 (Agentic UI),繁複的後台操作將被 Agent 替代。

    🚀 行動指南

    行銷與營運人員應將重心從「學習後台按鈕操作」轉向「理解流量運作底層邏輯」與「API 調度思維」,避免因操作門檻消失而被淘汰。

    03
    Databricks · 2026-06-18 15:00
    👉 與你相關

    在 Cookieless 時代,這是我們幫電商與零售客戶整合 LINE, GA4, CRM 會員數據庫進行精準行銷的關鍵合規架構。

    📌 核心重點

    Stagwell 結合 Databricks 建立隱私安全 ID 匹配,展示了如何在不洩漏明文敏感個資(PII)的前提下,跨渠道實現隱私潔淨室 (Data Clean Room) 匹配。

    🚀 行動指南

    在規劃跨管道會員數據對齊(Identity Resolution)時,應在傳輸前對 PII 個資進行去識別化雜湊 (Hashing) 並採用潔淨室技術,確保行銷廣告追蹤符合隱私法規。

    Matrix

    產業趨勢與 MarTech 決策矩陣

    趨勢方向 代表事件 對 MarTech / 電商的意義 下一步觀察重點
    AI Agent 執行授權 Turing Post 探討 Agent 時代責任安全 安全邊界從「防止幻覺」轉向「防止命令注入攻擊」,執行隔離成剛需。 關注沙盒(Sandbox)安全標準及 Lobster Approval 機制。
    端側與混合算力 Apple 推出端側 Core AI 框架 高頻、隱私性強的任務(如代碼與敏感數據)留在本地以大節省 Token 成本。 Apple 官方 SDK 及端側 LLM 開源社群對 Core AI 的適配。
    邊緣隔離基礎設施 Cloudflare 推出 Agent 臨時帳戶 雲端服務轉向「Agent 原生」,拋棄式隔離環境解決憑證暴露風險。 Cloudflare 臨時帳戶 API 調用文件與自動化 SDK。
    自然語言數據分析 GitHub 落地 Analytics Agent / Snowflake CMO talk to data 傳統 BI 看板被自然語言提問取代,成功關鍵在於「語意字典」的成熟度。 GitHub 語意對應與 SQL 注入防護架構,CDP/CRM 語意層配置。
    第一方隱私安全匹配 Stagwell 在 Databricks 建立隱私安全 ID 匹配 Cookieless 時代的行銷痛點,Clean Room 隱私潔淨室成為跨管道追蹤必備。 Databricks Clean Room 技術架構,LINE/GA4/CRM 去識別化匹配。
    FAQ

    常見問答 (FAQ)

    Q1: 什麼是 Agentic UI?

    Agentic UI 是指以 AI 代理人為核心的對話式或動態生成介面。未來使用者不需要在複雜的 SaaS 後台(如 Google Ads、GA4)點擊按鈕,而是透過對話,由 Agent 自動接管後台操作並呈現結果,使傳統操作門檻消失。

    Q2: 為什麼語意字典 (Semantic Layer) 會比 Dashboard 更重要?

    因為大模型雖然會寫 SQL,但無法理解不同企業資料庫中的自訂欄位邏輯。語意字典在資料庫與 LLM 之間建立了一座「名詞對譯橋樑」(例如定義何謂「活躍會員」),使 AI 不會誤讀資料,這是「Chat to DB」成功的基礎。

    Q3: 為什麼 AI Agent 需要 sandbox / temporary account?

    當 AI Agent 獲得操作電腦或調用 API 的授權時,若沒有環境隔離,惡意程式或提示詞注入攻擊可能會竊取憑證或污染資料。臨時帳戶(如 Cloudflare 臨時帳戶)提供了一個執行完畢即銷毀的沙盒環境,確保系統主體安全。

    Evidence

    參考來源

  • AI Agent 的第一關,不是模型,而是技術路徑選擇

    AI Agent 的第一關,不是模型,而是技術路徑選擇

    最近我一邊整理國外 AI Agent 的案例,一邊也在做兩個自己的 AI 工具專案。

    一個比較像企業內部的 AI 助理,處理公司知識、文件問答和員工怎麼把需求講清楚。另一個比較像 AI 報表工具,思考報表能不能不只是給人看數字,而是開始偵測異常、整理證據、留下記錄。

    我還在學,也不敢說這是什麼定論。但這幾件事放在一起看,有一個想法慢慢變清楚:

    AI Agent 的第一關,可能不是模型,而是技術路徑選擇。

    很多人聽到 AI Agent,一些比較基本的反應會是:要用 ChatGPT、Claude、Gemini,如果有些涉獵的人會講還是 Google Vertex AI?要不要用 n8n、Make、Zapier?還是乾脆自己寫一套?

    這些說法可能都很接近,但我現在比較重視的是另一個問題:

    我到底要讓 AI 進入哪一種工作現場?這條路,我自己駕馭得住嗎?

    如果這件事沒有先想清楚,模型再強,也可能只是多一個看起來很厲害、但最後沒有人維護的聊天框。

    AI Agent 的第一關不是模型,而是工作現場、資料、權限、驗收與維護能力
    圖卡 01:這篇文章想先處理的不是模型排行榜,而是 AI 能不能接進真實工作流。

    我們感受到 Agent,但多半是在少數工具裡

    很多人第一次感受到 AI Agent 的威力,不是在公司系統裡,多數在 Claude、Cursor、Codex 這類工具裡。

    在這些環境裡,AI 不只是回答問題。它可以讀上下文、拆任務、改檔案、檢查結果,甚至一步一步把工作往前推。

    這也是為什麼工程師、產品人,會比較早感受到 Agent 的威力。因為他們的工作標的比較清楚:程式碼、文件、任務、資料夾、測試結果。

    但大多數企業員工每天打開的不是 Claude Code。

    他們打開的是 LINE、Email、Excel、Google Drive、CRM、ERP、客服系統、BI 報表、專案管理工具。

    在這些地方,AI 很多時候還停在「幫我摘要」「幫我寫一封信」「幫我整理會議紀錄」「幫我問公司文件在哪裡」。

    這些功能有用,但離真正的 Agent 還有一段距離。

    所以我不覺得多數人感受不到 AI Agent 是錯覺。比較準確的說法是:AI Agent 的威力,目前還被困在少數高密度工作環境裡,還沒有真正住進多數人的日常工作工具。

    同樣叫 AI Agent,背後可能是不同的概念

    我覺得現在最容易混亂的地方,是同樣一句「我們要做 AI Agent」,背後可能代表完全不同的概念。

    有些公司其實只是想讓員工寫信、整理資料快一點。 有些公司想把固定通知、表單同步、報表寄送自動化。 有些公司想讓內部文件可以被查詢和問答。 也有些公司期待 AI 真的能跨系統查資料、做判斷、推進任務。

    這些都可以用到 AI,但它們不是同一種工程,也不是同一種風險。

    如果只是固定寄通知,不需要硬上 Agent。 如果只是查公司文件,可能先整理知識庫和資料來源就夠。 如果要讓 AI 幫你跨系統處理客戶、報表或任務,那才會進入 Agent 的問題。

    所以在談技術之前,我會先問幾個比較土、但比較實際的問題:

    • 這件事只是固定重複,還是每次都需要判斷?
    • AI 只需要回答問題,還是要真的操作系統?
    • 做錯時只是重產一份文件,還是會影響客戶、金額或資料?
    • 這個流程有沒有人能驗收?
    • 如果 AI 不確定,應該停下來問人,還是自己繼續做?

    這些問題比「用哪個模型」更早。

    技術路徑不是 LLM 說了算

    現在有一個現象很容易發生。

    你問 LLM:「我要做一個企業 AI Agent,該怎麼設計?」

    它很容易給你一個看起來很完整的方案:用 Google Vertex AI,接 BigQuery,部署 Cloud Run,要做 RAG還是用context硬做上下文,接 Slack,加 workflow,做 dashboard,再接 CRM。

    這些東西不一定錯。

    但對技術小白或小團隊來說,真正要問的是:這條路我維護得了嗎?驗收得了嗎?出錯時我救得回來嗎?

    我現在會先把技術路徑粗分成幾種:

    AI Agent 技術路徑從個人工具、流程自動化、企業平台到自建系統,各自有不同責任
    圖卡 02:技術路徑不是誰比較高級,而是每條路背後要承擔的責任不同。
    技術路徑 適合誰 主要風險
    ChatGPT / Claude / Gemini 個人工作者、主管、內容工作者 容易停在個人效率,難進公司流程
    Cursor / Codex / Claude Code 工程師、產品技術團隊 非工程團隊不容易直接承接
    Make / Zapier / n8n 營運、行銷、No-code 團隊 一複雜就難除錯,流程會變黑盒
    Google Vertex AI / Agent Builder 有雲端和資料能力的團隊 權限、資料治理、部署與成本門檻較高
    Microsoft Copilot / Power Platform Microsoft 365 生態公司 很吃既有 Microsoft 流程與資料整理程度
    自建系統 要做產品級能力的團隊 可控性高,但需要工程、測試、監控與維護能力

    這張表不是要說哪條最好,而是提醒自己:不同路徑代表不同責任。

    技術小白不是不能做 AI Agent。但不能讓 LLM 替自己決定技術路線。至少要知道哪條路只是個人工具,哪條路是流程自動化,哪條路需要工程團隊,哪條路只能做 demo,哪條路一出錯自己救不回來。

    Agent 不是一個模型扛全部

    還有一件事,我以前也沒有想得很清楚。

    真正的 Agent 系統,不是叫同一個 LLM 從頭做到尾。

    更實際的做法,通常是把不同工作拆開,交給不同模型、工具或流程承擔。

    有些任務需要強推理,例如拆需求、判斷風險、設計流程。 有些任務只是整理格式、分類、摘要,未必需要最貴、最強的模型。 有些任務甚至不該交給 LLM,而應該用規則、SQL、API 或固定流程處理。

    這也是台灣企業目前更現實的限制。

    我們多半不是自己訓練底層模型,而是使用別人已經做好的 LLM 和平台能力。既然如此,重點就不是幻想自己擁有模型,而是學會怎麼分配任務、控制成本、設計流程、安排驗收。

    我會把它想成一個分工問題:

    AI Agent 系統需要把推理、整理、查資料、操作與驗收拆給不同工具和人處理
    圖卡 03:Agent 系統比較像分工,不像把全部事情丟給同一個模型。
    任務類型 比較適合的處理方式 重點
    高風險決策、複雜拆解 強模型 + 人工覆核 不求全自動,先求判斷可靠
    大量分類、摘要、格式整理 便宜模型或固定流程 成本和速度比模型炫技重要
    查資料、抓數字、更新狀態 API / SQL / automation 能不用 LLM 就不要硬用 LLM
    對外訊息、客戶承諾 LLM 草稿 + 人類審核 責任不能丟給模型
    長期改善流程 Agent loop + 記憶 + 回饋 要能記住結果,不只是單次回答

    這裡的門檻,不是每家公司都要會訓練模型。

    真正的門檻是:你能不能看懂任務的複雜性,知道哪一段該交給模型、哪一段該交給規則、哪一段要留給人。

    我最近做的工具,其實都在補中間層

    我最近做的兩個工具,讓我更能理解這件事。

    第一個是企業內部 AI 助理。它的目標不是一開始就做一個無所不能的 Agent,而是先解決一個很現實的問題:公司知識散在文件、會議、教材、系統裡,員工不知道去哪裡找,也不知道怎麼把需求問清楚。

    所以它第一步要做的,不是自動幫人完成所有事,而是先讓員工問得到、看得懂、查得到來源,並且慢慢學會把「我想做一件事」講成 AI 可以接住的任務。

    第二個是 AI 報表工具。我不希望它只是 dashboard 加一個聊天框。真正有價值的方向,應該是讓報表系統慢慢具備偵測資料異常、整理證據、產生警示、留下記錄的能力。

    這兩件事都還不是成熟的 autonomous agent。

    但它們讓我看到一個很重要的中間層:

    企業要讓 Agent 進來,不是先買一個會聊天的 AI,而是先把知識、資料、流程、權限、驗收整理成 AI 可以工作的形狀。

    這句話對我來說,比「要不要導入 AI Agent」更接近現在台灣企業的真實問題。

    國外走得比較快,但這不是終局

    我最近整理一場 SaaStr 的 AI Agent 演講,裡面提到國外成熟 SaaS 場景已經在談 AI Agent 怎麼處理 inbound、怎麼篩選 leads、怎麼約會議、怎麼重新開發過去沒人追的 B leads。

    B leads 不是爛名單,而是有潛力、但以前人工處理成本太高,所以業務不會穩定追的名單。

    這很有啟發,但我不會把它看成終局。

    它比較像是一個走得比較快的過程。他們的資料、CRM、銷售流程、產品指標、團隊分工已經比較成熟,所以 Agent 可以比較快被放進真實商業流程裡。

    台灣多數企業不是不需要這件事,而是還在更前面的階段。

    我們常見的狀態是:資料還散著、流程還靠人記、系統之間沒有接好、驗收標準也不清楚。這種情況下,如果直接跳到「AI Agent 幫你約會議、追商機、產生收入」,中間會斷很多層。

    所以我現在比較會把 SaaStr 的案例當成參照,而不是當成明天就能照抄的答案。

    它提醒我一件事:

    Agent 最適合先放在人類組織的注意力缺口。

    也就是那些有價值,但人類覺得麻煩、不急、不值得、容易忘記的地方。

    放到台灣企業現場,不一定是 B leads。可能是客戶問題散在 LINE 和 Email 裡,SOP 寫了但沒人找得到,報表有異常但沒人每天看,CRM 有資料但沒人追停滯商機,或每週報表有產出但沒有變成下一步決策。

    這些地方,才是台灣企業更實際的 Agent 起點。

    台灣企業導入 AI Agent 的實際起點可能是 LINE、Email、SOP、報表與 CRM 裡的注意力缺口
    圖卡 04:台灣企業不一定從 B leads 開始,而是先找那些有價值、但沒人穩定追的注意力缺口。

    Agent 不只是改善流程,也可能重新融合場景

    所以我現在會用另一個問題看 Agent:

    我想改善的事情,原本是不是已經有具體脈絡?Agent 是在修補原流程,還是在重新融合一個新場景?

    如果一個流程本來就很清楚,只是固定、重複、低風險,那也許 automation 就夠了,不一定要上 Agent。

    但如果一件事牽涉到多個資料來源、多個工具、多種判斷、不同角色的責任,而且原本流程很破碎,Agent 的價值就不只是「加速」。

    它可能是在重新融合一個新的工作場景。

    傳統 contact form 只是收資料,Agent 可以把訪客問題、資格判斷、CRM 狀態、會議預約重新接成一條即時流程。

    傳統 dashboard 只是給人看數字,Agent 可以把異常偵測、證據整理、警示、下一步檢查重新接成一條營運流程。

    傳統內部知識庫只是放文件,Agent 可以把搜尋、問答、來源引用、任務整理重新接成員工入口。

    所以 Agent 的問題不是「這件事能不能自動化」而已。

    更深的問題是:原本分散在不同工具、不同人、不同時間點的工作,能不能被重新融合成一個新的場景?

    如果答案是 yes,才比較接近 Agent 真正有價值的地方。

    最後還是回到一個很基本的問題

    企業導入 AI Agent,最後一定會回到幾個很基本的問題:

    它可以看哪些資料? 它可以改哪些資料? 它做完怎樣算成功? 誰負責檢查? 錯了怎麼追? 成本怎麼算? 哪些事情必須回到人?

    這些問題聽起來沒有「AI Agent」四個字那麼炫,但它們才是企業真的會卡住的地方。

    因為 Agent 一旦能執行任務,它就不是單純聊天工具。

    它會變成一個帶權限的工作者。

    如果資料、權限、流程、驗收沒有設計好,AI 不只是幫你自動化,也可能幫你把混亂放大。

    所以我現在不太會把 AI Agent 的第一步看成「選最強模型」。

    我會先問:

    我們目前的工作流程,有沒有清楚到可以讓 AI 接手一部分?

    我們的資料,有沒有整理到 AI 可以使用?

    我們的團隊,有沒有能力判斷 AI 做得對不對?

    我們選的技術路徑,自己維護得起嗎?

    如果答案都還不清楚,那也許現在不該急著做完整 Agent。

    比較務實的做法,是先把工作分層:哪些只是固定自動化?哪些需要 AI 幫忙判斷或整理?哪些需要多步驟流程?哪些需要跨工具執行?哪些牽涉權限、風險與責任,暫時不能自動化?

    分清楚之後,再選技術路徑。

    這樣 AI 才不是一個新的黑盒子,而是一步一步進入公司工作流的能力。

    我會把這週的觀察收斂成一句話:

    AI Agent 真正成熟的第一步,不是選到最強模型,而是選對一條自己能維護、能驗收、也能承擔責任的技術路徑。

    參考來源

    • SaaStr AI Annual 2026 Final Day 影片與整理筆記
    • Simon Willison 關於 AI Agent 商業化、安全邊界與治理的文章
    • 個人工作觀察:企業內部 AI Assistant、AI 報表工具與 Agent-ready 工作流整理
  • 今年我與語言模型合作的心得筆記 04|記憶宮殿,是留給下一次 Codex 的便條紙

    今年我與語言模型合作的心得筆記 04|記憶宮殿,是留給下一次 Codex 的便條紙

    有一次我想把過去的重要對話補進記憶宮殿,處理到後來,電腦真的爆掉過一次。

    後來我才比較確定:AI 需要記憶,但記憶不是越多越好。

    前面三篇寫到,Codex 開始住進我的電腦、跟 Obsidian 一起工作,也開始幫我處理一些本機端很麻煩的事。但這整套流程跑一陣子之後,我又遇到另一個問題:AI 很能做事,但它不一定記得我們之前怎麼做事。

    單次對話裡不太看得出來。你跟它聊一個下午,它可以接得很好,知道你前面說過什麼、目前卡在哪。可是隔天換一個 session,或換到另一個工具,很多上下文就斷了。

    我常常得重新交代:這個專案走到哪、哪條路我不想再討論、哪些決定已經做過、哪些事情只是暫時放著。講一次還好,講十次就很煩。更麻煩的是,重講的過程中人的說法也會變,AI 聽到的版本就可能跟上一次不一樣。

    這也是我後來開始幫 Codex 裝 MemPalace 的原因。口語可以叫它「記憶宮殿」,它是 GitHub 上的一個開源專案。

    這個工具不是給我自己查資料用的,而是給 Codex 的一層回憶層,讓它下次開新 session 時不必完全從零開始。下一次我再開一個新的 Codex,或換到不同工作場景,它至少能知道:我們以前討論過什麼、哪些事有了結論、哪些專案不要混在一起。

    這個差別不大張旗鼓,但用起來很明顯。

    例如,我不需要每次都重新說明「我用 Obsidian 當知識庫,很多東西最後要落成 Markdown」;也不需要每次都重講「我比較在意能不能留下可回收的成果,不只是當下回答得漂亮」。它若能記得這些偏好,下一次就比較快進入狀況。

    又例如,不同專案要分開:生活筆記、工作專案、工具安裝、內容寫作,不該全混成一團。記憶宮殿真正有用的地方,不是把所有東西都吞進去,而是幫 Codex 先知道「這件事屬於哪個脈絡」。

    後來我也確認過,這不只是 Codex 自己在用。Claude Code 的 MCP servers 裡,MemPalace 可以顯示 Connected。也就是說,Codex 和 Claude Code 可以接到同一座記憶宮殿,只是用不同區域、不同脈絡,整理各自需要的記憶。

    人挑選少量記憶便條交給下一次 AI session 使用

    我會在意這件事,是因為我不是只跟單一 AI 工具工作,而是常讓 Codex、Claude 在同一個專案、不同任務裡分工。如果它們完全沒有共同背景,每次交接都得我重新口述一次。MemPalace 幫忙補上的,就是這層可對齊的背景:哪些專案正在跑、哪些原則已經確定、哪些坑之前踩過,不必每次重來。

    安裝記憶宮殿時,它會問你要不要回溯過去的資訊。我後來決定全部從當下開始。

    聽起來有點可惜。以前聊過那麼多東西,好像都該補進記憶。但真要這樣做,風險很大。舊對話裡有很多當時的猜測、半成品、過期決定,如果全部倒進去,記憶宮殿很快就會變成另一種垃圾場。

    而且這不只是原則問題,是我真的踩過一次雷。一開始我也想過,既然要做記憶,乾脆把過去重要的對話都補進去?但現場很快就發現,這件事很花時間,也很吃記憶體。舊對話不是乾淨資料,它很長、很碎、混著不同專案和不同時期的判斷,要把它們整理成可用記憶,本身就像在搬一整個倉庫。

    所以我接受了一個比較務實的做法:不執著把過去補齊。從現在開始記,重要的才記、有結論的才記、需要下一次接上的才記;舊東西真的需要,就回頭找原始文件、筆記或 session,不要為了「記憶完整」把整台電腦拖下水。

    這跟 Obsidian 的邏輯其實很像:不是所有東西都值得留下,留下來的也要知道它是什麼層級。

    但界線要畫清楚。

    記憶宮殿是給 agent 用的回憶層,不是事實來源。

    它可以提醒 Codex「之前好像做過這個判斷」,但不能直接變成「事實就是這樣」。真正的事實,還是要回到文件、筆記、檔案、終端機輸出、實際跑出來的結果。

    我後來一直提醒自己這件事。記憶本來就會老化,也會被污染。不同專案若混在一起,AI 可能把 A 專案的規則帶到 B 專案;某次討論裡的暫時判斷,也可能被下一次誤當成正式結論。

    所以我現在比較把它看成一個「提醒 Codex 該去哪裡找」的工具,而不是「直接給我答案」的工具。它最好的用法,是幫下一次的 Codex 縮短進入狀況的時間,而不是取代我去檢查現場。

    如果說 Obsidian 是我跟 LLM 共同產出的成果,那記憶宮殿就是貼給下一次 agent 的便條:提醒它之前的脈絡、哪個抽屜可能有資料、哪件事不要再走一次冤枉路。

    便條紙很有用,但便條紙不是合約,不是正式紀錄。

    Chat 可以讓想法發生,Obsidian 可以讓知識留下,Codex 可以進電腦現場處理問題,記憶宮殿則是留給下一次 agent 的便條紙。

    什麼該留下,什麼能相信,什麼只是暫時記一下,什麼必須回到原始文件再確認。AI 讓產出變便宜了,但更關鍵的,永遠是人的判斷與決策。

    上一篇:PDF 中文消失那次,Codex 開始看現場 | 回到第一篇:語言模型,正式入住我的電腦裡

  • 今年我與語言模型合作的心得筆記 03|PDF 中文消失那次,Codex 開始看現場

    今年我與語言模型合作的心得筆記 03|PDF 中文消失那次,Codex 開始看現場

    Obsidian 匯出 PDF 時,中文突然不見了。

    表面看起來只是個小問題:不就是中文沒辦法在 PDF 裡顯示嗎?可是電腦現場常常就是這樣,看到的是一個小症狀,背後可能牽到一整串設定、路徑和工具判斷。

    前兩篇寫到,Codex 開始住進我的電腦,也跟 Obsidian 變成一個共讀區。但當內容真的開始落到本機,我遇到的就不只是「要不要留下」而已。工具會壞、設定會錯、路徑會找不到,電腦現場不像聊天框那麼乾淨。

    這些事以前特別消耗人。不是因為每一件都難,而是它們卡在很碎的地方:工具有沒有裝好?終端機到底該打什麼指令?設定檔放在哪?快取能不能寫入?這個錯誤訊息可信,還是我的理解只看到片面?

    以前碰到這種事,我常常先放著。你知道自己大概修得好,但要花一段時間進入狀況:先 Google、看別人的心得教學、查設定、猜是哪個環節壞了。真正累的不是修,而是要把整個現場重新理解一遍。

    Codex 進來之後,我開始比較敢處理這些事。

    像我後來想用本機錄音和影片轉文件來取代線上工具,我希望它能「幫我把一段內容轉成文字、摘要,再存進筆記庫」。但要做到這件事,它得先確認電腦裡有沒有可用的影音工具,缺什麼就補什麼:Homebrew 裝得進去嗎?`whisper-cli` 找得到嗎?模型檔放在哪?轉錄跑完之後,輸出是完整的,還是只是終端機畫面被截斷?

    深夜雙螢幕檢查 PDF 中文缺字、終端機與樣式設定的除錯現場

    這些細節很無聊,但每個環節都是重要的。只要工具沒裝好,後面所有「AI 幫我整理影片」都是空話。能不能落地,看的是它能不能一路從安裝、檢查、測試,走到把一段錄音變成可讀的逐字稿,再整理成我之後用得上的筆記或會議紀錄。

    那時候我才開始感覺,這不是多了一個聊天視窗,而是電腦裡多了一個會幫我搞定複雜事情的助手。重點是透過一次次互動的脈絡,這個助手了解我的風格、習慣、用字遣詞等等。

    但最有感的,還是那次 Obsidian PDF 中文消失。

    真正麻煩的不是「中文不見」這四個字,而是我們以前得先搞清楚為什麼 Obsidian 輸出 PDF 會吃不到中文字體、是哪個設定沒對,還要去找有沒有人碰過一樣的狀況、他們怎麼解。

    這次我直接問 Codex:可以幫我解決嗎?

    它一路查下去,才發現事情沒那麼直線。我的 Obsidian 不是只有一層設定,而是有不同 vault、不同 `.obsidian` 資料夾,還牽涉到 appearance 設定、CSS snippet,以及匯出 PDF 時到底吃到哪一套樣式。

    中間還踩到一個很典型的坑:某個系統工具把 JSON 當成 plist 去讀,報了一個看起來很像真的錯誤。這種時候最危險,如果太相信第一個錯誤訊息,很容易被帶去修一個根本不是問題的地方。後來改用更直接的方式去讀設定內容,才確認檔案本身沒壞,問題要回到 Obsidian 實際讀取的設定與樣式路徑去看。

    最後 PDF 能正常顯示中文,靠的不是一道神奇指令,而是一層一層排除:哪個 vault?哪份設定?哪段 CSS?哪個字型真的被用到?

    修完那次之後,我對 Codex 的感覺又變了一次。

    它不是只會「告訴我應該怎麼修」。它能在我的電腦裡看現場、檢查檔案、讀設定、嘗試不同判斷,再把每一步留下來。這比較像在電腦裡裝了一個助手。它不一定每次都知道答案,但它願意把那些我原本懶得碰、或要花時間才學得會的事,一層一層攤開。

    但這套用法不是沒有代價。

    電腦除錯最可怕的,不是問題難,而是你以為自己知道問題在哪。而 AI 特別容易順著你一開始的假設往下查:你說「是不是字型問題」,它就先陪你查字型;你說「是不是設定壞了」,它就往設定壞掉的方向走。

    所以這種合作不能只是把方向丟給它。我要做的反而是一直把它拉回證據:現在實際看到什麼?哪個檔案真的被讀到?這個錯誤訊息可信嗎?有沒有另一個方式可以驗證?

    本機影音轉錄也是同樣的道理。工具裝起來,不代表流程可信。ASR 會聽錯人名、公司名、專有名詞;快取路徑寫不進去,可能看起來像工具壞了;終端機輸出被截斷,也會讓人誤以為轉錄不完整。這些都不能只憑「AI 說可以」就算數,最後還是要回到檔案、設定、輸出結果,加上人工檢查。

    那次 Obsidian PDF 中文消失,最後修好的不只是一個字體問題。它更像一次提醒:當 AI 開始能碰到你的電腦,它確實能把很多麻煩事變簡單;但你也更需要知道,什麼時候該相信它,什麼時候該要求它停下來,重查一遍。

    上一篇:Chat 會流走,Obsidian 會留下來 | 下一篇:記憶宮殿,是留給下一次 Codex 的便條

  • 今年我與語言模型合作的心得筆記 02|Chat 會流走,Obsidian 會留下來

    今年我與語言模型合作的心得筆記 02|Chat 會流走,Obsidian 會留下來

    上一篇寫到,語言模型開始住進我的電腦裡。它能讀檔、跑終端機、看設定,也開始幫我處理一些原本會一直拖著的雜事。

    但它真的進來之後,我很快遇到另一個問題:跟 AI 聊得越多,東西反而越容易散掉。

    這件事一開始不明顯。每次對話當下都很有收穫,一篇生澀的文章可以整理成筆記,幾支影片也能沉澱成一份可以回頭看的材料,一個卡住的想法被講清楚了。可是過幾天要回頭找,常常這些內容都散在各自的 session 裡,不是一個實體文件,也不是一份可以重複使用的檔案。

    Chat 很適合發生想法,但不一定適合保存想法。這個概念我去年就深刻感知到,所以去年開始,我大部分跟語言模型協作的情境,其實都發生在 IDE 裡,例如 Antigravity 或 VS Code。

    這也是我後來正式從 Notion 轉到 Obsidian 的原因。不是因為 Obsidian 比較潮,也不是因為它功能比較多,而是它更容易變成一個我和語言模型共同讀取的地方。

    Markdown 檔案就放在本機,我看得懂,Codex 也看得懂。它可以讀我的筆記,幫我補連結,整理索引,把一篇長文變成康乃爾筆記,也可以把幾支相關影片整理成一篇主題筆記。它不是把內容丟到另一個黑盒子裡,而是直接在我的知識庫旁邊工作。

    這種感覺跟 Notion 不太一樣。

    Notion 很適合人整理頁面,但對我現在的使用方式來說,Obsidian 更像一個共同書桌。我可以在上面讀,LLM 可以在旁邊幫我翻資料、拉線索、補脈絡。聊完不是只留在聊天紀錄裡,而是可以落成一份之後找得到、接得上的筆記。

    問題也從這裡開始。

    AI 讓摘要變得太便宜了。

    AI 對話逐漸流走,人的判斷把重要內容留下成為筆記

    以前要整理一篇文章,至少要花一段完整的時間。你要讀完、抓重點、想架構,最後才會決定要不要寫成筆記。那個成本本身會幫你過濾掉很多東西。因為太麻煩,所以不重要的內容自然就被淘汰了。

    但現在不一樣。你把文章丟進去,AI 可以整理;你把影片丟進去,AI 可以整理;你丟一段普通觀點,它也可以幫你整理成一篇看起來很像筆記的東西。這件事一開始很爽,因為好像什麼都能留下來。

    可是過了一陣子,我發現這其實很危險。

    因為當「整理」變得太便宜,知識庫很容易變成另一種垃圾場。每一篇都看起來有架構,每一篇都有重點,每一篇都好像有保存價值。可是等你真的要找東西時,才會發現裡面堆滿了很多「整理過,但沒有被消化過」的內容。

    那種筆記很騙人,也很誘人。它不像沒整理的資料那麼亂,反而因為被 AI 排得很漂亮,所以看起來更像知識。但其實我沒有真正想過,也沒有真的決定它對我有什麼用。

    所以我現在反而更常先問另一個問題:這東西之後會在哪裡被我用到?

    它是在補一個我正在想的問題,還是只是又多一份看起來很完整、但不會再被打開的筆記?

    有些內容值得整理成完整筆記,因為它會反覆被我拿來用,或會接到我原本就在思考的問題。有些只適合留一句原則,例如「這件事提醒我,速度感有時比真實速度更重要」。有些其實看過就可以了,不需要為了保存而保存。

    這也改變了我跟 Codex 合作的方式。

    我不再只是叫它「幫我整理這篇」。我更常問的是:這篇值得進我的知識庫嗎?如果值得,它應該是完整筆記、索引條目、原則卡,還是只要放進候選清單?如果不值得,那就不要硬留。

    如果只是有點用、但還不到值得正式收藏,我就先把它放在比較邊界的位置,不讓它進核心筆記。

    留下不是目的。難的是判斷:哪些東西值得被留下來,哪些東西應該讓它流走。AI 讓生成變便宜了,反而讓判斷變得更重要。

    後來有一次,這個「留下來」的流程真的卡住了。Obsidian 匯出 PDF 時,中文整片消失。

    上一篇:語言模型,正式入住我的電腦裡 | 下一篇:PDF 中文消失那次,Codex 開始看現場

  • 今年我與語言模型合作的心得筆記 01|語言模型,正式入住我的電腦裡

    今年我與語言模型合作的心得筆記 01|語言模型,正式入住我的電腦裡

    今年我最有感的改變,不是某個模型又變聰明了,而是語言模型開始真正住進我的工作電腦裡。

    以前的 LLM 對我來說,大多活在幾個固定地方:終端機、Cursor、VS Code,或瀏覽器裡的 ChatGPT。就算它們各自推出桌面應用,我一年真正打開的次數也少得可憐。那時候的使用方式,還是很像把工作「拿出去」給它處理。

    我要寫 code,就在 IDE 裡叫它幫忙;要整理會議紀錄,就把影片丟進 Gemini 的聊天框;想問一個念頭,就開瀏覽器丟給 ChatGPT。它們確實有用,但總隔著一層。我的工作現場在電腦裡,它們比較像外部資源。

    但今年不太一樣。

    Codex 落地之後,我第一次明顯感覺到,ChatGPT 不只是聊天框裡的東西,而是開始活在我的電腦裡。它可以讀檔案、跑終端機、看設定、檢查錯誤,也可以幫我處理一些以前懶得整理、或根本不知道怎麼下手的雜事。

    例如 NAS 的資料管理。以前我知道該整理,但只要想到資料夾、命名、分類、重複檔案,就會先放著。後來透過一個資料管理的 skill,Codex 開始幫我把這些事整理成一套比較能維持的架構。

    當然,它不是一次就到位。它給的分類邏輯我退過幾次,有些它覺得合理的歸法,跟我實際找檔案的習慣對不上,得來回幾輪才磨出能用的版本。

    又例如書籤。瀏覽器書籤其實很像人生的雜物間:當下覺得很重要,過幾個月回頭看,常常只剩一堆不知道為什麼收藏的連結。

    白天多螢幕工作桌上,語言模型協助整理檔案、終端機與工作流程

    這次我讓 ChatGPT 幫我重新梳理脈絡:哪些是工具、哪些是文章、哪些只是當時一時興起,慢慢把它從「收藏清單」變回「可以再使用的入口」。它偶爾會分錯,把一篇深度文章丟進工具堆,或反過來。但比起我自己永遠不會動手,有個會犯錯的助手,反而讓事情真的開始流動。

    到這裡,差異就出來了。

    它不像傳統應用程式那樣,要我停下手邊的事,切過去打開一個介面,再把資料搬來搬去。更多時候,它像電腦裡多了一個房客。它不太吵,除了吃一點電,就是在旁邊幫我打工:掃地、整理櫃子、檢查水管,把我一直懶得處理的東西一件一件攤開。

    以前我用 AI,是把問題搬去問它。現在更常是讓它進來,看現場到底發生什麼事。

    檔案在哪裡?設定有沒有吃到?錯誤訊息是不是誤導?該用哪個工具驗證?哪一份文件才是最後版本?這些過去很零碎、很耗心力的小判斷,開始可以被它串成一段可以追蹤的過程。

    我也因此開始評估「高資費的訂閱」。

    以前我會覺得,訂更高階的模型,好像只是買更好的回答。現在比較像是在買一個能進工作現場的能力:它不只回答得漂亮,還要能讀到正確的檔案、留下可檢查的修改、把結果放回我之後找得到的地方。

    這不是「AI 取代誰」的故事,也不是 Claude、ChatGPT、Codex 誰比較厲害的排名。對我來說,比較像工具箱裡多了一個真的能進現場的夥伴。

    它還是會犯錯,需要我定義邊界、踩煞車、檢查它留下的東西。但這幾個月,我確實感覺到一個轉折:語言模型,不再是我打開瀏覽器才會遇到的東西,它變成了我電腦日常的一部分。

    只是,當它越幫越多,我也很快我可能需要改變我的工作方法。

    下一篇:Chat 會流走,Obsidian 會留下來

  • AI 讓人變快,為什麼沒有讓公司變好?

    AI 讓人變快,為什麼沒有讓公司變好?

    從 Gallup 2026 報告看 AI 導入真正卡住的地方:不是工具能力,而是管理者能不能把任務、流程、標準、回饋與意義重新接起來。

    AI 個人生產力與組織工作方式的落差

    最近讀 Gallup 2026 年《全球職場狀況報告》,裡面有一組數字,我覺得很值得停下來看。

    這個資訊最早不是我從報告裡看到的,而是我在「得到」App 的《得到頭條》裡聽到。那一集提到這份報告時,我覺得它剛好接上我最近一直在想的問題:AI 進入工作之後,人跟 agent 到底應該怎麼合作?

    所以我回頭把原始報告找出來看。對我來說,找到原始報告這件事情很重要。因為如果只看一段二手整理,很容易只記得某些訊息;但回到報告本身,才比較能看清楚:這些數字背後,到底在指向什麼組織問題。

    在已經導入 AI 的美國組織裡,65% 的員工認為 AI 對自己的生產力有正面影響。

    這不難理解。現在很多人用 AI 寫信、整理資料、改簡報、查資料、產生初稿甚至是直接運用了。對個人來說,確實會有「我變快了或變強了」的錯覺。

    但同一份報告裡,只有 12% 的員工認為:AI 真的改變了組織裡「工作被完成的方式」。

    這個落差很有意思。

    它代表 AI 可能已經逐步融入,很多人的工作流,但還沒有真正進入組織工作流。

    個人會用,不等於團隊會用。團隊有人試,不等於公司做事的方法改變了。

    我覺得這也是現在很多 AI 導入卡住的地方。

    問題不一定是工具不夠強,也不一定是模型不夠新。真正卡住的,可能是組織裡沒有人把 AI 變成一套可重複、可協作、可被管理的新工作方式。

    而 Gallup 這份報告,把答案指向一個很傳統、甚至有點不時髦的角色:管理者。

    管理者正在先被耗盡

    Gallup 2026 報告指出,2025 年全球員工敬業度降到 20%,是 2020 年以來低點。

    換句話說,全世界大概只有五分之一的員工,真正對工作投入。其他人不是完全不做事,而是比較像在撐、在等、在完成最低限度。

    這已經是警訊。

    但更值得注意的是,這一輪下滑主要不是從一般員工開始,而是從管理者開始。

    報告顯示,全球管理者敬業度從 2022 年的 31%,降到 2025 年的 22%。光是 2024 到 2025 這一年,就從 27% 掉到 22%。

    這件事放在 AI 導入的脈絡裡,會變得很關鍵。

    因為 AI 不會自動變成組織能力。AI 只是工具。真正要讓工具變成工作方式,中間需要有人處理很多不顯眼、但非常重要的事:

    • 哪些任務適合交給 AI?
    • 輸入資料要到什麼程度才夠?
    • 輸出結果用什麼標準判斷?
    • 哪些地方一定要人工驗證?
    • 個人用得好的方法,怎麼變成團隊流程?
    • 當大家對 AI 感到不安時,誰負責把方向講清楚?

    這些事情,說穿了都是管理工作。

    所以當企業一邊期待主管推動 AI,一邊讓主管承受更大的管理跨度、更少的資源、更多的救火,最後很可能得到一個矛盾結果:

    公司買了 AI,但真正能把 AI 接回工作現場的人,正在先被耗盡。

    AI 導入不是採購問題,是工作方式重設

    AI 導入不是採購問題,是工作方式重設

    很多公司導入 AI 的方式,大概是這樣:買工具(甚至期待員工自己買自己用,最好公司都不要花錢)、開帳號、辦教育訓練、發使用公告,然後期待效率自然提升。

    這些事不是沒用,但它們只能處理「工具可用」的問題,不能處理「工作方式改變」的問題。

    真正的工作現場,通常更複雜。

    員工每天面對的是既有任務、既有 KPI、既有會議、既有報告格式、既有審核流程。除非有人把 AI 融入這些日常流程,否則 AI 很容易變成「員工個別認知能力」的東西。

    工具在那裡,但流程沒變。

    更麻煩的是,如果原本流程就不清楚,AI 只會把模糊放大。

    需求說不清楚,AI 會更快產出方向不對的東西。

    品質標準不清楚,AI 會更快製造大量看起來完整、但不知道能不能用的內容。

    責任邊界不清楚,AI 會讓每個人都以為「應該有人處理了」。

    所以我越來越不相信「AI 會讓公司運作變好」這種說法。

    比較現實的情況是:AI 會讓差的管理更明顯,也讓好的管理更有槓桿。

    管理者是 AI 落地的關鍵介面

    Gallup 報告裡還有一個數字很直接。

    在投資 AI 的美國組織中,如果員工看到自己的主管是支持團隊使用 AI,他們可能會認為「AI 改變了組織工作方式」的可能性,是其他人的 8.7 倍。

    我覺得這個數字很重要,因為它提醒我們:AI 採用不是單純的個人學習問題。

    一個人會不會用 AI,當然跟他的好奇心、技能、工作類型有關。但一個團隊能不能真的用起來,往往取決於主管有沒有把它融入工作設計裡。

    主管不一定要是最會寫 prompt 的人。

    但他需要能夠回答幾個問題:

    • 這個團隊,最需要利用 AI 改善的是哪一段流程?
    • 哪些內容產出可以先用 AI 做初稿,哪些不能?
    • AI 做完之後,人要檢查什麼?
    • 團隊要怎麼分享有效用法,而不是各自摸索?
    • 出錯時,責任怎麼界定?
    • 效率提升後,人要把時間拿去做什麼更有價值的事?

    這些問題沒有被回答,AI 就很容易停留在個人工具。

    一個人變快了,但組織沒有變聰明。

    管理者不能是行政成本,而是建立意義的基礎

    過去幾年,很多討論都在質疑管理者的必要性。尤其 AI 出現之後,這個問題更常被拿出來問:

    如果 AI 可以整理資訊、追蹤任務、產出報告,那管理者是不是會變得不重要?

    我的想法剛好相反。

    如果一個管理者只是在催進度、開會、轉述上層指令,那他的確很容易被工具取代,甚至本來就不該存在那麼多。

    但如果管理者做的是另一件事:讓每個人知道自己的工作為什麼重要、標準是什麼、努力有沒有被看見、下一步要怎麼變強,那這個角色,在 AI 時代反而更重要。

    因為 AI 會讓工作變快,也會讓工作變得更碎。

    資訊更多、選項更多、工具更多、輸出更多。當所有東西都變快,人更容易失去方向感。

    這時候,組織需要的不只是自動化,而是意義的重新組裝。

    我會把好的管理者稱為一種「意義基礎設施」。

    他不一定每天生產最多內容,也不一定是操作工具最快的人。但他能讓團隊知道:

    • 我們現在要解決的是什麼問題?
    • 哪些事情值得做,哪些只是忙?
    • AI 產出的東西,要用什麼標準判斷好壞?
    • 人應該保留哪部分判斷?
    • 每個人在新的工作方式裡,如何繼續成長?

    這些問題,才是 AI 時代真正困難的地方。

    Agent 不會消除管理成本,但會暴露管理品質的課題

    管理者是人與 Agent 的協作設計師

    我最近一直在思考人與 agent 的合作模式。

    越思考,越覺得 agent 不是單純拿來「取代人」的東西。至少在現階段,更現實的問題是:我們能不能把 agent 放進一個清楚的協作系統裡。

    一個 agent 可以幫你整理資料、產生初稿、檢查錯誤、拆解任務、追蹤狀態。

    但它仍然需要上下文、標準、邊界、資料來源、驗證流程,以及有人判斷什麼時候該停、該改、該發布。

    這些東西如果原本在組織裡就很混亂,agent 只會把混亂放大。

    原本需求說不清楚,agent 會更快產出一堆看似合理但方向不對的東西。

    原本沒有人定義品質,agent 會更快製造大量無法判斷好壞的內容。

    原本流程沒有負責人,agent 會讓每個人都以為「應該有人處理了」。

    所以我不太相信「AI 會讓管理消失」。

    我比較相信的是:AI 會讓差的管理更明顯,也讓好的管理更有效率。

    下一步不是多買工具,而是重設工作方式

    如果把這些認知放回實務,我覺得有幾個提醒。

    第一,AI 導入不能只看使用率。

    很多人打開過工具,不代表工作方式改變了。真正該問的是:有沒有哪個流程因為 AI 變得更清楚、更快、更可追蹤?有沒有哪個角色因為 AI 更能做自己擅長的事?

    第二,主管不能只被要求推 AI,也要被支持。

    Gallup 報告指出,管理者本身的敬業度正在下滑。如果管理者自己都在救火,要他們同時承接 AI 導入、情緒管理、流程重設、績效壓力,結果很可能只是更快耗盡。

    第三,AI 訓練不應該只教 prompt。

    prompt 很重要,但更重要的是工作設計。哪些任務交給 AI?哪些地方人工驗證?什麼叫做可用的輸出?錯誤如何回報?成功案例如何沉澱成團隊方法?

    第四,組織要重新重視意義感。

    Gallup 的 Q12 敬業度題項裡,有很多問題都指向管理者日常:我知不知道期待是什麼?我有沒有做好工作所需的資源?我是否被認可?主管是否在乎我?有人鼓勵我成長嗎?公司的使命是否讓我覺得工作重要?

    這些問題看起來很傳統,但在 AI 時代沒有過時。

    甚至更重要。

    我暫時的結論

    AI 可以讓一個人工作效率變快,但不會自動讓一個組織變好。

    組織要真的從 AI 得到效益,需要的不只是工具,而是一個新的管理方式。

    這個管理方式要把任務、流程、標準、回饋、意義感重新接起來。

    所以,AI 時代的管理者可能不會消失。

    但管理者的工作會被迫升級。

    有更多的設計協作,更多一點定義問題,更多一點管理人與 AI 如何一起共創真正有價值的結果。

    如果說過去管理者是組織裡的協調者,那麼在 AI 時代,好的管理者會更像是「人與 agent 的協作設計師」。

    這是我從這份 Gallup 報告裡,讀到最重要的一件事。

    參考來源