今年我與語言模型合作的心得筆記 03|PDF 中文消失那次,Codex 開始看現場

Obsidian PDF 中文消失時 Codex 協助看現場除錯

Obsidian 匯出 PDF 時,中文突然不見了。

表面看起來只是個小問題:不就是中文沒辦法在 PDF 裡顯示嗎?可是電腦現場常常就是這樣,看到的是一個小症狀,背後可能牽到一整串設定、路徑和工具判斷。

前兩篇寫到,Codex 開始住進我的電腦,也跟 Obsidian 變成一個共讀區。但當內容真的開始落到本機,我遇到的就不只是「要不要留下」而已。工具會壞、設定會錯、路徑會找不到,電腦現場不像聊天框那麼乾淨。

這些事以前特別消耗人。不是因為每一件都難,而是它們卡在很碎的地方:工具有沒有裝好?終端機到底該打什麼指令?設定檔放在哪?快取能不能寫入?這個錯誤訊息可信,還是我的理解只看到片面?

以前碰到這種事,我常常先放著。你知道自己大概修得好,但要花一段時間進入狀況:先 Google、看別人的心得教學、查設定、猜是哪個環節壞了。真正累的不是修,而是要把整個現場重新理解一遍。

Codex 進來之後,我開始比較敢處理這些事。

像我後來想用本機錄音和影片轉文件來取代線上工具,我希望它能「幫我把一段內容轉成文字、摘要,再存進筆記庫」。但要做到這件事,它得先確認電腦裡有沒有可用的影音工具,缺什麼就補什麼:Homebrew 裝得進去嗎?`whisper-cli` 找得到嗎?模型檔放在哪?轉錄跑完之後,輸出是完整的,還是只是終端機畫面被截斷?

深夜雙螢幕檢查 PDF 中文缺字、終端機與樣式設定的除錯現場

這些細節很無聊,但每個環節都是重要的。只要工具沒裝好,後面所有「AI 幫我整理影片」都是空話。能不能落地,看的是它能不能一路從安裝、檢查、測試,走到把一段錄音變成可讀的逐字稿,再整理成我之後用得上的筆記或會議紀錄。

那時候我才開始感覺,這不是多了一個聊天視窗,而是電腦裡多了一個會幫我搞定複雜事情的助手。重點是透過一次次互動的脈絡,這個助手了解我的風格、習慣、用字遣詞等等。

但最有感的,還是那次 Obsidian PDF 中文消失。

真正麻煩的不是「中文不見」這四個字,而是我們以前得先搞清楚為什麼 Obsidian 輸出 PDF 會吃不到中文字體、是哪個設定沒對,還要去找有沒有人碰過一樣的狀況、他們怎麼解。

這次我直接問 Codex:可以幫我解決嗎?

它一路查下去,才發現事情沒那麼直線。我的 Obsidian 不是只有一層設定,而是有不同 vault、不同 `.obsidian` 資料夾,還牽涉到 appearance 設定、CSS snippet,以及匯出 PDF 時到底吃到哪一套樣式。

中間還踩到一個很典型的坑:某個系統工具把 JSON 當成 plist 去讀,報了一個看起來很像真的錯誤。這種時候最危險,如果太相信第一個錯誤訊息,很容易被帶去修一個根本不是問題的地方。後來改用更直接的方式去讀設定內容,才確認檔案本身沒壞,問題要回到 Obsidian 實際讀取的設定與樣式路徑去看。

最後 PDF 能正常顯示中文,靠的不是一道神奇指令,而是一層一層排除:哪個 vault?哪份設定?哪段 CSS?哪個字型真的被用到?

修完那次之後,我對 Codex 的感覺又變了一次。

它不是只會「告訴我應該怎麼修」。它能在我的電腦裡看現場、檢查檔案、讀設定、嘗試不同判斷,再把每一步留下來。這比較像在電腦裡裝了一個助手。它不一定每次都知道答案,但它願意把那些我原本懶得碰、或要花時間才學得會的事,一層一層攤開。

但這套用法不是沒有代價。

電腦除錯最可怕的,不是問題難,而是你以為自己知道問題在哪。而 AI 特別容易順著你一開始的假設往下查:你說「是不是字型問題」,它就先陪你查字型;你說「是不是設定壞了」,它就往設定壞掉的方向走。

所以這種合作不能只是把方向丟給它。我要做的反而是一直把它拉回證據:現在實際看到什麼?哪個檔案真的被讀到?這個錯誤訊息可信嗎?有沒有另一個方式可以驗證?

本機影音轉錄也是同樣的道理。工具裝起來,不代表流程可信。ASR 會聽錯人名、公司名、專有名詞;快取路徑寫不進去,可能看起來像工具壞了;終端機輸出被截斷,也會讓人誤以為轉錄不完整。這些都不能只憑「AI 說可以」就算數,最後還是要回到檔案、設定、輸出結果,加上人工檢查。

那次 Obsidian PDF 中文消失,最後修好的不只是一個字體問題。它更像一次提醒:當 AI 開始能碰到你的電腦,它確實能把很多麻煩事變簡單;但你也更需要知道,什麼時候該相信它,什麼時候該要求它停下來,重查一遍。

上一篇:Chat 會流走,Obsidian 會留下來 | 下一篇:記憶宮殿,是留給下一次 Codex 的便條