測試最難的從來不是自動化,而是「先想清楚要測什麼」

在 GenAI 的時代,越來越多人期待:「AI 幫我做測試就好了吧?」
但這種期待其實有點危險,因為——

AI 只是更快、更聽話的自動化工具。
如果你不知道該測什麼,AI 只會更快、更自信地把錯的東西測一遍。

很多 QA、很多開發人員,都以為測試的核心是:
✔ 用了什麼工具
✔ 自動化覆蓋了哪些流程
✔ 產生了多少腳本

但真正的難點一直都不是這些,而是:
「測試思維」——也就是判斷:到底什麼東西值得測?該怎麼測?為什麼要測?

🔍什麼是測試思維?為什麼這麼多人缺乏?

測試思維不是寫腳本,也不是點來點去。
它包含至少三種基本能力:

① 風險思考:使用者會在哪裡爆?系統最怕哪裡錯?

例:購物流程看起來都能跑,但其實最容易炸的不是下單,而是「退款流程」──因為商家最怕錢錯付、客訴、算錯金額。
沒有測試思維的人會去測「流程能不能走完」。
有測試思維的人會去測「最痛的風險在哪」。

② 邊界判斷:哪些例子是『關鍵例子』?

例:輸入生日欄位,不是輸入 1995/01/01 就算完事。
你應該會想到:

  • 2/29 出生的人怎麼辦?
  • 未成年人要限制嗎?
  • 跨時區會不會有誤差?
    沒有測試思維的人:看起來能輸入就好。
    有測試思維的人:會找出「系統討厭」的地方。

③ 行為視角:使用者真正想做的事是什麼?

例:
「Given 我按下登入按鈕…」這不是需求的行為,這只是操作步驟。
真正的行為是:
「使用者想要安全地登入,避免帳號被盜。」
這是風險、場景、情境的區別。

為什麼很多開發人員會缺乏測試思維?

很簡單:
沒有人教過他們。

大部分開發的訓練都在教:

  • 如何寫功能
  • 如何解 bug
  • 如何重構

    卻沒有時間去理解:
  • 需求背後的業務邏輯
  • 使用者行為
  • 系統風險與邊界

所以很多開發人員(以及不少 QA)都把測試等同於「流程跑得過」或「例外狀況不 crash」。
這不是他們的錯,是訓練方式本來就沒包含這塊。

那 GenAI/MCP/RAG 不是可以補這塊嗎?

這是現在最常見的誤解。

MCP、RAG、各種「AI 生成測試案例」的工具,本質都是希望:
「把專案的重要知識餵給 AI,讓它產生更完整、更正確的測試。」

聽起來很美好,但有一個巨大的前提:
你有沒有提供對的知識?品質好不好?

而現在的問題是——
若一個團隊 本來就缺乏測試思維、也不知道要測什麼

❌ MCP 會吃到錯誤或不完整的資料
❌ RAG 會從文件裡抽不到關鍵行為
❌ AI 會生成一堆看似厲害、但毫無測試價值的案例

結果是什麼?
AI 很努力,但它努力的方向是錯的。

Garbage in, garbage out。
沒有測試思維,就算你把 AI 再訓練 100 次,它也學不會對的東西。

這正是目前「AI 幫我寫測試」最大的缺陷:
不是 AI 不行,而是我們給的資料根本不對。

🔥所以測試的核心從來都一樣:思考,而不是流程自動化

你可以用 Selenium、Playwright、Postman、K6、JMeter
也可以用 GenAI、MCP、RAG、AI 測試框架
但最終 AI 只能強化你既有的能力。

如果測試思維是強的,AI 會讓你變更強。
如果測試思維是弱的,AI 會讓混亂變得更快、更大、更自信。

最後想說

真正厲害的 QA 與開發,不是會多少工具,
而是知道:什麼值得測、為什麼要測、該怎麼測。
這件事在 GenAI 時代不會被取代,只會被放大。

發表迴響

探索更多來自 轉念學 - 敏捷三叔公的學習之旅 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading