測試最難的從來不是自動化，而是「先想清楚要測什麼」

在 GenAI 的時代，越來越多人期待：「AI 幫我做測試就好了吧？」
但這種期待其實有點危險，因為——

AI 只是更快、更聽話的自動化工具。
如果你不知道該測什麼，AI 只會更快、更自信地把錯的東西測一遍。

很多 QA、很多開發人員，都以為測試的核心是：
✔ 用了什麼工具
✔ 自動化覆蓋了哪些流程
✔ 產生了多少腳本

但真正的難點一直都不是這些，而是：
「測試思維」——也就是判斷：到底什麼東西值得測？該怎麼測？為什麼要測？

測試思維不是寫腳本，也不是點來點去。
它包含至少三種基本能力：

例：購物流程看起來都能跑，但其實最容易炸的不是下單，而是「退款流程」──因為商家最怕錢錯付、客訴、算錯金額。
沒有測試思維的人會去測「流程能不能走完」。
有測試思維的人會去測「最痛的風險在哪」。

例：輸入生日欄位，不是輸入 1995/01/01 就算完事。
你應該會想到：

例：
「Given 我按下登入按鈕…」這不是需求的行為，這只是操作步驟。
真正的行為是：
「使用者想要安全地登入，避免帳號被盜。」
這是風險、場景、情境的區別。

很簡單：
沒有人教過他們。

大部分開發的訓練都在教：

所以很多開發人員（以及不少 QA）都把測試等同於「流程跑得過」或「例外狀況不 crash」。
這不是他們的錯，是訓練方式本來就沒包含這塊。

這是現在最常見的誤解。

MCP、RAG、各種「AI 生成測試案例」的工具，本質都是希望：
「把專案的重要知識餵給 AI，讓它產生更完整、更正確的測試。」

聽起來很美好，但有一個巨大的前提：
你有沒有提供對的知識？品質好不好？

而現在的問題是——
若一個團隊 本來就缺乏測試思維、也不知道要測什麼：

❌ MCP 會吃到錯誤或不完整的資料
❌ RAG 會從文件裡抽不到關鍵行為
❌ AI 會生成一堆看似厲害、但毫無測試價值的案例

結果是什麼？
AI 很努力，但它努力的方向是錯的。

Garbage in, garbage out。
沒有測試思維，就算你把 AI 再訓練 100 次，它也學不會對的東西。

這正是目前「AI 幫我寫測試」最大的缺陷：
不是 AI 不行，而是我們給的資料根本不對。

你可以用 Selenium、Playwright、Postman、K6、JMeter
也可以用 GenAI、MCP、RAG、AI 測試框架
但最終 AI 只能強化你既有的能力。

如果測試思維是強的，AI 會讓你變更強。
如果測試思維是弱的，AI 會讓混亂變得更快、更大、更自信。

真正厲害的 QA 與開發，不是會多少工具，
而是知道：什麼值得測、為什麼要測、該怎麼測。
這件事在 GenAI 時代不會被取代，只會被放大。

探索更多來自 轉念學 - 敏捷三叔公的學習之旅 的內容