1994 年,矽谷。Jeff Hawkins 坐在車庫裡,手上拿著一把刀和一塊木頭。
他不是在雕刻藝術品。他在做一個決定,這個決定後來影響了你每天放在口袋裡的那台手機。
第一幕:一塊木頭和一根筷子
背景: Jeff Hawkins 剛吃了一場敗仗。
他之前做出了 GRiDPad——當時最先進的平板電腦之一,工程上無懈可擊。市場上完全失敗。原因只有一個:太大了,沒有人要帶著它到處走。
現在他想做一台新的 PDA,叫做 Pilot。但在召集任何工程師、花任何一分錢之前,他先回到車庫。
他做了三件事
• 拿出皮尺,量了自己的襯衫口袋
• 把木頭刻成那個尺寸
• 把一根筷子削成觸控筆的形狀
然後他把這塊木頭放進口袋,帶著它去上班、開會、吃飯,連續幾個月。
| 「如果有人問我週三有沒有空,我就會把木塊掏出來,用筷子點一點,假裝在查行事曆。」 — Jeff Hawkins,Time 雜誌 1998 年 3 月 |
沒有螢幕。沒有電路板。沒有軟體。只有一塊木頭,和一個願意假裝的人。
| 博物館典藏 這塊木頭現在在 Computer History Museum(矽谷)展出,官方說明:「Jeff Hawkins 用這個模型測試 PalmPilot 的設計,以筷子當觸控筆,在會議中假裝記筆記,並計算完成常見任務所需的步驟數。」 |
第二幕:他在驗證什麼?
Hawkins 知道自己能做出這台機器。這不是問題。
他不確定的是:一台口袋大小的 PDA,放在人的生活裡,感覺對嗎? 會有人真的在開會時掏出來用嗎?還是會覺得奇怪而放棄?大小太厚嗎?太輕了嗎?單手操作順嗎?
這些問題,問卷答不了。訪談答不了。只有身體帶著它走幾個月,才能給你答案。
Alberto Savoia 因此把這個手法命名為 Pinocchio
Savoia 在《The Right It》裡寫道:
| 「Pinocchio 是一個木頭偶,夢想成為真男孩。Palm Pilot 是一塊木頭,Jeff Hawkins 夢想它有天能成為真產品。」 — Alberto Savoia,《The Right It》 |
Pinocchio Pretotyping 的定義: 做出一個外型完整但內部完全是假的原型,用來驗證產品的非功能性特質——大小、重量、位置、操作流程、視覺比例。
Pinocchio 和 Mechanical Turk 的核心差異
| Mechanical Turk 問:用戶會不會用這個功能? 驗證:行為假設 數據來源:用戶做了什麼決定 | Pinocchio 問:這個東西放在生活裡,感覺對嗎? 驗證:存在假設 數據來源:用戶身體怎麼反應 |
兩者都在花任何工程成本之前,讓真實接觸給你答案。選哪個,取決於你最不確定的是什麼。
第三幕:AI Coding 讓 Pinocchio 的成本消失了
1994 年,Hawkins 需要一把刀、一塊木頭、幾個月的時間。這是硬體產品的 Pinocchio,已經夠快了。
但數位產品的 Pinocchio 過去需要設計師花數天做 mockup,或工程師花數週搭 PoC,才能讓用戶「感受」產品。
現在,任何人可以在幾小時內用 Claude 或 v0 做出視覺完整、流程完整、但點下去沒有任何後端的介面。 外表像真產品,裡面是空的。這就是數位時代的那塊木頭。
| Hawkins 的時代 刀刻木頭,幾小時做出實體模型 帶著它走幾個月,蒐集身體感受 高門檻 → 只在關鍵決策時用 | AI Coding 時代 Prompt 幾句話,幾小時做出完整假介面 讓用戶操作,即時蒐集行為數據 低門檻 → 每個設計決策都可以驗證 |
但不變的核心是:外型完整,功能是假的。讓人在假產品上做真實操作,觀察真實反應。身體的反應比語言誠實。
第四幕:三個務實的數位 Pinocchio 場景
Pinocchio 最適合驗證「感覺與流程」,而不是功能是否存在。以下三個場景,每個都配上 XYZ 假設公式,讓實驗結果可以被明確判斷。
場景一:儀表板資訊架構
左側導覽還是頂部 Tab 更好?圖表大一點讓人更信賴,還是數字列表更容易掃描?這些問題問用戶,他們說不出好答案;讓他們用,行為會告訴你。
Pinocchio 做法: 用 Claude 做兩個完全假的儀表板——數字是編的,圖表是靜態的——讓真實用戶操作 15 分鐘,觀察他們在哪裡卡住、眼睛往哪裡看、完成任務需要幾步。
| 至少 60% 的分析師(Y),在使用左側導覽版本時,能在 30 秒內找到目標數據(Z),而頂部 Tab 版本做不到 XYZ 假設 — 測的是資訊架構,不是功能 |
為什麼 X = 60%?低於這個門檻,代表差異不夠顯著,可能兩個版本都需要重新設計。
場景二:行動裝置的按鈕尺寸與位置
核心按鈕要放右下角還是置中底部?56px 還是 48px?這是人體工學問題,不是設計美感問題。Jeff Hawkins 用木頭驗證裝置大小,你用假介面驗證按鈕位置,邏輯完全相同。
Pinocchio 做法: 用 Claude 做三個靜態但可點擊的手機介面,讓用戶單手操作,記錄誤觸率與拇指移動路徑。點下去沒有功能,但觀察到的人體工學數據是真實的。
| 至少 70% 的右手用戶(Y),在使用右下角 56px 按鈕版本時,誤觸率低於 10%(Z),置中版本做不到 XYZ 假設 — 測的是人體工學,不是 UX 邏輯 |
為什麼 X = 70%?按鈕位置是全體用戶都會受影響的決策,門檻要設得高,才能確保選出的方案真的更好。
場景三:Onboarding 流程的步驟數
3 步驟、5 步驟、7 步驟的 onboarding,哪個完成率最高?功能完全一樣,流程長短不同。這個問題只有真實用戶走過才能回答,問出來的意見毫無參考價值。
Pinocchio 做法: 用 Claude 做三個點得動但沒有真實帳號系統的假 onboarding,讓 30 位測試者各自完成,記錄放棄率、完成時間、以及在哪個步驟放棄。
| 至少 75% 的新用戶(Y),在 5 步驟版本的 onboarding 中完整走完(Z),而 7 步驟版本的完成率低於 50% XYZ 假設 — 測的是認知負荷,不是功能完整性 |
為什麼同時設定兩個門檻?因為你不只要知道「哪個比較好」,還要知道「好多少」。如果兩個版本的完成率都很低,問題可能出在流程設計本身,而不是步驟數。
什麼情境不適合 Pinocchio?
| 不適合的情境 對話式 AI 助理 用戶需要即時、個人化的回應,空殼介面蒐集不到有效數據 即時推薦系統 需要真實數據才能判斷推薦品質,靜態假介面沒有意義 需要真實計算的功能 財務試算、路徑規劃等,假數字會導致假行為。這些情境改用 Mechanical Turk 或 Fake Door |
第五幕:Pinocchio Playbook(四步驟)
| ① | 定義你要測的非功能性問題 不是「功能能不能用」,而是大小、位置、流程長短、視覺比例哪個版本更適合你的用戶。用 XYZ 公式寫假設:至少 X% 的 Y,會有 Z 的行為表現。先定義 X(多少才算成功),防止事後調整標準。 |
| ② | 用 AI Coding 做假外殼,至少兩個版本 給 Claude 的核心 Prompt:「幫我做一個看起來完整的 [產品名稱] 介面,版本 A 是 [設計決策 A],版本 B 是 [設計決策 B]。點擊不需要有真實功能,但視覺和流程要完整逼真,讓用戶感覺像真實產品。」 |
| ③ | 讓真實用戶做真實任務,不是問意見 不是「你覺得哪個比較好看?」,而是「請完成這個任務」。觀察操作路徑、卡頓點、誤觸,記錄行為,不是感想。身體的反應比語言誠實——這是 Jeff Hawkins 在 1994 年就知道的事。 |
| ④ | 用行為數據做設計決策 XYZ 假設達到門檻?確認這個設計方向,帶著這個參數進入真正的工程開發。沒達到?修改假設,換個版本,再跑一輪。成本還是接近零——比 Hawkins 刻木頭還快。 |
尾聲:那塊木頭,現在在博物館裡
Jeff Hawkins 帶著那塊木頭走了幾個月,得到了他要的答案:口袋大小是對的,單手操作是對的,這個東西值得做。
Palm Pilot 在 1996 年上市,18 個月內賣出超過一百萬台。它奠定了所有掌上型裝置的基本形態,一直延續到今天的智慧型手機。
那塊刻出來的木頭,是整個智慧型手機時代的起點。 它現在在 Computer History Museum 展出,旁邊放著最終的真實產品。
在 AI Coding 讓假外殼的成本趨近於零的今天,你沒有理由不先做那塊木頭。
先讓皮諾丘出門走一圈,再決定要不要給他靈魂。
| 本文核心三問,給每位 Product Builder 1. 你最不確定的,是功能會不會被用(Mechanical Turk),還是產品放在生活裡感覺對不對(Pinocchio)? 2. 你的產品有哪個「大小、位置、流程」的決策,現在靠的是直覺而不是數據? 3. 如果你今天下午就要做一個假外殼,你會讓用戶做什麼任務、觀察什麼行為? |
發表迴響