Showing Posts From

Ai 比保單

Asu
24 May, 2026
- 業務力

HBR 最新研究：你那套『限時優惠』『剩 3 個名額』在 AI 比價 Agent 面前全部失靈——只有兩個訊號還影響得了它

你做業務的這幾年——可能是十年、二十年——一定累積了一整套「對人類有效」的推銷話術：「這個方案這個月底前簽才有」、「公司給我的名額只剩 3 個」、「原本年繳 5 萬，今天簽下來只要 3.8 萬」、「我幫你加碼送一張長照附約」。這些話術不是憑空生出來的，是一代一代業務員在客戶身上做 A/B test 累積下來的，是業務這個職業的「集體無形資產」。問題是——當你的客戶開始把保單丟給 ChatGPT 比、把預算丟給 Claude 排序、把問題丟給 Gemini 推薦的時候，你那套價值幾十年的話術，會被瞬間清零。這不是我猜的。這是 Bayes 商學院的 Jafar Sabbah 跟 King's 商學院的 Oguz A. Acar 5 月 12 日剛在《Harvard Business Review》發表的研究結論。他們跑了數千次模擬購物實驗，把四個主流大語言模型放在四個產品類別前面，把行銷人最珍視的工具一個一個拆給你看。 Sabbah 與 Acar：他們發現的不是「AI 不買單」，是「AI 不吃你那一套說服戰術」這篇研究最反直覺的點，是它沒有用「AI 比較理性」這種懶人結論收尾。研究團隊的設定方式很細：他們對同一個產品列表隨機微調價格、星級、評論數、再疊加上促銷標籤（稀缺性、倒數計時、劃線價、優惠券、綑綁），讓 GPT-4.1、Claude Sonnet 4、Gemini 2.5 Flash 等模型重複下「我會買哪一個」的決策。"Many classic e-commerce persuasion tactics built for human psychology—scarcity, countdown timers, strike-through pricing, vouchers, and bundles—do not reliably influence AI agents and can even reduce selection depending on the model and product category." （那些針對人類心理設計的經典電商說服戰術——稀缺性、倒數計時、劃線折扣、優惠券、綑綁銷售——對 AI Agent 不只是無法穩定產生影響，依據模型跟商品類別不同，有時候還會「降低」被選中的機率。）請注意「reduce selection（降低被選中的機率）」這幾個字——這不是「沒效果」，是「反效果」。你愈用力推，AI 愈把你往下踢。這是這篇研究真正讓人寒毛直豎的地方。實驗設計：四個模型、四個產品類別、數千次模擬——他們把行銷人的工具箱一個一個拆開 Sabbah 跟 Acar 沒有只測一個 GPT 然後寫一篇結論。他們把當時最主流的四個模型都拉進來，包含 GPT-4.1、Claude Sonnet 4、Gemini 2.5 Flash——這三個是有點推理能力的「中段班」模型，也納入了更便宜更小的版本，刻意製造一個推理能力的光譜。產品類別則涵蓋四個常見品類（從低涉入的日用品到高涉入的家電都有），確保結論不是只在「買洗髮精」這種低決策成本的情境成立。他們發現的最關鍵規律：「能用穩定方向影響 AI 選擇」的訊號只有兩個——星級評價會穩定地讓被選中的機率上升，價格會穩定地讓被選中的機率下降。其他訊號（稀缺性、倒計時、優惠券、綑綁、促銷標籤等）的效果是「模型特定（model-specific）」，今天 GPT 吃這套、明天 Claude 完全不甩，每次升級模型還會再洗一次。更殘酷的發現是這句："More advanced reasoning models often appearing skeptical of overt persuasion." （更高階的推理模型，對於明顯的說服戰術往往會起疑心。）意思是：你的推銷話術愈直白，模型的推理能力愈強，它就愈把你當「值得警覺的賣家」處理。這跟人類完全相反——人類愈成熟的買家未必愈警覺，但 AI 是「推理愈強愈不吃」。三個對 AI Agent 完全失效（甚至反效果）的傳統推銷招式把研究的發現翻譯成業務語言，會長這樣：「稀缺性 + 倒數計時」（Scarcity + Countdown）人類的腦補：「再不簽就沒了！」啟動損失趨避，產生立即行動的衝動。 AI 的閱讀：「這是一個帶有人為時間壓力的標籤。」推理強一點的模型會把它當作雜訊忽略，甚至當作「賣家在施壓我這個顧問」的負面訊號。「劃線折扣 + 優惠券」（Strike-through pricing + Vouchers）人類的腦補：「原本 5 萬現在 3.8 萬，省了 1.2 萬！」錨點效應 + 得到的快感。 AI 的閱讀： AI 不在乎「原本多少」，它在乎「最終要付多少」。劃線價對它而言是 0 訊息量的視覺裝飾，優惠券是要它額外做一步運算的「摩擦」——有時候反而扣分。「綑綁銷售」（Bundles）人類的腦補：「主約送附約，CP 值無敵。」感受到「多得到」。 AI 的閱讀：它會把綑綁包拆解成「per-unit 單位成本 + 是否符合需求」。如果用戶 prompt 沒提到附約那個保障，那個附約對 AI 而言不是 plus，是「不想要的雜訊」。這三類話術——是壽險業務員從業生涯前五年就被訓練到肌肉記憶的東西。研究告訴你：當客戶把決策權交給 AI Agent 那一刻，這幾招的效用會直接歸零，甚至倒扣。兩個還救得了你的訊號：第三方信譽與真實價格研究發現只有兩個訊號是「跨模型、跨品類都穩定」的： 1. 星級評價（Star Ratings）—— 穩定的正向影響不是業務員自己寫的 sales pitch，不是公司的官方文案，是「外部公開的、可被第三方驗證的、有累積量的」評分與評論。對 AI 來說，這是它能依賴的少數「不會撒謊」的訊號。 2. 價格（Price）—— 穩定的負向影響價格高，被選中的機率就低。沒有什麼「品牌溢價」、「服務附加值」可以在 AI 的第一輪篩選裡幫你抵銷這個負向係數——除非你的星級夠高、評論量夠多。把這兩點放在一起看，Sabbah 跟 Acar 的核心建議就出現了："Treat AI models as distinct segments, prioritize fundamentals like competitive pricing and authentic reviews, and invest in a testing infrastructure that continuously measures how different agents respond as models and prompts evolve." （把每一個 AI 模型當成獨立的客戶分眾來對待，優先把「具競爭力的價格」與「真實的評價」這兩個基本盤做好，並且投資一套能持續測量不同 Agent 反應的測試基礎建設——因為模型跟 prompt 一直在變。）越聰明的模型，越會「看穿」你的推銷話術——這對誰最痛？ Sabbah & Acar 的這個發現，跟 Anthropic 4 月那份 Project Deal 實驗呼應得驚人地工整。Project Deal 發現：「弱模型的買家」會吃虧 12% 卻覺得「我得到了公平的交易」——也就是說，便宜的 AI 比較容易被推銷話術影響、會買到比較貴的東西。從這兩個研究合起來看，這條趨勢線是無法逆轉的：2026 上半年：客戶的 AI 還在「便宜模型階段」，業務員的傳統話術還有殘餘效果。 2026 下半年到 2027：客戶用的 AI 開始升級到推理模型（GPT-5、Claude Opus 4.x、Gemini 3 等），傳統推銷話術不只失效，還會被當作「賣家施壓的負面訊號」處理。長期：能存活的業務員，是那些把「資源」從「話術製造」轉到「信譽製造」的人。AI 時代要砍掉的 5 個推銷話術 vs 要新建的 2 個信任基建把這篇研究最後可操作的結論濃縮成一張表：要砍掉的（對 AI Agent 失效甚至反效果）：「這個月底前簽」的限時話術「公司給我的名額只剩 X 個」的稀缺性話術「原本 X 萬現在 Y 萬」的劃線折扣話術「今天簽馬上加碼送 OO」的優惠券/綑綁話術「我幫你跟公司爭取一個特別方案」的個別客製化話術——AI 不會懂這個故事，它只看到「不透明的價格」要新建的（對 AI Agent 仍然穩定有效）：可被第三方驗證的公開信譽系統：Google 評論、客戶授權的推薦案例庫、第三方平台的評分（保經評鑑、社群口碑）。重點是「公開」與「可驗證」——AI Agent 抓得到、信得過。資訊透明的價格與條件架構：把「我能提供什麼、用什麼價格、規則是什麼」攤開來說清楚。AI 對「乾淨資料」有偏好，對「需要追問才知道」的賣家會降權。這兩件事的共同特徵是：它們都是「基建」，不是「話術」。基建需要時間累積，但一旦累積起來，它在 AI 比較的世界裡會發揮複利。話術需要的是現場演出能力，但 AI 不看現場演出。 Sabbah 跟 Acar 的研究最後一句話是這篇給業務員最殘酷也最誠實的告白：你不能再把 AI 當成「一群會自動買單的傻 buyer」。它是一個會升級、會起疑、會跨模型行為迥異的「新客戶種類」。你愈早把它當作真正的客戶來研究、來建立信譽系統去服務它，你就愈不會在 2027 年那一波清算裡被刷下去。📎 想看 Sabbah 與 Acar 完整的實驗設計、四個產品類別的細部數據、以及他們建議的「AI Agent 測試基礎建設」長什麼樣子，請去讀原文 Research: Traditional Marketing Doesn't Work on AI Shopping Agents。這篇研究還有一個我沒覆蓋的重點：他們示範了「同一個促銷標籤」在不同模型上的反應差距可以大到反向，這對行銷人意味著「跨模型測試」會變成新的必修課，而不是 nice-to-have。