Showing Posts From
Ai 比保單
HBR 最新研究:你那套『限時優惠』『剩 3 個名額』在 AI 比價 Agent 面前全部失靈——只有兩個訊號還影響得了它
你做業務的這幾年——可能是十年、二十年——一定累積了一整套「對人類有效」的推銷話術:「這個方案這個月底前簽才有」、「公司給我的名額只剩 3 個」、「原本年繳 5 萬,今天簽下來只要 3.8 萬」、「我幫你加碼送一張長照附約」。這些話術不是憑空生出來的,是一代一代業務員在客戶身上做 A/B test 累積下來的,是業務這個職業的「集體無形資產」。 問題是——當你的客戶開始把保單丟給 ChatGPT 比、把預算丟給 Claude 排序、把問題丟給 Gemini 推薦的時候,你那套價值幾十年的話術,會被瞬間清零。 這不是我猜的。這是 Bayes 商學院的 Jafar Sabbah 跟 King's 商學院的 Oguz A. Acar 5 月 12 日剛在《Harvard Business Review》發表的研究結論。他們跑了數千次模擬購物實驗,把四個主流大語言模型放在四個產品類別前面,把行銷人最珍視的工具一個一個拆給你看。 Sabbah 與 Acar:他們發現的不是「AI 不買單」,是「AI 不吃你那一套說服戰術」 這篇研究最反直覺的點,是它沒有用「AI 比較理性」這種懶人結論收尾。研究團隊的設定方式很細:他們對同一個產品列表隨機微調價格、星級、評論數、再疊加上促銷標籤(稀缺性、倒數計時、劃線價、優惠券、綑綁),讓 GPT-4.1、Claude Sonnet 4、Gemini 2.5 Flash 等模型重複下「我會買哪一個」的決策。"Many classic e-commerce persuasion tactics built for human psychology—scarcity, countdown timers, strike-through pricing, vouchers, and bundles—do not reliably influence AI agents and can even reduce selection depending on the model and product category." (那些針對人類心理設計的經典電商說服戰術——稀缺性、倒數計時、劃線折扣、優惠券、綑綁銷售——對 AI Agent 不只是無法穩定產生影響,依據模型跟商品類別不同,有時候還會「降低」被選中的機率。)請注意「reduce selection(降低被選中的機率)」這幾個字——這不是「沒效果」,是「反效果」。你愈用力推,AI 愈把你往下踢。這是這篇研究真正讓人寒毛直豎的地方。 實驗設計:四個模型、四個產品類別、數千次模擬——他們把行銷人的工具箱一個一個拆開 Sabbah 跟 Acar 沒有只測一個 GPT 然後寫一篇結論。他們把當時最主流的四個模型都拉進來,包含 GPT-4.1、Claude Sonnet 4、Gemini 2.5 Flash——這三個是有點推理能力的「中段班」模型,也納入了更便宜更小的版本,刻意製造一個推理能力的光譜。 產品類別則涵蓋四個常見品類(從低涉入的日用品到高涉入的家電都有),確保結論不是只在「買洗髮精」這種低決策成本的情境成立。 他們發現的最關鍵規律:「能用穩定方向影響 AI 選擇」的訊號只有兩個——星級評價會穩定地讓被選中的機率上升,價格會穩定地讓被選中的機率下降。其他訊號(稀缺性、倒計時、優惠券、綑綁、促銷標籤等)的效果是「模型特定(model-specific)」,今天 GPT 吃這套、明天 Claude 完全不甩,每次升級模型還會再洗一次。 更殘酷的發現是這句:"More advanced reasoning models often appearing skeptical of overt persuasion." (更高階的推理模型,對於明顯的說服戰術往往會起疑心。)意思是:你的推銷話術愈直白,模型的推理能力愈強,它就愈把你當「值得警覺的賣家」處理。這跟人類完全相反——人類愈成熟的買家未必愈警覺,但 AI 是「推理愈強愈不吃」。 三個對 AI Agent 完全失效(甚至反效果)的傳統推銷招式 把研究的發現翻譯成業務語言,會長這樣: 「稀缺性 + 倒數計時」(Scarcity + Countdown) 人類的腦補: 「再不簽就沒了!」啟動損失趨避,產生立即行動的衝動。 AI 的閱讀: 「這是一個帶有人為時間壓力的標籤。」推理強一點的模型會把它當作雜訊忽略,甚至當作「賣家在施壓我這個顧問」的負面訊號。 「劃線折扣 + 優惠券」(Strike-through pricing + Vouchers) 人類的腦補: 「原本 5 萬現在 3.8 萬,省了 1.2 萬!」錨點效應 + 得到的快感。 AI 的閱讀: AI 不在乎「原本多少」,它在乎「最終要付多少」。劃線價對它而言是 0 訊息量的視覺裝飾,優惠券是要它額外做一步運算的「摩擦」——有時候反而扣分。 「綑綁銷售」(Bundles) 人類的腦補: 「主約送附約,CP 值無敵。」感受到「多得到」。 AI 的閱讀: 它會把綑綁包拆解成「per-unit 單位成本 + 是否符合需求」。如果用戶 prompt 沒提到附約那個保障,那個附約對 AI 而言不是 plus,是「不想要的雜訊」。 這三類話術——是壽險業務員從業生涯前五年就被訓練到肌肉記憶的東西。研究告訴你:當客戶把決策權交給 AI Agent 那一刻,這幾招的效用會直接歸零,甚至倒扣。 兩個還救得了你的訊號:第三方信譽與真實價格 研究發現只有兩個訊號是「跨模型、跨品類都穩定」的: 1. 星級評價(Star Ratings)—— 穩定的正向影響 不是業務員自己寫的 sales pitch,不是公司的官方文案,是「外部公開的、可被第三方驗證的、有累積量的」評分與評論。對 AI 來說,這是它能依賴的少數「不會撒謊」的訊號。 2. 價格(Price)—— 穩定的負向影響 價格高,被選中的機率就低。沒有什麼「品牌溢價」、「服務附加值」可以在 AI 的第一輪篩選裡幫你抵銷這個負向係數——除非你的星級夠高、評論量夠多。 把這兩點放在一起看,Sabbah 跟 Acar 的核心建議就出現了:"Treat AI models as distinct segments, prioritize fundamentals like competitive pricing and authentic reviews, and invest in a testing infrastructure that continuously measures how different agents respond as models and prompts evolve." (把每一個 AI 模型當成獨立的客戶分眾來對待,優先把「具競爭力的價格」與「真實的評價」這兩個基本盤做好,並且投資一套能持續測量不同 Agent 反應的測試基礎建設——因為模型跟 prompt 一直在變。)越聰明的模型,越會「看穿」你的推銷話術——這對誰最痛? Sabbah & Acar 的這個發現,跟 Anthropic 4 月那份 Project Deal 實驗呼應得驚人地工整。Project Deal 發現:「弱模型的買家」會吃虧 12% 卻覺得「我得到了公平的交易」——也就是說,便宜的 AI 比較容易被推銷話術影響、會買到比較貴的東西。 從這兩個研究合起來看,這條趨勢線是無法逆轉的:2026 上半年:客戶的 AI 還在「便宜模型階段」,業務員的傳統話術還有殘餘效果。 2026 下半年到 2027:客戶用的 AI 開始升級到推理模型(GPT-5、Claude Opus 4.x、Gemini 3 等),傳統推銷話術不只失效,還會被當作「賣家施壓的負面訊號」處理。 長期:能存活的業務員,是那些把「資源」從「話術製造」轉到「信譽製造」的人。AI 時代要砍掉的 5 個推銷話術 vs 要新建的 2 個信任基建 把這篇研究最後可操作的結論濃縮成一張表: 要砍掉的(對 AI Agent 失效甚至反效果):「這個月底前簽」的限時話術 「公司給我的名額只剩 X 個」的稀缺性話術 「原本 X 萬現在 Y 萬」的劃線折扣話術 「今天簽馬上加碼送 OO」的優惠券/綑綁話術 「我幫你跟公司爭取一個特別方案」的個別客製化話術——AI 不會懂這個故事,它只看到「不透明的價格」要新建的(對 AI Agent 仍然穩定有效):可被第三方驗證的公開信譽系統:Google 評論、客戶授權的推薦案例庫、第三方平台的評分(保經評鑑、社群口碑)。重點是「公開」與「可驗證」——AI Agent 抓得到、信得過。 資訊透明的價格與條件架構:把「我能提供什麼、用什麼價格、規則是什麼」攤開來說清楚。AI 對「乾淨資料」有偏好,對「需要追問才知道」的賣家會降權。這兩件事的共同特徵是:它們都是「基建」,不是「話術」。基建需要時間累積,但一旦累積起來,它在 AI 比較的世界裡會發揮複利。話術需要的是現場演出能力,但 AI 不看現場演出。 Sabbah 跟 Acar 的研究最後一句話是這篇給業務員最殘酷也最誠實的告白:你不能再把 AI 當成「一群會自動買單的傻 buyer」。它是一個會升級、會起疑、會跨模型行為迥異的「新客戶種類」。你愈早把它當作真正的客戶來研究、來建立信譽系統去服務它,你就愈不會在 2027 年那一波清算裡被刷下去。📎 想看 Sabbah 與 Acar 完整的實驗設計、四個產品類別的細部數據、以及他們建議的「AI Agent 測試基礎建設」長什麼樣子,請去讀原文 Research: Traditional Marketing Doesn't Work on AI Shopping Agents。這篇研究還有一個我沒覆蓋的重點:他們示範了「同一個促銷標籤」在不同模型上的反應差距可以大到反向,這對行銷人意味著「跨模型測試」會變成新的必修課,而不是 nice-to-have。