在今天看見明天

大數據時代 「你可能也喜歡」的祕密

大數據時代  「你可能也喜歡」的祕密

湯姆・范德比爾特

理財

1079期

2017-08-24 10:36

網路上的影片評分機制,都可能記錄著你的偏好,這也是為什麼螢幕上跳出的推薦影片,可能符合你的口味,也不斷出現的原因。

有天晚上,我在瀏覽Netflix(網飛),看是不是有什麼東西可看,結果跳出來一部名叫《木馬贏家》(The Rocking Horse Winner)的電影(「因為您喜歡看《驚魂記》、《安妮霍爾》、《血風暴》」)。我點選了它,發現是一部一九四九年的片子,改編自勞倫斯的小說,講一個男孩,只要騎在玩具馬上,就能預測賽馬的贏家。這個故事和這部電影我都沒看過。

我在這件事所想的是,透過演算法來推薦,這套系統實在太厲害了:從歷史的垃圾桶裡,用一種看不到、超過我所能理解的方式,挑了一部沒人知道的電影。是什麼東西把《木馬贏家》跟伍迪艾倫的經典喜劇、希區考克的驚悚片和柯恩兄弟黑色幽默的西部片連在一起?我所做的評分動作是如何把這四部電影兜在一起?如果我喜歡希區考克,但是不喜歡《安妮霍爾》,這會給出其他的推薦電影嗎?

我已經沒時間去看過期的法國雜誌《電影筆記》(Cahiers du Cinma),或是去翻唱片行外頭的特價花車了。我把一部分做決定和發現的過程交給電腦,我們已經把記憶的誤差交由Google來負責了。

但有一段時間,我很認真地研究我的Netflix演算法。每一部看過的電影,我都給評分,然後研究我會得到什麼推薦電影。我希望能掌握我的品味的曲折面貌,我喜歡《屍變》(Evil Dead)並不表示我也喜歡其他的驚悚片,我想讓它不只是知道我喜歡什麼,而是我為什麼喜歡它。

我到加州的洛斯加托斯(Los Gatos)的Netflix總部,我想像這家公司是存放人類嗜好的巨大倉庫,是一個慈眉善目的「史塔西」(昔日東德的國家安全機構),知道每個人會如何看電影。我想知道的事情涉及公司財產,他們不會告訴我。評分的演算法有多敏感?如果Netflix會給一部電影三・二分,而我給了二・七分,這個差異有多快會傳遍我的評價系統?什麼電影的正負評價最為兩極?

我跟Netflix產品創新副總裁葉林(Todd Yellin)坐在「捍衛戰士室」(Top Gun),Netflix的會議室都是以電影或電視節目來命名,「我在這裡的首要工作是負責產品個人化。帶領同事研究如何進行評分、改善預測,要把它放在使用者介面的哪裡。」他說,「我們在這幾年拓展個人化的範圍,把評分預測的比重降低了。」

我來這裡是為了了解全世界最複雜的一套預測人對電影的品味的機制,而他們卻告訴我,透過評分而表現出來的品味比重逐漸下降。「在我們這裡為電影和電視節目評分的人是全世界最多的。」葉林說,但他說在大概二○○五、○六年是最先進的。評分的問題變得已經過時,Netflix花了這麼多時間心力,打造了這套以評分為基礎的推薦系統,然後就拋下不做了?

 

從關注「喜歡什麼」 轉為聚焦「看了什麼」


葉林說,「我們還是覺得這是很有用的資訊,但這已經是次要的了。」負責Netflix推薦系統的阿瑪崔安(Xavier Amatriain)說, Netflix在預測品味的速度已經到頂。「你花了二○%的時間,有了九○%的準確性,然後花了其他的八○%的時間,設法改善那一○%的準確度。」投入了那麼多,改善最後的一○%,增加複雜度,是否值得這麼做,其實很難說。

Netflix已經從一家只寄送DVD的公司變成主要提供影片串流服務的公司了。「當消費者想要給我們評價的時候,」阿瑪崔安說,「他們想做的是表達一個思考過程。你在片單上加了一個東西,表達了意見,長遠來看是會得到回饋的。」但即時的串流,「是很不同的一件事。你不喜歡它,你只要轉到其他地方就好。轉換的成本低得多。」

因為串流,Netflix得到的回饋或許明顯減少,但卻有更多隱而不顯的行為。「我們可以得到即時的播放資料」,葉林說,Netflix知道更多關於你看什麼、如何看、什麼時候看、在哪裡看、搜尋什麼⋯⋯這又是一個品味的訊號。

一窺那曾是難以理解的領域,判斷的行程、偏好的表達、品味的機制。線上行為稱為電子口碑(electronic word of mouth),抽象、「無法言說」的品味概念遇上了具協同式過濾演算法的網際網路規範,無序蔓延的數據集,還有活動紀錄。整體水平透過數字,就可把雜訊過濾掉,達成統計上的共識。

於是,Netflix曾經很依賴人們自陳他們喜歡什麼,現在則把焦點更放在實際上看了什麼。Netflix察覺人的期望與行為之間不一致。舉例來說,一張DVD在顧客的家裡放了多久,是可以追蹤的。葉林說,「我們注意到,《不願面對的真相》(An Inconvenient Truth)會一直放在家裡。」但你停止放柏格曼的電影,改看《鐵男躲避球》(Dodgeball)?你就製造了一個資料點。

 

評分機制充滿偏見 也包含「炫耀」品味


「你可能會給《盧安達旅館》(Hotel Rwanda)五顆星,給《美國隊長》(Captain American)兩顆星,「但你可能更喜歡看《美國隊長》。」經濟學家談論我們「品味」的炫耀「記號」(不論是否誠實)。人們不會給《美國隊長》五顆星,給《盧安達旅館》兩顆星,然後偷偷看《盧安達旅館》。社會學家高夫曼(Erving Goffman)有個很有名的「擬劇行為」,「因為人相信有個看不見的人在看,如果未達標準,將會受到懲罰。」於是有了「有罪惡感的歡愉」(guilty pleasure),也變成「一個為了騙別人的防衛策略」。

Netflix最常碰到的抱怨就是「你們為什麼要推薦那些只有兩、三顆星的電影給我?」換個說法,我不會喜歡的東西,你們為什麼要給我?但是Netflix並不是要把你變成影迷。它只是想讓你繼續看Netflix而已。

評分系統充滿偏見。一般會避免最高和最低的一級,這叫「收縮偏見」,所以兩顆、四顆星的評分比一顆、五顆星的評論要多得多。還有「整數偏見」,人傾向給整數的分數。因為人的品味偏好各有不同。別人認為這部電影有三顆星,但你可能覺得是部五顆星的佳作。這也是為什麼Netflix會分成整體評分和「我們猜你會喜歡」兩個部分。

Netflix這個網站是一個對偏好所進行的龐大實驗,你可能也參與了,但自己並不知道。把線上買鞋的搜尋欄位移到左邊或右邊,會讓人買更多的產品嗎?寫著「一九八○年代之後的外國電影」會讓你看更多的外國電影嗎?

Netflix也雇了人去「下標」,架設電影元資料(meta-data)的迷宮,結果有了很奇怪的發現。導演阿莫多瓦的名字可能就會把兩部不搭軌的電影連在一起,換了其他的字眼是無法做此連結的,但是元資料也能理清靠我們一己之力無法發現的事情。就像作家馬椎格(Alexis Madrigal)所說的,「Netflix不只是給你看你可能會喜歡的影片,它還能告訴你,那些東西是什麼。」

這兩件事可以彼此相互影響,這不只是從推薦系統中大數據所看到的「量子糾纏」(quantum entanglement)的一種古怪形式而已,而是人類品味的一個事實。
(本文選自第二章‧洪依婷整理)

 

品味選擇題

品味選擇題
作者 湯姆・范德比爾特(TomVanderbilt)

●《連線》雜誌(英國 )、《Outside》、 《Artforum》雜誌特約編輯。著有《馬路學》與《倖存城市》(Survival City)。

譯者 吳家恆、趙盛慈
出版 大塊文化 出版日期 2017/08

延伸閱讀

挖出顧客討厭的事 業績多十趴

2016-08-18

解開Netflix擊敗HBO的成功密碼

2013-05-09

創意未必是標新立異!Netflix內容總監:練習,讓每一次都超越上一次

2018-08-28

說故事做情蒐讓人看不罷休

2018-11-14

工程師年薪1500萬,比川普還高!瘋狂的Netflix:別跟我稱兄道弟,我們不是一家人

2019-05-16