微信里的海量內容不會只在小范圍內傳播了,它們都可以在搜狗的微信搜索中找到。是什么決定我們在搜索入口看到的內容,這背后有著怎樣的產品邏輯與思考?
微博微信Twitter大家可能會經歷這樣一個情況,在朋友圈里看到了一篇非常好的文章,當時沒有點收藏,幾個月之后突然要找那篇文章,翻了很多朋友圈的文章沒有找到。搜狗的微信搜索就是圍繞用戶的這一痛點而建立的搜索平臺。
用戶需求產生的意義
什么是微信搜索?它既不是搜索微信好友,也不是去搜索朋友圈內容的,它主要搜索的是微信公眾帳號以及公眾帳號的文章。包括 PC 端和無線端兩個終端的服務。
目前搜狗的微信搜索主要提供了公眾號搜索和文章搜索兩個功能。在 PC 端搜索上,搜狗搜索為用戶提供了掃碼一鍵關注的功能。公眾帳號最近發表的文章也會展示在搜索結果頁上。
當用戶點擊這個公眾帳號之后,會進入到公眾帳號的詳情頁,其中除了會把公眾帳號認證的信息、簡介的信息呈現之外,還會把公眾帳號所有歷史上發布的文章展示出來。
文章搜索就會更加簡單一些,跟網頁搜索和新聞搜索的展現樣式是比較類似的。
在微信公眾號里,不乏對各個專業、行業,比較專業的意見領袖或者自媒體人士,使得這些文章會有很深刻的解讀性和理解。這些對用戶而言,用戶可以從中獲得更廣泛、更深度、更有觀點性的內容。
反過來,搜狗微信搜索對微信而言,也有一定的意義。首先,搜狗微信搜索的上線,其實是使微信公眾平臺從一個半封閉的生態圈轉向了開放。這意味著意味著微信公眾帳號以及微信文章的曝光量獲得了極大的提升。
搜狗微信搜索同樣為公眾帳號打擊盜版、保護原創提供了一個工具。由于搜狗平臺的存在,盜版內容的生產者,也不會再那么明目張膽的抄襲了。
搜索背后的排序
其實搜索引擎的排序,無非跟相關性、時效性、權威性等等因素相關,公眾帳號的排序具有搜索引擎網頁通用的指標,但它也有自己鮮明的特點。
公眾賬號的排序
首先我們考慮的是文本的相關性,在公眾號搜索里面,如果公眾帳號的名稱和用戶搜索的內容精準匹配我們會考慮往前排。
同時我們也會考慮權威性,搜狗的微信搜索中認證過的帳號排序肯定會排在非認證帳號之前。
除了上面兩點之外,還需要考慮一些熱門性的因素,包括公眾號的粉絲數,公眾帳號發表文章的閱讀量、轉發率,這些因素從一定程度上能夠反映出來,這個公眾帳號受關注的程度,以及它的活躍度。上面這些是說,我們目前為止在線上可能用到的一些公眾帳號排序因素。
后續我們會考慮增加另外一些因素,來優化排序效果。包括,我們會計算這個公眾帳號的分類和發表文章的分類是否對應。再往后,也不排除我們會針對不同類別的查詢給出不同排序的策略。
公眾賬號的顯示
對于公眾帳號的搜索結果在網頁搜索結果里展示,首先要判斷用戶的查詢是否需要展示公眾號的結果,這就涉及到用戶查詢意圖的分析。
然后我們會根據微信公眾號結果返回的認證號數目以及精準匹配的數量,去確定我們以哪種形式展現,是展現多條還是展現單條結果。確定了如何展現之后,接下來就是展現位置。
首先還是要分析用戶的查詢意圖,看用戶的需求是找一個機構還是找一個名人,還是說我其實是一個泛類別的需求。
同時,我們也會參考微信返回的搜索結果效果,看一下返回結果里認證帳號的數目,精準匹配的數目,文本的相關程度等等。網頁搜索里面其它搜索結果的排序,也會對我們公眾號的排序起到一定的影響作用。
綜合以上這些因素,我們最終確定了一個公眾帳號在網頁搜索里初始排序的位置,后續它還會參與網頁搜索點擊調權的情況。
文章搜索的排序
文章搜索排序,它更類似于搜索引擎網頁搜索的排序。包括我們之前提到的相關性、權威性、時效性、熱門性這些緯度的指標。在文章排序里面,會有一個指標是比較重要的,或者說反映了我們對微信運營者尊重的,那就是原創性。
我們目前做這種原創性識別還是比較簡單的方式,微信的文章里面會有這么兩類文章:一類是以文本為主的,對于這一類文章我們首先會基于這樣的文章做文章特征的抽取,根據抽取文章特征做相似度的判斷,然后我們會把相似度高的文章進行聚類,然后去尋找里面發表時間最早的那篇。
我們知道,在微信里面并不是都是這種文本的文章,還可以看到這種圖片為主的文章,這類文章文本的信息量非常少,有的可能只是純圖片的,還有很多都是 Gif 圖。
這種情況該怎么解決呢?其實開始之前的短片里面也介紹了搜狗識圖技術,那么在這里也會引入搜狗識圖搜索圖片的相似度,判斷兩篇文章是否是相似的或者是否是重復的。
其實,我們線上對原創的識別做的還不是很理想,但是原創識別這塊工作一定會作為我們未來非常非常重點的工作來開展。其實不僅僅是原創識別,文章和公眾帳號排序的效果,還有待我們持續的優化。
除了這些基礎的搜索品質優化和改善之外,我們也會思考,搜狗的微信搜索對于用戶而言,對于微信的公眾帳號或公眾平臺而言,它的作用到底是什么呢?是不是就是我之前提到的那幾點呢?
用戶希望搜索到什么
對于公眾帳號而言,用戶最在意的指標,無非就是粉絲數、閱讀量、轉發數這些很 Kpi 的指標,其實這些指標說到底就是一個公眾帳號的影響力。另外,微信公眾帳號的運營,需要很好的推廣平臺。
在真實的微信搜索里,用戶的真實需求是什么呢?我們發現,以下三類查詢會比較突出:首先第一類是和時令相關的,像中秋啊、開學啊、教師節啊、九月啊、秋季養生這些搜索比例比較高。第二類是和用戶興趣比較相關的,攝影啊、旅游啊、裝修啊,里面還隱藏著一類有商業價值的查詢,這個量也比較大。
未來,微信搜索的方向,可能會分成對用戶和對微信公眾號和公眾平臺兩個緯度來說。
首先對用戶,我們會從這樣基礎體驗,核心價值和脫離搜索本身的其他服務展開。
對于公眾帳號也是 3 個方向:除了基礎體驗,不斷提升公眾帳號的影響力,還包括為微信運營者提供服務平臺,來幫助這些運營者更好的做微信公眾帳號的運營,提升自己品牌的影響力。
本文演講者 韓異凡(搜狗搜索事業部產品總監)、整理者 lydiaxin