<bdo id="vljxk"><rt id="vljxk"><noframes id="vljxk"><noframes id="vljxk"><noframes id="vljxk"><rt id="vljxk"></rt><rt id="vljxk"></rt><noframes id="vljxk"><rt id="vljxk"><delect id="vljxk"></delect></rt><noframes id="vljxk"><rt id="vljxk"></rt><noframes id="vljxk"><noframes id="vljxk"><rt id="vljxk"></rt>

當前位置:首頁 >  站長 >  搜索優化 >  正文

搜索引擎反作弊的三個模型

 2015-06-08 16:43  來源: A5專欄   我來投稿 撤稿糾錯

  阿里云優惠券 先領券再下單

諸如鏈接農場、內容農場、關鍵詞堆砌等都是十分常見的作弊方式,為了維持良好的搜索展現結果,搜索引擎自然就會有反作弊進行應對。

那么,搜索引擎會通過怎樣的方式進行反作弊處理呢?

總的來說,會有以下三種思路:

1、信任傳播模型

前段時間同事A跟我說了一件事兒,他的姐姐B在國外留學,然后一天B在qq上跟A說洗衣服把手機,銀行卡什么的全部洗了,讓A給B的老媽打電話寄點錢來,A立刻執行,B的老媽也深信不疑,在即將打出的那一刻,B的一個電話,挽救了即將發生的損失。

細思恐極。

其實,這也是一個信任傳播模型,直接在QQ上跟B的媽媽說,B的媽媽必然不會完全相信,但是經由A的口一傳,就立刻不一般。因為,A在B的媽媽的信任名單中。

OK,由此而來,就是一種反作弊的思路。

在海量的網頁數據中,通過技術或人工的手段,獲取值得完全值得信任的網頁設置為白名單。白名單中網頁的信任值由鏈接順著向外擴散而遞減或者衰減。然后,設定一個值,高于此值,是OK的網頁,低于此值,不好意思,你作弊了。

2、不信任傳播模型

這個,其實跟第一種思路是及其類似的,找到一群作弊的網頁,然后通過鏈接關系分析不信任分值。

唯一一點需要注意的是,信任分值,是通過鏈接正向傳遞的,不信任分值是通過鏈接反向傳遞的。舉個例子:

A為垃圾頁面,則指向A的鏈接B是垃圾頁面的概率比A指向的鏈接C的概率要大的多。

3、異常發現模型

所謂異常,可以是作弊頁面的特征,也可以是正常頁面的特征。

集合了這些特征,再由此來判定一個頁面是否作弊或者是否正常,也是蠻OK的一件事情。

來個簡單的識別鏈接農場的小例子:

鏈接農場中的鏈接關系,是由設計者精心布置的,由此一來,必然會有些違背自然的特征,諸如:

1)、出鏈與入鏈的統計分布規律:正常的頁面出鏈與入鏈滿足Power-law分布,作弊的鏈接違反該分布;

2)、作弊的鏈接的Url網址往往過長,包含較多的點畫線及數字等;

3)、諸如入鏈及出鏈的增長率等,正常網頁和作弊網頁在這些變化模式上是不同的。

轉載請注明鏈接地址 。

申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!

相關文章

熱門排行

信息推薦