首頁 > 期刊 > 人文社會科學 > 社會科學II > 社會學及統計學 > 統計與信息論壇 > 眾包競賽的離群點欺詐用戶檢測算法研究 【正文】
摘要:針對基于眾包競賽中欺詐者篩除機制的黃金標準數據方法、聚類算法的離群點檢測算法K means算法和DBSCAN算法,依賴于事先給定的參數,不適合大規模數據集檢測的問題,提出基于樣本連通圖的離群點檢測算法。首先,給定參數并重復調用離群點檢測算法,識別數據中的離群點和聚類;其次,計算每兩個樣本之間的連接次數和連接強度,在給定連接強度下界δ的情況下,根據樣本的連接強度來構造樣本之間的連通圖;最后,根據樣本之間的連通情況,對樣本進行標記,把樣本標記為聚類節點和離群點。實驗結果表明,該算法在放寬參數設置范圍的情況下,縮小了離群點個數波動范圍,提升了離群點識別準確率,優于對比算法和經典的黃金標準數據方法。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社