隨著互聯網技術的不斷發展,爬蟲技術已成為電商行業中一個不可忽視的存在。Akamai北亞區技術總監劉燁告訴記者,自2023年起,Akamai觀察到電商行業的爬蟲活躍度顯著高于其他行業,如高科技與金融行業。電商行業的爬蟲活躍度曲線顯著高于其他行業,顯示出電商領域爬蟲活動的普遍性和復雜性。
商業利益驅動的爬蟲技術
爬蟲技術是指一種能夠模擬用戶行為的代碼,主要用于從網站上抓取數據。根據其行為性質與影響,我們可以將爬蟲分為幾大類:善意的爬蟲如搜索引擎,它們為信息流通與檢索提供了便利;中性的爬蟲如Web scraping bots,它們在某些情況下有助于信息收集與聚合,但也可能因使用不當給企業帶來損失;而有害的爬蟲,則可能從事撞庫攻擊、庫存抓取等惡意行為,嚴重損害企業利益與安全。
劉燁認為,爬蟲技術背后的強大商業利益驅使其在各行各業的應用,特別是在電商領域。爬蟲可能被用于抓取商品價格、分析競爭對手策略以制定自身定價方案,甚至可能利用腳本搶占庫存、購買促銷商品后轉售牟利。
不法分子利用爬蟲技術抓取價格、庫存等信息,從中獲利。這些行為不僅擾亂市場秩序,還嚴重損害了企業的合法權益。例如,通過對比分析,找出價格最優、優惠力度最大的電商平臺,然后在另一個平臺上開設店鋪,以準新或全新未開封的產品進行轉售,利用價格優勢實現盈利。
爬蟲帶來的問題
爬蟲的高訪問效率導致電商網站資源過度消耗,影響用戶體驗。爬蟲與真實用戶的訪問量相當,且通常部署在云端或高性能服務器上,其訪問效率遠超普通用戶,這導致電商網站在處理爬蟲請求時可能消耗大量資源,進而影響正常用戶的訪問體驗,降低網站轉化率。此外,爬蟲還可能干擾市場營銷分析工具的數據收集,導致決策依據失真。更糟糕的是,某些爬蟲專注于抓取特定產品頁面的深層鏈接,可能導致這些頁面因請求量過大而無法正常服務。此外,內容聚合網站通過爬蟲抓取內容,導致原創者失去流量和收入。這無疑是對內容創作者辛勤勞動的極大不尊重,也是對整個互聯網生態平衡的破壞。
劉燁表示,在電商領域,設計或編寫一個爬蟲程序已變得相當便捷,得益于互聯網上廣泛提供的“爬蟲即服務”(Scraper as a Service,SaaS)模式。“爬蟲即服務”模式簡化了爬蟲開發流程,卻增加了潛在濫用風險。
而且隨著技術的進步,這些爬蟲服務日益智能化,融入了AI和機器學習技術。它們能夠自動從多個數據源抓取內容,通過預設的邏輯進行數據抽取與分析,最終輔助用戶制定競爭策略、優化產品定位及價格策略等。這種一站式解決方案,無論是對于尋求業務增長的合法用戶,還是意圖不當的惡意使用者,都提供了極大的便利。
Akamai的雙重應對策略
Akamai提出了雙管齊下的策略來應對爬蟲問題。一方面,在邊緣網絡層面,我們利用預定義的訪問異常特征和協議指紋來快速識別并限制惡意爬蟲。另一方面通過深入分析訪問行為(如鼠標移動軌跡、鍵盤敲擊模式)和設備指紋,結合機器學習模型,進一步細化識別精度,確保對潛在威脅的精準打擊。
針對不同類型的爬蟲,Akamai還提供了差異化的解決方案。對于掃描漏洞、抓取內容或竊取用戶信息的惡意爬蟲,Akamai采用更為嚴格的防護機制;而對于那些有助于提升網站質量或服務的良性爬蟲,則采取更加靈活的管理策略。
面對爬蟲,劉燁表示,企業防護的關鍵在于如何在廣泛的訪問請求中準確識別出網絡爬蟲,以及它們的具體類型,進而采取相應的防護措施。劉燁給出了具體的建議:
首先,針對不同類型的爬蟲提供定制化防護機制。確保良性爬蟲得到合理管理,同時對有害爬蟲進行精準打擊。企業可以使用第三方產品和解決方案建立大型數據庫。通過觀察足夠多的請求,形成這樣的數據庫。分析行為特征以判斷請求是否來自惡意Bot。
其次,不僅是簡單的阻攔或禁止,管理爬蟲同樣至關重要。企業可以提供不準確信息、不做響應等多樣化應對措施。例如,可以選擇不禁止Bot,但不做任何響應,讓它誤以為連接仍在進行;或者可以給它提供不準確的信息。
第三,設計多維度防護體系,包括基礎架構、應用開發邏輯等。實施多層防護,確保整體安全狀況。確保沒有環節出現問題,任何短板都可能導致原有防護措施被繞過或攻陷。
最后,建立安全團隊,選擇有效產品。加強安全運營團隊支持,制定應急預案。加強全員的安全教育,確保所有員工都具備基本的安全意識。
機器人攻擊成為增長最快的網絡威脅之一。AI僵尸網絡和無頭瀏覽器技術使得爬蟲更難識別。例如,Akamai幫助一個電子商務客戶被攔截了99%的高風險流量,而客戶本身甚至并沒有留意到這些流量。因此,企業需要利用AI和機器學習完善識別模型。采取自動化策略,自動部署新策略以應對新攻擊。例如,當出現新的攻擊類型時,策略引擎能夠自動部署新的策略,有針對性地阻止這些新攻擊。
結論
爬蟲技術在電商行業中的應用既帶來了商業機遇,也引發了諸多挑戰。Akamai提出的策略不僅有助于企業有效應對當前的威脅,也為未來的網絡安全提供了指導方向。通過綜合運用技術手段與策略規劃,企業能夠更好地保護自己免受爬蟲帶來的負面影響,同時利用有益爬蟲提升業務表現。