- +1
瀏覽短視頻泄露個人信息?可能是源于爬蟲軟件
文/陳根
網絡爬蟲也被稱為網頁蜘蛛或者網絡機器人等,是能夠根據自身規(guī)則抓取信息的程序。作為搜索引擎的基礎構件之一,網絡爬蟲直接面向互聯網,是搜索引擎的數據來源,決定著整個系統(tǒng)的內容是否豐富、信息能否得到及時更新。網絡爬蟲的性能表現直接影響整個搜索引擎的效果。
網絡爬蟲平時會在網絡上自動爬取有用的數據,通過一定的選取機制、過濾機制、錄用機制等,來豐富它們的數據庫。事實上,每個搜索引擎的爬蟲機器人都不一樣,它們有著自己的一套“爬取機制”,誰把這個機制優(yōu)化得最好,那么誰就能更快給到用戶真正想要的信息。
比如,百度的爬蟲機器人叫做百度蜘蛛( Baiduspider ),360的爬蟲叫做360 Spider ,搜狗的叫做 SogouSpider ...基于不同的程序爬取算法,它們也擁有不一樣的搜索結果。
然而,網絡爬蟲卻不總是合法的——網絡惡意爬蟲則會突破網站機器人協(xié)議的禁止爬取要求(規(guī)定在robots.txt文件的Disallow部分),爬取網站的核心數據資源,并可能極大地損耗被爬取網站服務器的性能。實際上,對于刷個短視頻,個人信息和需求竟被他人獲取,不久后,私人信箱中還會收到仿佛“量身定制”的推銷信息的現象,其實就源于所謂的爬蟲軟件。
2022年5月10日,經江蘇省無錫市梁溪區(qū)人民檢察院提起公訴,梁溪區(qū)人民法院以提供侵入計算機信息系統(tǒng)程序罪判處被告人丁某有期徒刑一年六個月,緩刑兩年,并處罰金三萬元。這也是全國首例短視頻平臺領域網絡“爬蟲”案件。2021年9月,某信息公司員工吳先生在網上巡查時發(fā)現有人在兜售一款叫“匯易獲客”的軟件,通過對方官網及電話購買了該款軟件。使用后,吳先生驚訝地發(fā)現該軟件居然可以“爬取”自己公司后臺數據和直播間用戶的相關信息,隨即報警。經偵查,公安機關發(fā)現售賣該軟件的某信息咨詢公司老板丁某及銷售人員有重大作案嫌疑。
經查,2019年,丁某成立了自己的信息咨詢公司,后公司因經營不善處于停業(yè)狀態(tài)。2021年中,丁某從丁某某(另案處理)處以9800元的價格購進匯易獲客軟件成為代理商,利用該軟件可以入侵某些短視頻平臺的服務器,通過關鍵詞搜索可以快速抓取平臺信息,主要包括用戶名、UID、簽名及評論等,再通過軟件把UID轉換成二維碼,來精準定位客戶。丁某對該軟件進行了重新包裝,“改頭換面”后對外銷售,違法所得2.4萬余元。
對此,本案承辦法官表示,侵入計算機信息系統(tǒng)程序罪是刑法修正案(七)新增的一個罪名,主要針對向他人提供專門用于侵入或非法控制計算機信息系統(tǒng)工具或程序,或是明知他人實施侵入、非法控制計算機信息系統(tǒng)的違法犯罪行為而為其提供程序、工具,情節(jié)嚴重的行為處以刑罰。
顯然,此次案件中涉及的“爬蟲”軟件就是利用技術手段突破短視頻平臺的反爬措施,非法獲取后臺服務器內指定的數據文件。
無疑,網絡爬蟲作為數據資源獲取和利用的重要手段,但無論是私法領域數據確權還是刑法領域數據法益保護,網絡爬蟲抓取數據的正當性、有效性都源于數據主體的授權,而技術一旦被惡意使用,在技術盛行的時代帶來的傷害,也將是超過人們想像的。
本文為澎湃號作者或機構在澎湃新聞上傳并發(fā)布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業(yè)務經營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




