案情介紹
2016年至2017年間,張洪禹、宋某、侯明強作為被告單位上海晟品網(wǎng)絡(luò)科技有限公司主管人員,在上海市共謀采用技術(shù)手段抓取北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司(辦公地點位于本市海淀區(qū)北三環(huán)西路43號中航廣場)服務(wù)器中存儲的視頻數(shù)據(jù),并由侯明強指使被告人郭輝破解北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司的防抓取措施、實施視頻數(shù)據(jù)抓取行為,造成被害單位北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司損失技術(shù)服務(wù)費人民幣2萬元。
上海晟品網(wǎng)絡(luò)科技有限公司系有限責(zé)任公司,經(jīng)營計算機網(wǎng)絡(luò)科技領(lǐng)域內(nèi)的技術(shù)開發(fā)、技術(shù)服務(wù)、電子商務(wù)、電子產(chǎn)品等業(yè)務(wù)。張洪禹系上海晟品網(wǎng)絡(luò)科技有限公司法定代表人兼 CEO,負責(zé)公司整體運行;宋某于擔(dān)任聯(lián)席 CEO,系產(chǎn)品負責(zé)人;侯明強擔(dān)任 CTO,系技術(shù)負責(zé)人;郭輝系爬蟲工程師。張洪禹、宋某、侯明強經(jīng)共謀,于2016年至2017年間采用技術(shù)手段抓取北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司服務(wù)器中存儲的視頻數(shù)據(jù),并由侯明強指使郭輝破解北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司的防抓取措施,使用“tt_spider”文件實施視頻數(shù)據(jù)抓取行為,造成北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司損失技術(shù)服務(wù)費人民幣2萬元。經(jīng)鑒定,“tt_spider”文件中包含通過頭條號視頻列表、分類視頻列表、相關(guān)視頻及評論3個接口對今日頭條服務(wù)器進行數(shù)據(jù)抓取,并將結(jié)果存入到數(shù)據(jù)庫中的邏輯。在數(shù)據(jù)抓取的過程中使用偽造 device_id 繞過服務(wù)器的身份校驗,使用偽造 UA 及 IP 繞過服務(wù)器的訪問頻率限制。
法院觀點
上海晟品網(wǎng)絡(luò)科技有限公司違反國家規(guī)定,采用技術(shù)手段獲取計算機信息系統(tǒng)中存儲的數(shù)據(jù),情節(jié)嚴(yán)重,其行為已構(gòu)成非法獲取計算機信息系統(tǒng)數(shù)據(jù)罪,應(yīng)予懲處。
判決情況
一、被告單位上海晟品網(wǎng)絡(luò)科技有限公司犯非法獲取計算機信息系統(tǒng)數(shù)據(jù)罪,判處罰金人民幣二十萬元;
二、被告人張洪禹,公司法人,判處有期徒刑一年,緩刑一年,罰金人民幣五萬元;
三、被告人宋某,公司聯(lián)席 CEO,判處有期徒刑十個月,罰金人民幣四萬元;
四、被告人侯明強,公司 CTO,判處有期徒刑十個月,罰金人民幣四萬元;
五、被告人郭輝,公司爬蟲工程師,判處有期徒刑九個月,罰金人民幣三萬元。
判決文書
案例分析
本案中上海晟品網(wǎng)絡(luò)科技有限公司,采用技術(shù)手段獲取今日頭條服務(wù)器中存儲的數(shù)據(jù)并存儲到自己的數(shù)據(jù)庫中,內(nèi)容包括頭條號視頻列表、分類視頻列表、相關(guān)視頻及評論三個接口,符合我國《刑法》第二百八十五條關(guān)于非法獲取計算機信息系統(tǒng)數(shù)據(jù)罪的認定:“違反國家規(guī)定,侵入國家事務(wù)、國防建設(shè)、尖端科學(xué)技術(shù)領(lǐng)域以外的計算機信息系統(tǒng)或者采用其他技術(shù)手段,獲取該計算機信息系統(tǒng)中存儲、處理或者傳輸?shù)臄?shù)據(jù),情節(jié)嚴(yán)重”。
當(dāng)然,有人會問了,視頻及評論都是正常用戶可以看到的公開數(shù)據(jù),爬取為什么會觸犯法律?這里需要注意的一點是”信息公開不等于數(shù)據(jù)公開“,就像政府信息公開主要在保障公眾的知情權(quán),知情并不等于獲得,獲得也不等于可利用,真正意義上的數(shù)據(jù)開放主要是指原始數(shù)據(jù)的開放。頭條號之所以將視頻信息內(nèi)容允許用戶觀看,無非是網(wǎng)站或平臺吸引用戶的一種商業(yè)操作,并不意味著用戶可以永久地享有該視頻信息內(nèi)容,具體到本案,今日頭條采用的是流媒體技術(shù)播放,用戶在觀看視頻時需要同時緩存該視頻,但是觀看完畢后,該視頻的數(shù)據(jù)文件也隨即消失。緩存與復(fù)制下載的區(qū)別在于,緩存意味著斷電即無,而復(fù)制下載則意味著可以永久保存。因此,網(wǎng)站采用流媒體播放這一技術(shù)本身即意味著視頻數(shù)據(jù)的非公開性,也同時意味著行為人爬取其視頻文件的非法性。反之,如果網(wǎng)站允許用戶復(fù)制、下載視頻,或者說并未采取技術(shù)措施對視頻數(shù)據(jù)予以保護,則意味著視頻數(shù)據(jù)的公開,即使是行為人采用爬蟲技術(shù)一次性大量抓取數(shù)據(jù),也由于數(shù)據(jù)的公開性而喪失了刑法規(guī)制的必要性。
值得探討的是,晟品網(wǎng)絡(luò)公司在數(shù)據(jù)抓取的過程中,雖然使用偽造 device_id 繞過服務(wù)器的身份校驗,使用偽造 UA 及 IP 繞過服務(wù)器的訪問頻率限制,但并不屬于破解系統(tǒng)登陸密碼或利用系統(tǒng)安全漏洞的爬蟲行為,只是讓反爬蟲措施無法識別,本身并不具有刑法上的違法性,被告是否通過冒用用戶 ID 并破解密碼等方式進行未經(jīng)授權(quán)的訪問,無法得知,如果僅僅是設(shè)備 ID、UA、IP 的變換,本文認為并不具有特定的刑法意義,判決文書中也并未對此進行詳細的描述。
反爬機制主要是針對網(wǎng)絡(luò)爬蟲的技術(shù)特征而對其實施的反制。網(wǎng)絡(luò)爬蟲的技術(shù)本質(zhì)在于模擬人工手動點擊從而可以一次性大量地獲取數(shù)據(jù)信息,因此一般反爬機制的主要目的并非禁止對方對于網(wǎng)站或平臺的訪問,而是禁止或拒絕采用不合適的方式進行訪問與瀏覽,例如并發(fā)過高引起的類 DDOS 行為。而身份認證機制的設(shè)置,其根本目的則在于劃定網(wǎng)站或平臺自身的隱私范圍與控制領(lǐng)域,換言之,是為了確定計算機信息系統(tǒng)安全的領(lǐng)域與范圍。據(jù)此反爬機制與身份認證機制在范圍上可以產(chǎn)生交叉,但絕非一致,混為一談的行為可能會降低刑事入罪的門檻從而增加了互聯(lián)網(wǎng)用戶的刑事風(fēng)險,繞過反爬不一定屬于刑事犯罪。
從最終的判決情況可以看出,和K哥之前寫過的深圳快鴿案一樣,CTO、CEO 負責(zé)并授權(quán)程序員開發(fā)涉案的爬蟲程序,系主犯,程序員受指派開發(fā)爬蟲軟件,在共同犯罪中起次要作用,系從犯,但是!程序員同樣承擔(dān)了相應(yīng)的法律責(zé)任!刑事犯罪留下的檔案記錄可能會影響三代人,也就意味著子女和孫兒都會受影響! 爬蟲工程師們要多對需求進行理性分析,隱患大的需求該拒絕就拒絕,以目前已經(jīng)判決了的各類爬蟲案例來看,越過了法律的紅線,無論最后是不是“集體買單”,爬蟲工程師都不可能置身事外!愿各位爬蟲工程師們:知敬畏、存戒懼、守底線,警鐘長鳴!
本案很有意思的一點是,宋某和侯明強都為前字節(jié)視頻項目組的高管,一個是項目經(jīng)理、一個是技術(shù)負責(zé)人,從字節(jié)離職后反手爬頭條視頻及評論做利益轉(zhuǎn)化,大家對此有什么看法呢~