合規(guī)是數(shù)據(jù)入表的前提。當前爬蟲數(shù)據(jù)是非常敏感的,因為爬蟲極容易造成兩大不合規(guī)的問題:一是沒有經(jīng)過個人同意獲取數(shù)據(jù),二是爬取的數(shù)據(jù)里可能含有個人敏感信息也是一個問題。現(xiàn)在法律對于這部分非常嚴苛,如果企業(yè)里有50條未獲得授權(quán)的個人信息就已經(jīng)處于高危邊緣,一旦違規(guī)出售或傳播,立馬就構(gòu)成刑事犯罪了。
所以如果企業(yè)想將爬取的數(shù)據(jù)入表的話,必須先確定這些數(shù)據(jù)是否滿足以下幾大合規(guī)性要求:
1、是否侵犯個人權(quán)利
《網(wǎng)絡安全法》中嚴格要求企業(yè)依法依規(guī)處理個人數(shù)據(jù)。如果企業(yè)通過繞行或強行突破反爬蟲措施抓取個人數(shù)據(jù),可能構(gòu)成“竊取或以其他非法方式獲取個人信息的違法行為”,情節(jié)嚴重的,可能構(gòu)成侵犯公民個人信息罪。
建議企業(yè)企業(yè)通過構(gòu)建協(xié)議許可及完整的授權(quán)鏈路確保數(shù)據(jù)權(quán)屬關系和數(shù)據(jù)來源的合規(guī)。
協(xié)議許可:遵守被爬取方的Robots 協(xié)議,如若面對不合理的Robots協(xié)議,可以嘗試走“協(xié)商-通知”路徑,向被爬方提出書面修改Robots協(xié)議、準許其爬蟲抓取的請求。
三重授權(quán):如爬取數(shù)據(jù)涉及用戶的個人信息,建議遵守“用戶授權(quán)平臺+平臺授權(quán)爬取方+用戶授權(quán)爬取方”的三重授權(quán)原則進行抓取。
抓取數(shù)據(jù)涉及個人信息的,需要遵循《個人信息保護法》規(guī)定,按照個人信息的不同類型,依法進行處理:
針對非公開個人信息:應當履行“告知-同意”流程,取得個人明示同意;
針對公開個人信息:對于個人明確提出拒絕的,應當及時撤回或刪除相關個人信息;若處理已公開的個人信息,對個人權(quán)益有重大影響的,還應當取得個人同意。
2、是否存在不正當競爭的法律風險
爬蟲獲取的公共數(shù)據(jù)的使用需遵循“合法、必要、正當”原則,注重信息時效、保障信息質(zhì)量和敏感信息校驗等,否則將可能因不當利用而構(gòu)成不正當競爭。爬蟲技術(shù)可以使企業(yè)更加便捷地從政府部門等公開信息披露的平臺與網(wǎng)站采集可為己所用的公共數(shù)據(jù),這些信息與資訊經(jīng)企業(yè)匯聚、整合與加工處理,形成企業(yè)的重要財富。但企業(yè)在使用公共數(shù)據(jù)進行商業(yè)化利用的過程中,如未盡必要注意義務導致原始數(shù)據(jù)主體合法權(quán)益受損的,將承擔相應的法律責任。
3、數(shù)據(jù)管理是否合規(guī)
爬蟲數(shù)據(jù)進入到企業(yè)數(shù)據(jù)庫,做好數(shù)據(jù)分級分類,確保數(shù)據(jù)的合規(guī)管理是企業(yè)進行數(shù)據(jù)管理的必要措施,
《中華人民共和國網(wǎng)絡安全法》等相關法律法規(guī)均對企業(yè)的數(shù)據(jù)管理提出了明確要求。例如,對數(shù)據(jù)實行分類分級管理;處理重要數(shù)據(jù)應當明確數(shù)據(jù)安全負責人和管理機構(gòu);對重要數(shù)據(jù)處理活動定期開展風險評估等。
4、數(shù)據(jù)相關業(yè)務運營是否合規(guī)
爬蟲數(shù)據(jù)進行加工使用,對外形成商業(yè)互產(chǎn)品,對企業(yè)的業(yè)務體系,商業(yè)模式的合規(guī)性要求很高,需要確保爬蟲數(shù)據(jù)的授權(quán)鏈路完整性,數(shù)據(jù)資產(chǎn)權(quán)屬關系清晰,確保爬蟲數(shù)據(jù)在數(shù)據(jù)資產(chǎn)目錄中可追溯,可查詢,權(quán)屬清晰。
企業(yè)在開展和數(shù)據(jù)相關的業(yè)務時還應當依照相關法律法規(guī)取得相應的資質(zhì)證照。例如,對于通過互聯(lián)網(wǎng)平臺的方式獲取數(shù)據(jù)的企業(yè),應當獲得互聯(lián)網(wǎng)相關業(yè)務所需的增值電信業(yè)務等相關證照,倘若企業(yè)提供的服務具有輿論屬性或者社會動員能力,企業(yè)在向公眾提供前還應當進行安全評估,并按照《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》履行算法備案手續(xù)。
對于爬蟲獲取數(shù)據(jù),如果已經(jīng)滿足上述合規(guī)性要求,企業(yè)如果想進行入表的話,可以參考以下路徑:

點擊輸入圖片描述(最多30字)
爬取來的數(shù)據(jù)需滿足數(shù)據(jù)資產(chǎn)化條件:(1)有數(shù)據(jù)加工使用權(quán);(2)需要通過進一步的實質(zhì)性加工和創(chuàng)新性勞動,獲得數(shù)據(jù)產(chǎn)品經(jīng)營權(quán)以實現(xiàn)經(jīng)濟收入。
入表路徑:(1)需要歸集與數(shù)據(jù)采購、
數(shù)據(jù)治理、數(shù)據(jù)研發(fā)等相關的成本。需要關注數(shù)據(jù)采購合同的金額是否均應計入當年成本。(2)其他科目:按資產(chǎn)類別入表。
在數(shù)據(jù)入表的過程中,無論是資產(chǎn)評估、質(zhì)量評估還是價值評估,都需要涉及到專業(yè)化的服務機構(gòu)的參與,以提供各類專業(yè)咨詢。億信華辰拉通各生態(tài)伙伴成立“數(shù)據(jù)資產(chǎn)入表服務鏈合體”,為客戶提供數(shù)據(jù)資產(chǎn)入表及數(shù)據(jù)資產(chǎn)交易等一站式解決方案,包括:咨詢規(guī)劃、
數(shù)據(jù)資產(chǎn)管理、會計審計、法律咨詢、安全監(jiān)管等能力,為企業(yè)提供專業(yè)化服務,全程指導企業(yè)有效地進行數(shù)據(jù)入表工作。如有數(shù)據(jù)入表需求,歡迎私信聯(lián)系。
(部分內(nèi)容來源網(wǎng)絡,如有侵權(quán)請聯(lián)系刪除)