什麼是 Web Discovery Project? 追蹤
Web Discovery Project 是一種保護隱私的方式,讓您能為 Brave 搜尋的成長與獨立性做出貢獻。 如果你選擇參加,你將會提供一些匿名的數據,這些數據包括在 Brave 瀏覽器中進行的搜尋和網頁訪問(包括通過某些但不是全部其他搜尋引擎到達的頁面)。 這些數據有助於建立 Brave 搜尋的獨立索引,並確保我們顯示與你的搜尋查詢相關的結果,並支持更多與 Brave 產品和服務相關的體驗。所謂“數據”是指搜尋查詢、搜尋結果點擊、在瀏覽器中訪問的頁面網址、在那些頁面上花費的時間,以及關於這些頁面本身的一些元數據。
Web Discovery Project 在背景中運行,因此貢獻者無需付出任何努力。 所貢獻的數據無法與貢獻者鏈接在一起,不能組合在一起,這就防止了身份重新識別的嘗試。 隨時選擇退出。
我們為何建立 Web Discovery Project
提供相關的搜索結果對於建立人們希望使用的搜索引擎至關重要。 這就是我們如何創建一個私密的搜尋引擎,同時在質量和完整性方面與大型科技公司競爭。 為了確保搜尋結果盡可能相關,Brave 需要了解一些關鍵內容,包括:
- 搜尋結果與搜尋關鍵字的匹配程度(匹配確切的字、部分字或同義詞)
- 這些關鍵字最近的搜索頻率
- 給定關鍵字的搜尋結果被點擊的頻率
- 搜尋關鍵字的受歡迎程度
- 哪些頁面受歡迎或是新穎的
- 哪些網站僅允許 Google 搜尋機器人爬行
確保相關性也意味著減少來自網頁內容的“噪音”,這使得搜尋結果不太相關。 例如,如果你搜尋“歐洲天氣”,但看到有關歐洲歷史或歐洲商業的結果,你會說這些結果與你的查詢不太相關。 透過 Web Discovery Project 進行學習,能讓 Brave 搜尋以保護隱私的方式過濾掉這些雜訊。 使搜索更相關不應以犧牲您的在線隱私為代價。
上下文
大多數搜尋提供者——像 Google 和 Microsoft——會收集有關你的搜尋行為數據,不僅是在搜尋引擎中,也包括在瀏覽器(如 Chrome 或 Edge)中的資料。 這些數據包括你的查詢、你點擊的搜索結果、你訪問的頁面的 URLs、在那些頁面上花費的時間,以及關於這些頁面本身的元數據(如頁面標題、內容類型等)。 其他非獨立的搜尋引擎(如 DuckDuckGo)不一定自己收集數據。 但他們仍然依賴這種類型的數據收集,因為他們依賴於其他大型科技公司的索引(如 Bing)。 而這些數據可能--而且經常會--與你個人相關聯。
搜尋提供者收集這種類型的數據以不斷增長其索引--他們從中獲取結果的數十億個網頁列表--並確保這些結果是相關且不會過時的。 此收集本身並不是壞事。 但當你看看 Brave 的替代方式時,它的缺點變得顯而易見:
- Web Discovery Project 讓您能貢獻匿名、通用化的資料。
- Web Discovery Project 的設計能防止我們將這些資料與您建立關聯。 這意味著 Brave 沒有數據可以賣給廣告商,也不會因盜竊或黑客而丟失數據,使得我們能通過技術而非言語來承諾。
- Brave 的 Web Discovery Project 僅採用主動加入(opt-in)方式,並且完全透明。
無關聯性保護
Brave 不遵循其他大型科技搜尋引擎的隱秘做法。 Web Discovery Project 採用主動加入方式,且在 Web Discovery Project 下收集的資料具有特定的保護措施以確保匿名性。 除了這些保護措施之外,Web Discovery Project 還遵循「不可連結性」的原則。 這意味著我們不會將數據與你、你的瀏覽器或你的設備進行連結。 Brave 搜尋沒有用戶或會話 ID 的概念,這防止了記錄的連結性。 此外,Web Discovery Project 包含多項保護措施,以防止納入專屬於您的網站或搜尋,或是包含個人或敏感資訊的內容。
哪些關鍵字被最常搜尋? 這些關鍵字將導向哪些網站? 如何與這些網站互動? 這類方向性問題有助於 Brave 搜尋在可用網頁世界中導航,並從噪音中分離出信號。 這反過來幫助我們了解值得為用戶建立索引的網頁部分。
如果您主動加入 Web Discovery Project,您的瀏覽器將在您的裝置上處理以下資料,並安全地將其傳送至 Brave 的伺服器:
- 少量在 Brave 瀏覽器中訪問的網頁地址(URL),以及互動衡量指標(在頁面上的停留時間)
- 少量在一些搜尋引擎(不包括 Brave 搜尋)中進行的查詢(例如“今天紐約天氣”),以及相關的點擊結果(如果有的話)
- 這些訪問頁面的元數據(例如頁面是否包含視頻、頁面作者或擁有者信息、頁面標題等),但從不包括頁面的內容。
- 詳情請查看 Brave 的 GitHub 倉庫
通過這些數據,Brave 可以以私密且不可連結的方式了解一些情況,例如有多少次訪問網站(例如 Wikipedia)持續超過 20 秒,或某個查詢(例如“Wikipedia 是什麼?”)導致用戶點擊進入該網站 這有助於 Brave 搜尋知道一個網站是合法的,以及用戶認為該內容有價值。 這反過來又使搜尋引擎能夠理解結果的相關性,並將更相關的頁面放在搜尋結果的頂端。 這些數據絕對不會使 Brave 知道關聯的查詢(例如執行“Wikipedia 是什麼?”查詢的人所做的其他查詢)
This data does not allow Brave to know things like associated queries (e.g. other queries conducted by people who searched “What is Wikipedia?”) 或者他們訪問的其他網站。 當然,也不會告訴我們任何可以使我們將數據與個人或其設備聯繫起來的事情。
預設情況下,所有使用者都已退出 Web Discovery Project。 If you’ve chosen to opt in, you can opt out again at any time. 無論您選擇什麼—參與或退出—您的Brave或Brave 搜尋使用體驗都不會改變。
要退出,請在Brave 瀏覽器中打開一個新頁籤,然後點擊設定。 捲動至「Web Discovery Project」,然後將此設定切換為關閉。
Web Discovery Project 是輕量的,且僅在背景中運行。 應該不會對瀏覽速度、頁面渲染速度或其他類似指標有明顯影響。 然而,可能會有一些少量(但可能不明顯)的CPU和帶寬額外消耗。 請注意,網路探索計畫僅在桌面裝置上運行,因此不會對移動數據計劃產生影響。 If you notice performance issues, please notify us immediately.
所有發送的URL必須公開可用—也就是說,不論是誰貢獻的,它們必須具有相同的內容。 這只有在頁面沒有在登入、個別會話或其他身份驗證後面時才可能為真。 所有發送的URL必須已被至少20個不同的人訪問過,這建立了類似於k匿名性的分佈式法定人數。
Additionally, there are a variety of heuristics applied to rule out URLs that encode access i.e. capability URLs (such as shared docs, Dropbox links, invoice links, etc). 根據設計,這些URL都不會被發送。 而且,即使它們以某種方式被發送了,記錄不可連結協議意味著沒有人可以從相同來源恢復其他URL,或將任何數據與任何人聯繫起來。
上述保護也適用於搜尋查詢。 任何包含看似個人資料的查詢(例如電子郵件、電話號碼或哈希)將自動丟棄,而不是發送。
- 關於 Web Discovery Project 的概觀可在 Brave 的 GitHub 儲存庫中找到。
- 閱讀頂層 README。
- 檢視原始碼。
If you spot a potential problem, please create an issue on the repo, or contact us.