Cos'è il Web Discovery Project? – Centro assistenza

Il Web Discovery Project è un modo privacy-preserving per contribuire alla crescita e all'indipendenza di Ricerca Brave. Se si decide di partecipare, si contribuirà con alcuni dati anonimi sulle ricerche e sulle visite alle pagine web effettuate all'interno del Brave Browser (incluse le pagine raggiunte tramite alcuni, ma non tutti, altri motori di ricerca). Questi dati aiutano a costruire l'indice indipendente di Ricerca Brave e a garantire che vengano mostrati i risultati rilevanti alle vostre query di ricerca e supportare esperienze più rilevanti con i prodotti e i servizi di Brave. Per 'dati' intendiamo query di ricerca, clic sui risultati di ricerca, gli URL delle pagine visitate nel browser, il tempo trascorso su quelle pagine e alcuni metadati sulle pagine stesse.

Il Web Discovery Project funziona in background, quindi non richiede alcuno sforzo da parte dei collaboratori. I dati contribuiti non possono essere collegati a chi li ha forniti, né raggruppati insieme, il che impedisce tentativi di deanonimizzazione. È possibile rinunciare in qualsiasi momento.

Perché abbiamo creato il Web Discovery Project

Fornire risultati di ricerca rilevanti è essenziale per creare un motore di ricerca che le persone desiderano utilizzare. È il modo in cui creiamo un motore di ricerca privato che può ancora competere con le big tech per qualità e completezza. Per garantire che i risultati di ricerca siano il più rilevanti possibile, Brave deve comprendere alcune cose chiave, tra cui:

Quanto i risultati di ricerca corrispondono alle parole chiave di ricerca (abbinamento a parole esatte, parti di parole, o sinonimi)
Quanto recenti sono le ricerche per quelle parole chiave
Quanto spesso viene cliccato un risultato di ricerca per una determinata parola chiave
Quanto sono popolari le parole chiave di ricerca
Quali pagine sono popolari o nuove
Quali siti consentono il crawling solo al bot di ricerca di Google

Garantire la rilevanza significa anche ridurre il 'rumore' dei contenuti web che rende una ricerca meno rilevante. Per esempio, se si cerca 'previsioni meteo Europa' e si vedono risultati relativi alla storia europea o al business europeo, si direbbe che i risultati sono meno pertinenti alla vostra query. L'apprendimento attraverso il Web Discovery Project consente a Ricerca Brave di filtrare questo rumore, ma in modo privacy-preserving. Rendere la ricerca più pertinente non dovrebbe avvenire a scapito della vostra privacy online.

Contesto

La maggior parte dei fornitori di ricerca, come Google e Microsoft, raccolgono dati sul comportamento di ricerca dell’utente, sia nel motore di ricerca che nel browser (come Chrome o Edge). Questi dati includono le query, i risultati di ricerca su cui si clicca, gli URL delle pagine visitate, il tempo trascorso su quelle pagine e i metadati (come il titolo della pagina, tipo di contenuto, ecc.) sulle pagine stesse. Altri motori di ricerca non indipendenti (come DuckDuckGo) non necessariamente raccolgono dati autonomamente. Ma fanno comunque affidamento su questo tipo di raccolta attraverso la loro dipendenza da altri indici di big tech (come Bing). E questi dati possono essere, e spesso sono, associati personalmente a voi.

I fornitori di ricerca raccolgono questo tipo di dati per far crescere continuamente i loro indici - l'elenco di miliardi di pagine web da cui traggono per consegnare i risultati - e garantire che i risultati siano pertinenti e mai obsoleti. Questa raccolta non è intrinsecamente cattiva. Ma le sue carenze diventano evidenti quando si guarda al modo alternativo di Brave:

Il Web Discovery Project ti consente di contribuire con dati anonimi e generalizzati.
Il Web Discovery Project è progettato per impedirci di associare questi dati a te. Questo significa che non ci sono dati che Brave potrebbe vendere agli inserzionisti o perdere per furto o hacking, permettendoci di promettere attraverso la tecnologia piuttosto che le parole.
Il Web Discovery Project di Brave è solo opt-in e totalmente trasparente.

La protezione della non associabilità

Brave non segue le pratiche subdole degli altri motori di ricerca delle grandi aziende tecnologiche. Il Web Discovery Project è opt-in e i dati raccolti nell'ambito del Web Discovery Project hanno protezioni specifiche per garantire l'anonimato. Oltre a queste protezioni, il Web Discovery Project aderisce al principio di "non collegabilità". Ciò significa che non associamo dati a voi, al vostro browser o al vostro dispositivo. Ricerca Brave non ha un concetto di ID utente o sessione, il che impedisce la collegabilità dei record. Inoltre, il Web Discovery Project include molteplici protezioni per impedire l'inclusione di siti web o ricerche specifiche per te, o che includono informazioni personali o sensibili.

Quali parole chiave vengono cercate più spesso? A quali siti web portano queste parole chiave? Come vengono interagiti questi siti web? Questo tipo di domande direzionali aiutano Ricerca Brave a navigare nel mondo delle pagine web disponibili e a separare il segnale dal rumore. E questo, a sua volta, ci aiuta a capire quali parti del web valga la pena indicizzare per gli utenti.

Cosa raccoglie il Web Discovery Project, come e perché

Se aderisci al Web Discovery Project, il tuo browser elaborerà i seguenti dati sul tuo device e li invierà in modo sicuro ai server di Brave:

Una frazione degli indirizzi (URL) delle pagine web visitate nel Browser Brave, insieme alle metriche di coinvolgimento (quanto tempo si passa sulla pagina)
Una frazione delle query (ad es. “tempo a New York oggi”) effettuate su alcuni motori di ricerca (al di fuori di Ricerca Brave) all'interno del Browser Brave, insieme al clic associato su un risultato (se presente)
Metadati di quelle pagine visitate (ad esempio, se la pagina contiene un video, informazioni sull'autore o il proprietario della pagina, il titolo della pagina, ecc.), mai il contenuto della pagina stessa.
Per un elenco completo, controllate il repo GitHub di Brave

Con questi dati, Brave può apprendere (in modo privato e non collegabile) cose come quante visite a un sito web (ad es. Wikipedia) sono durate più di 20 secondi, o quante volte una determinata query (ad es. “Cos'è Wikipedia?”) ha portato un utente a fare clic su quel sito web. Questo calibra Ricerca Brave per sapere che un sito web è legittimo e che gli utenti trovano il contenuto prezioso. Questo, a sua volta, consente al motore di ricerca di comprendere la rilevanza dei risultati e di servire pagine con maggiore rilevanza nella parte superiore dei risultati di ricerca.

This data does not allow Brave to know things like associated queries (e.g. other queries conducted by people who searched “What is Wikipedia?”) o gli altri siti web visitati. E ovviamente non ci dice nulla che ci permetta di collegare i dati a un individuo o al suo dispositivo.

Esiste una convalida esterna della metodologia del Web Discovery Project?

La metodologia del Web Discovery Project si basa su una metodologia precedente (nota come "Human Web") creata da Cliqz nel 2016. È stata in produzione da allora, senza rotture conosciute. Brave ported the methodology to the Brave Browser, and expanded with additional systems to ensure privacy, such as using n-out-of-k secret sharing schemes, as well as conducting further privacy and security reviews. Per audit esterni, è in vigore un programma HackerOne.

Posso disattivare il Web Discovery Project, anche dopo averlo attivato?

Per impostazione predefinita, tutti gli utenti sono esclusi dal Web Discovery Project. If you’ve chosen to opt in, you can opt out again at any time. Qualunque sia la vostra scelta—aderire o rinunciare—la vostra esperienza con Brave o Ricerca Brave non cambierà.

Per rinunciare, aprite una nuova scheda nel browser Brave e cliccate su Impostazioni. Scorri fino a "Web Discovery Project" e disattiva questa impostazione.

Cosa succede ai dati che contribuisco? Possono essere rimossi?

No. A causa del principio di non-collegabilità dei record, non abbiamo modo di determinare quali dati avete contribuito (ciò violerebbe la politica sulla privacy di Brave e i nostri principi etici). I dati inviati a Brave entrano in un pool comune e sono indistinguibili dai dati contribuiti da altre persone o dispositivi. Non possiamo rimuovere dati che non sono associati a voi in primo luogo.

Esiste una politica di conservazione dei dati?

Web Discover Project data is not personal data as defined under laws like the EU General Data Protection Regulation. Non possono essere collegati a nessun individuo o ai loro dispositivi, né possono essere utilizzati per individuare singoli individui. Sebbene non ci sia un obbligo legale di determinare un periodo di conservazione per questo tipo di dati non personali, abbiamo deciso di cancellare i dati un anno dopo la loro raccolta.

L'attivazione del Web Discovery Project ha un impatto sulle prestazioni?

Il Web Discovery Project è leggero e funziona solo in background. Non dovrebbe esserci alcun impatto percepibile sulla velocità di navigazione, sulla velocità di rendering delle pagine o su altri parametri simili. Tuttavia, potrebbe esserci un piccolo (ma probabilmente impercettibile) sovraccarico sotto forma di un maggiore consumo di CPU e larghezza di banda. Note that the Web Discover Project only runs on desktop devices, so there is no impact on mobile data plans. If you notice performance issues, please notify us immediately.

Il Web Discovery Project è un crawler?

In un certo senso, sì. Il Web Discovery Project elabora i fetch job dal web crawler di Brave. Ogni pochi secondi o minuti, il browser potrebbe essere istruito a recuperare una pagina web e inviare l'HTML a Brave. Tuttavia, questo recupero non ha alcun impatto sulla cronologia di navigazione o sui cookie—viene effettuato come una chiamata API di recupero privato. Per una maggiore sicurezza, i domini dei lavori di recupero sono preselezionati da un piccolo insieme di domini innocui e di buona reputazione.

Come gestisce il Web Discovery Project le pagine autenticate o le pagine con informazioni personali?

Tutti gli URL inviati devono essere pubblicamente disponibili—cioè, devono avere lo stesso contenuto indipendentemente da chi li sta contribuendo. Ciò può essere vero solo se le pagine non sono dietro una login, una sessione individuale o altra autenticazione. Tutti gli URL inviati devono essere stati visitati da almeno 20 persone diverse, il che stabilisce un quorum distribuito simile alla k-anonimizzazione.

Additionally, there are a variety of heuristics applied to rule out URLs that encode access i.e. capability URLs (such as shared docs, Dropbox links, invoice links, etc). Per design, nessuno di questi URL viene inviato. E, anche se in qualche modo lo fossero, il protocollo di non tracciabilità dei record significa che nessuno con accesso ai dati potrebbe recuperare altri URL dalla stessa origine o associare alcun dato a qualcuno.

Le suddette protezioni si applicano anche alle query di ricerca. Qualsiasi query contenente dati personali apparenti, come email, numeri di telefono o hash, viene automaticamente scartata piuttosto che inviata.

Posso guadagnare Ricompense Brave per l'attivazione del Web Discovery Project?

In futuro, potremmo offrire BAT a coloro che scelgono di partecipare al Brave Discovery Project. Tuttavia, ci sono alcune preoccupazioni riguardanti le frodi da risolvere prima, quindi non abbiamo ancora implementato questa opzione. Speriamo di avere aggiornamenti su questo presto.

Dove posso trovare il codice sorgente e maggiori dettagli tecnici sul Web Discovery Project?

Una panoramica del Web Discovery Project è disponibile sul repo GitHub di Brave.
Leggi il README di primo livello.
Visualizza il codice sorgente.

If you spot a potential problem, please create an issue on the repo, or contact us.

Articoli in questa sezione

Cos'è il Web Discovery Project? Segui

Perché abbiamo creato il Web Discovery Project

Contesto

La protezione della non associabilità

Articoli in questa sezione

Perché abbiamo creato il Web Discovery Project

Contesto

La protezione della non associabilità

Articoli correlati