Czym jest Web Discovery Project? – Centrum pomocy

Web Discovery Project to chroniący prywatność sposób, w jaki możesz przyczynić się do rozwoju i niezależności Brave Search. Jeśli się zdecydujesz, przyczynisz się do udostępnienia anonimowych danych o wyszukiwaniach i odwiedzanych stronach internetowych w przeglądarce Brave (w tym o stronach znalezionych przez niektóre, ale nie wszystkie, inne wyszukiwarki). Te dane pomagają budować niezależny indeks Brave Search i zapewniają wyświetlanie odpowiednich wyników dla zapytań wyszukiwania oraz wsparcie bardziej odpowiednich doświadczeń z produktami i usługami Brave. Przez „dane” rozumiemy zapytania wyszukiwania, kliknięcia wyników wyszukiwania, URL odwiedzanych stron w przeglądarce, czas spędzony na tych stronach oraz niektóre metadane o samych stronach.

Web Discovery Project działa w tle, więc nie wymaga żadnego wysiłku ze strony kontrybutorów. Danych udostępnionych nie można powiązać z osobą je udostępniającą ani grupować razem, co zapobiega próbom deanonimizacji. Możesz zrezygnować w dowolnym momencie.

Dlaczego stworzyliśmy Web Discovery Project

Dostarczanie odpowiednich wyników wyszukiwania jest kluczowe dla tworzenia wyszukiwarki, której ludzie chcą używać. Tak tworzymy prywatną wyszukiwarkę, która nadal konkuruje z Big Tech pod względem jakości i kompletności. Aby zapewnić maksymalną trafność wyników wyszukiwania, Brave musi zrozumieć kilka kluczowych rzeczy, w tym:

Jak dokładnie wyniki wyszukiwania odpowiadają słowom kluczowym (dopasowanie do dokładnych słów, części słów lub synonimów)
Jak niedawne są wyszukiwania tych słów kluczowych
Jak często klikany jest wynik wyszukiwania dla danego słowa kluczowego
Jak popularne są słowa kluczowe wyszukiwania
Jakie strony są popularne lub nowe
Które witryny pozwalają na indeksowanie tylko przez bota wyszukiwarki Google

Zabezpieczanie trafności oznacza również zmniejszenie „szumu” z treści internetowych, które sprawiają, że wyszukiwanie jest mniej trafne. Na przykład, jeśli szukasz „pogoda w Europie” i widzisz wyniki dotyczące historii Europy lub biznesu europejskiego, powiesz, że wyniki są mniej trafne dla twojego zapytania. Uczenie się dzięki Web Discovery Project umożliwia Brave Search odfiltrowanie tego szumu, ale w sposób chroniący prywatność. Uczynienie wyszukiwania bardziej trafnym nie powinno odbywać się kosztem twojej prywatności online.

Kontekst

Większość dostawców wyszukiwania — jak Google i Microsoft — zbiera dane o twoim zachowaniu w wyszukiwaniu, zarówno w wyszukiwarce, jak i przeglądarce (takiej jak Chrome lub Edge). Dane te obejmują twoje zapytania, na które wyniki wyszukiwania klikasz, URL odwiedzanych stron, czas spędzony na tych stronach oraz metadane (takie jak tytuł strony, typ treści, itp.) dotyczącą samych stron. Inne, nie-niezależne wyszukiwarki (jak DuckDuckGo) niekoniecznie zbierają dane same. Ale nadal polegają na takim zbieraniu danych poprzez swoją zależność od innych indeksów Big Tech (jak Bing). I te dane mogą — i często są — powiązane z tobą osobiście.

Dostawcy wyszukiwania zbierają tego rodzaju dane, aby nieustannie rozwijać swoje indeksy — listy miliardów stron internetowych, z których czerpią wyniki — oraz zapewniać, że wyniki są trafne i nigdy nie są przestarzałe. To zbieranie samo w sobie nie jest złe. Ale jego niedoskonałości stają się widoczne, gdy spojrzysz na alternatywną drogę Brave:

Web Discovery Project pozwala Ci przekazywać anonimowe, uogólnione dane.
Web Discovery Project został zaprojektowany tak, aby uniemożliwić nam powiązanie tych danych z Tobą. Oznacza to, że Brave nie ma danych do sprzedaży reklamodawcom, ani nie ma co utracić wskutek kradzieży lub włamania, co pozwala nam obiecywać przez technologię, a nie słowa.
Web Discovery Project firmy Brave działa wyłącznie na zasadzie opt-in i jest całkowicie przejrzysty.

Ochrona braku powiązań

Brave nie stosuje podstępnych praktyk innych dużych wyszukiwarek technologicznych. Web Discovery Project działa na zasadzie opt-in, a dane zbierane w ramach Web Discovery Project mają szczególne zabezpieczenia gwarantujące anonimowość. Oprócz tych zabezpieczeń Web Discovery Project przestrzega zasady „braku możliwości powiązania”. Oznacza to, że nie łączymy danych z Tobą, Twoją przeglądarką lub Twoim urządzeniem. Brave Search nie ma pojęcia o identyfikatorze użytkownika lub sesji, co uniemożliwia powiązanie rekordów. Ponadto Web Discovery Project obejmuje wiele zabezpieczeń, które zapobiegają uwzględnianiu witryn lub wyszukiwań charakterystycznych dla Ciebie albo zawierających dane osobowe lub poufne.

Jakie słowa kluczowe są najczęściej wyszukiwane? Do jakich witryn prowadzą te słowa kluczowe? Jak są te witryny używane? Tego rodzaju pytania kierunkowe pomagają Brave Search nawigować w świecie dostępnych stron internetowych i oddzielać sygnały od szumu. A to z kolei pomaga nam zrozumieć, które części sieci warto indeksować dla użytkowników.

Co Web Discovery Project zbiera, w jaki sposób i dlaczego

Jeśli zdecydujesz się na udział w Web Discovery Project, Twoja przeglądarka będzie przetwarzać następujące dane na Twoim urządzeniu i bezpiecznie wysyłać je na serwery Brave:

Ułamek adresów (URL) odwiedzanych stron internetowych w Brave Browser wraz z metrykami zaangażowania (ile czasu spędzono na stronie)
Ułamek zapytań (np. „pogoda w Nowym Jorku dzisiaj”) przeprowadzonych w niektórych wyszukiwarkach (poza Brave Search) w Brave Browser, wraz z powiązanym kliknięciem wyniku (jeśli występuje)
Metadane tych odwiedzanych stron (np. jeśli strona zawiera wideo, informacje o autorze lub właścicielu strony, tytuł strony itp.), nigdy treść samej strony.
Pełną listę znajdziesz w repozytorium GitHub Brave

Dzięki tym danym Brave może się nauczyć (w prywatny, niepowiązany z użytkownikiem sposób) rzeczy, takie jak ile odwiedzin witryny (np. Wikipedia) trwało dłużej niż 20 sekund, lub ile razy dane zapytanie (np. „Co to jest Wikipedia?”) skłoniło użytkownika do kliknięcia w tę witrynę. To kalibruje Brave Search, aby wiedziało, że witryna jest wiarygodna i że użytkownicy uważają jej zawartość za wartościową. To z kolei pozwala wyszukiwarce zrozumieć relewantność wyników i wyświetlać strony o wyższej relewantności na górze wyników wyszukiwania.

This data does not allow Brave to know things like associated queries (e.g. other queries conducted by people who searched “What is Wikipedia?”) lub inne odwiedzane witryny. I oczywiście nie mówi nam to niczego, co pozwoliłoby nam powiązać dane z osobą lub jej urządzeniem.

Czy istnieje zewnętrzna walidacja metodologii Web Discovery Project?

Metodologia Web Discovery Project opiera się na wcześniejszej metodologii (znanej jako „Human Web”) stworzonej przez Cliqz w 2016 roku. Jest w produkcji od tego czasu, bez znanych awarii. Brave ported the methodology to the Brave Browser, and expanded with additional systems to ensure privacy, such as using n-out-of-k secret sharing schemes, as well as conducting further privacy and security reviews. W przypadku zewnętrznych audytów działa program HackerOne.

Czy mogę zrezygnować z Web Discovery Project, nawet po wyrażeniu zgody?

Domyślnie wszyscy użytkownicy są wyłączeni z Web Discovery Project. If you’ve chosen to opt in, you can opt out again at any time. Bez względu na to, co wybierzesz—wyrażenie zgody lub jej wycofanie—twoje doświadczenia w Brave lub Brave Search nie ulegną zmianie.

Aby zrezygnować, otwórz nową kartę w przeglądarce Brave i kliknij Ustawienia. Przewiń do „Web Discovery Project” i wyłącz to ustawienie.

Co się stanie z danymi, które dostarczam? Czy można je usunąć?

Nie. Ze względu na zasadę nierozłączalności zapisów, nie mamy możliwości określenia, które dane dostarczałeś (naruszałoby to politykę prywatności Brave i nasze własne zasady etyki). Dane przesłane do Brave trafiają do wspólnej puli i są nie do odróżnienia od danych dostarczonych przez inne osoby lub urządzenia. Nie możemy usunąć danych, które na początku nie są powiązane z Tobą.

Czy istnieje polityka przechowywania danych?

Web Discover Project data is not personal data as defined under laws like the EU General Data Protection Regulation. Nie można ich powiązać z żadnym pojedynczym użytkownikiem ani jego urządzeniami, ani wykorzystać do identyfikacji poszczególnych osób. Chociaż brak jest prawnego obowiązku określania okresu przechowywania tego rodzaju danych nieosobowych, zdecydowaliśmy się usuwać te dane rok po ich zgromadzeniu.

Czy udział w Web Discovery Project wpływa na wydajność?

Web Discovery Project jest lekki i działa wyłącznie w tle. Nie powinno być zauważalnego wpływu na prędkość przeglądania, prędkość renderowania stron ani inne podobne wskaźniki. Może jednak wystąpić niewielkie (ale prawdopodobnie niezauważalne) obciążenie w postaci dodatkowego zużycia CPU i pasma. Note that the Web Discover Project only runs on desktop devices, so there is no impact on mobile data plans. If you notice performance issues, please notify us immediately.

Czy Web Discovery Project jest crawlerem?

W pewnym sensie, tak. Web Discovery Project przetwarza zadania pobierania z crawlera internetowego Brave. Co kilka sekund lub minut przeglądarka może otrzymać polecenie pobrania strony internetowej i przesłania HTML z powrotem do Brave. Jednak to pobieranie nie wpływa na historię przeglądania ani pliki cookie—jest wykonywane jako prywatne wywołanie API fetch. Dla dodatkowego bezpieczeństwa domeny zadań pobierania są wybierane z niewielkiego zestawu nieszkodliwych i renomowanych domen.

Jak Web Discovery Project obsługuje strony wymagające uwierzytelnienia lub strony zawierające dane osobowe?

Wszystkie przesyłane URL muszą być publicznie dostępne—tzn. ich treść powinna być taka sama niezależnie od tego, kto je dostarcza. Może to być prawdą tylko wtedy, gdy strony te nie są chronione przez logowanie, sesje indywidualne lub inną autoryzację. Każdy przesyłany URL musi zostać odwiedzony przez co najmniej 20 różnych osób, co ustanawia rozproszony kworum podobny do k-anonimowości.

Additionally, there are a variety of heuristics applied to rule out URLs that encode access i.e. capability URLs (such as shared docs, Dropbox links, invoice links, etc). Z założenia żadne z tych adresów URL nie są wysyłane. I nawet jeśli w jakiś sposób by były, protokół niezależności rekordów oznacza, że nikt, kto ma dostęp do danych, nie mógłby odzyskać innych adresów URL z tego samego źródła ani powiązać jakichkolwiek danych z kimkolwiek.

Powyższe zabezpieczenia dotyczą również zapytań wyszukiwania. Każde zapytanie zawierające coś, co wygląda na dane osobowe, takie jak adresy e-mail, numery telefonów lub hashe, jest automatycznie odrzucane zamiast wysyłane.

Czy mogę zarabiać Nagrody Brave za udział w Web Discovery Project?

In the future, we may offer BAT to those who opt in to the Brave Discovery Project. Jednak na początku musimy rozwiązać pewne problemy związane z oszustwami, dlatego jeszcze tego nie wdrożyliśmy. Mamy nadzieję, że wkrótce będziemy mieli aktualizacje na ten temat.

Gdzie mogę znaleźć kod źródłowy i więcej szczegółów technicznych dotyczących Web Discovery Project?

Przegląd Web Discovery Project można znaleźć w repozytorium GitHub firmy Brave.
Przeczytaj nadrzędny plik README.
Wyświetl kod źródłowy.

If you spot a potential problem, please create an issue on the repo, or contact us.

Artykuły w tej sekcji

Czym jest Web Discovery Project? Obserwuj

Dlaczego stworzyliśmy Web Discovery Project

Kontekst

Ochrona braku powiązań

Artykuły w tej sekcji

Dlaczego stworzyliśmy Web Discovery Project

Kontekst

Ochrona braku powiązań

Powiązane artykuły