Czym jest Web Discovery Project? Obserwuj
Web Discovery Project to chroniący prywatność sposób, w jaki możesz przyczynić się do rozwoju i niezależności Brave Search. Jeśli się zdecydujesz, przyczynisz się do udostępnienia anonimowych danych o wyszukiwaniach i odwiedzanych stronach internetowych w przeglądarce Brave (w tym o stronach znalezionych przez niektóre, ale nie wszystkie, inne wyszukiwarki). Te dane pomagają budować niezależny indeks Brave Search i zapewniają wyświetlanie odpowiednich wyników dla zapytań wyszukiwania oraz wsparcie bardziej odpowiednich doświadczeń z produktami i usługami Brave. Przez „dane” rozumiemy zapytania wyszukiwania, kliknięcia wyników wyszukiwania, URL odwiedzanych stron w przeglądarce, czas spędzony na tych stronach oraz niektóre metadane o samych stronach.
Web Discovery Project działa w tle, więc nie wymaga żadnego wysiłku ze strony kontrybutorów. Danych udostępnionych nie można powiązać z osobą je udostępniającą ani grupować razem, co zapobiega próbom deanonimizacji. Możesz zrezygnować w dowolnym momencie.
Dlaczego stworzyliśmy Web Discovery Project
Dostarczanie odpowiednich wyników wyszukiwania jest kluczowe dla tworzenia wyszukiwarki, której ludzie chcą używać. Tak tworzymy prywatną wyszukiwarkę, która nadal konkuruje z Big Tech pod względem jakości i kompletności. Aby zapewnić maksymalną trafność wyników wyszukiwania, Brave musi zrozumieć kilka kluczowych rzeczy, w tym:
- Jak dokładnie wyniki wyszukiwania odpowiadają słowom kluczowym (dopasowanie do dokładnych słów, części słów lub synonimów)
- Jak niedawne są wyszukiwania tych słów kluczowych
- Jak często klikany jest wynik wyszukiwania dla danego słowa kluczowego
- Jak popularne są słowa kluczowe wyszukiwania
- Jakie strony są popularne lub nowe
- Które witryny pozwalają na indeksowanie tylko przez bota wyszukiwarki Google
Zabezpieczanie trafności oznacza również zmniejszenie „szumu” z treści internetowych, które sprawiają, że wyszukiwanie jest mniej trafne. Na przykład, jeśli szukasz „pogoda w Europie” i widzisz wyniki dotyczące historii Europy lub biznesu europejskiego, powiesz, że wyniki są mniej trafne dla twojego zapytania. Uczenie się dzięki Web Discovery Project umożliwia Brave Search odfiltrowanie tego szumu, ale w sposób chroniący prywatność. Uczynienie wyszukiwania bardziej trafnym nie powinno odbywać się kosztem twojej prywatności online.
Kontekst
Większość dostawców wyszukiwania — jak Google i Microsoft — zbiera dane o twoim zachowaniu w wyszukiwaniu, zarówno w wyszukiwarce, jak i przeglądarce (takiej jak Chrome lub Edge). Dane te obejmują twoje zapytania, na które wyniki wyszukiwania klikasz, URL odwiedzanych stron, czas spędzony na tych stronach oraz metadane (takie jak tytuł strony, typ treści, itp.) dotyczącą samych stron. Inne, nie-niezależne wyszukiwarki (jak DuckDuckGo) niekoniecznie zbierają dane same. Ale nadal polegają na takim zbieraniu danych poprzez swoją zależność od innych indeksów Big Tech (jak Bing). I te dane mogą — i często są — powiązane z tobą osobiście.
Dostawcy wyszukiwania zbierają tego rodzaju dane, aby nieustannie rozwijać swoje indeksy — listy miliardów stron internetowych, z których czerpią wyniki — oraz zapewniać, że wyniki są trafne i nigdy nie są przestarzałe. To zbieranie samo w sobie nie jest złe. Ale jego niedoskonałości stają się widoczne, gdy spojrzysz na alternatywną drogę Brave:
- Web Discovery Project pozwala Ci przekazywać anonimowe, uogólnione dane.
- Web Discovery Project został zaprojektowany tak, aby uniemożliwić nam powiązanie tych danych z Tobą. Oznacza to, że Brave nie ma danych do sprzedaży reklamodawcom, ani nie ma co utracić wskutek kradzieży lub włamania, co pozwala nam obiecywać przez technologię, a nie słowa.
- Web Discovery Project firmy Brave działa wyłącznie na zasadzie opt-in i jest całkowicie przejrzysty.
Ochrona braku powiązań
Brave nie stosuje podstępnych praktyk innych dużych wyszukiwarek technologicznych. Web Discovery Project działa na zasadzie opt-in, a dane zbierane w ramach Web Discovery Project mają szczególne zabezpieczenia gwarantujące anonimowość. Oprócz tych zabezpieczeń Web Discovery Project przestrzega zasady „braku możliwości powiązania”. Oznacza to, że nie łączymy danych z Tobą, Twoją przeglądarką lub Twoim urządzeniem. Brave Search nie ma pojęcia o identyfikatorze użytkownika lub sesji, co uniemożliwia powiązanie rekordów. Ponadto Web Discovery Project obejmuje wiele zabezpieczeń, które zapobiegają uwzględnianiu witryn lub wyszukiwań charakterystycznych dla Ciebie albo zawierających dane osobowe lub poufne.
Jakie słowa kluczowe są najczęściej wyszukiwane? Do jakich witryn prowadzą te słowa kluczowe? Jak są te witryny używane? Tego rodzaju pytania kierunkowe pomagają Brave Search nawigować w świecie dostępnych stron internetowych i oddzielać sygnały od szumu. A to z kolei pomaga nam zrozumieć, które części sieci warto indeksować dla użytkowników.
Jeśli zdecydujesz się na udział w Web Discovery Project, Twoja przeglądarka będzie przetwarzać następujące dane na Twoim urządzeniu i bezpiecznie wysyłać je na serwery Brave:
- Ułamek adresów (URL) odwiedzanych stron internetowych w Brave Browser wraz z metrykami zaangażowania (ile czasu spędzono na stronie)
- Ułamek zapytań (np. „pogoda w Nowym Jorku dzisiaj”) przeprowadzonych w niektórych wyszukiwarkach (poza Brave Search) w Brave Browser, wraz z powiązanym kliknięciem wyniku (jeśli występuje)
- Metadane tych odwiedzanych stron (np. jeśli strona zawiera wideo, informacje o autorze lub właścicielu strony, tytuł strony itp.), nigdy treść samej strony.
- Pełną listę znajdziesz w repozytorium GitHub Brave
Dzięki tym danym Brave może się nauczyć (w prywatny, niepowiązany z użytkownikiem sposób) rzeczy, takie jak ile odwiedzin witryny (np. Wikipedia) trwało dłużej niż 20 sekund, lub ile razy dane zapytanie (np. „Co to jest Wikipedia?”) skłoniło użytkownika do kliknięcia w tę witrynę. To kalibruje Brave Search, aby wiedziało, że witryna jest wiarygodna i że użytkownicy uważają jej zawartość za wartościową. To z kolei pozwala wyszukiwarce zrozumieć relewantność wyników i wyświetlać strony o wyższej relewantności na górze wyników wyszukiwania.
This data does not allow Brave to know things like associated queries (e.g. other queries conducted by people who searched “What is Wikipedia?”) lub inne odwiedzane witryny. I oczywiście nie mówi nam to niczego, co pozwoliłoby nam powiązać dane z osobą lub jej urządzeniem.
Domyślnie wszyscy użytkownicy są wyłączeni z Web Discovery Project. If you’ve chosen to opt in, you can opt out again at any time. Bez względu na to, co wybierzesz—wyrażenie zgody lub jej wycofanie—twoje doświadczenia w Brave lub Brave Search nie ulegną zmianie.
Aby zrezygnować, otwórz nową kartę w przeglądarce Brave i kliknij Ustawienia. Przewiń do „Web Discovery Project” i wyłącz to ustawienie.
Web Discovery Project jest lekki i działa wyłącznie w tle. Nie powinno być zauważalnego wpływu na prędkość przeglądania, prędkość renderowania stron ani inne podobne wskaźniki. Może jednak wystąpić niewielkie (ale prawdopodobnie niezauważalne) obciążenie w postaci dodatkowego zużycia CPU i pasma. Note that the Web Discover Project only runs on desktop devices, so there is no impact on mobile data plans. If you notice performance issues, please notify us immediately.
Wszystkie przesyłane URL muszą być publicznie dostępne—tzn. ich treść powinna być taka sama niezależnie od tego, kto je dostarcza. Może to być prawdą tylko wtedy, gdy strony te nie są chronione przez logowanie, sesje indywidualne lub inną autoryzację. Każdy przesyłany URL musi zostać odwiedzony przez co najmniej 20 różnych osób, co ustanawia rozproszony kworum podobny do k-anonimowości.
Additionally, there are a variety of heuristics applied to rule out URLs that encode access i.e. capability URLs (such as shared docs, Dropbox links, invoice links, etc). Z założenia żadne z tych adresów URL nie są wysyłane. I nawet jeśli w jakiś sposób by były, protokół niezależności rekordów oznacza, że nikt, kto ma dostęp do danych, nie mógłby odzyskać innych adresów URL z tego samego źródła ani powiązać jakichkolwiek danych z kimkolwiek.
Powyższe zabezpieczenia dotyczą również zapytań wyszukiwania. Każde zapytanie zawierające coś, co wygląda na dane osobowe, takie jak adresy e-mail, numery telefonów lub hashe, jest automatycznie odrzucane zamiast wysyłane.
- Przegląd Web Discovery Project można znaleźć w repozytorium GitHub firmy Brave.
- Przeczytaj nadrzędny plik README.
- Wyświetl kod źródłowy.
If you spot a potential problem, please create an issue on the repo, or contact us.