Что такое Web Discovery Project в Brave? Подписаться
Web Discovery Project — это способ конфиденциального вклада в развитие и независимость Поиска Brave. Если вы согласитесь, вы предоставите анонимные данные о поисковых запросах и посещенных веб-страницах в Браузере Brave (включая страницы, посещенные через некоторые, но не все, другие поисковики). Эти данные помогают формировать независимый индекс Поиска Brave и обеспечивают показ релевантных результатов для ваших поисковых запросов, а также поддерживают более релевантные взаимодействия с продуктами и услугами Brave. Под «данными» мы понимаем поисковые запросы, клики по результатам поиска, URL-адреса страниц, посещенных в браузере, время, проведенное на этих страницах, и некоторые метаданные о самих страницах.
Web Discovery Project работает в фоновом режиме, поэтому не требует никаких усилий со стороны участников. Данные, предоставленные вами, не могут быть связаны с вами или скомпонованы вместе, что предотвращает попытки деанонимизации. Вы можете отключить это в любое время.
💡Чтобы отключить P3A в Android: Настройки --> Защита и конфиденциальность Brave -->
Web Discovery Project
Почему мы создали Web Discovery Project
Предоставление релевантных результатов поиска является ключевым для создания поисковика, который люди хотят использовать. Это то, как мы создаем частный поисковик, который по качеству и полноте конкурирует с большим технологическим сектором. Чтобы обеспечить максимально релевантные результаты поиска, Brave нужно понимать ключевые вещи, включая:
- Насколько точно результаты поиска соответствуют поисковым ключевым словам (точное совпадение слов, частичное совпадение или синонимы)
- Насколько недавно выполнены поисковые запросы для этих ключевых слов
- Как часто кликают по результату поиска для данного ключевого слова
- Насколько популярны поисковые ключевые слова
- Какие страницы популярны или новы
- Какие сайты позволяют сканирование только поисковому роботу Google
Обеспечение релевантности также означает уменьшение «шума» от веб-контента, который делает поиск менее релевантным. Например, если вы ищете «погода в Европе» и видите результаты, связанные с европейской историей или бизнесом, вы бы сочли, что результаты менее релевантны вашему запросу. Обучение с помощью Web Discovery Project позволяет Поиску Brave отфильтровывать этот шум, но при этом сохранять конфиденциальность. Обеспечение релевантности поиска не должно происходить за счет вашей онлайн-конфиденциальности.
Контекст
Большинство поставщиков поиска, таких как Google и Microsoft, собирают данные о вашем поведении в поиске, как в поисковике, так и в браузере (напоминаем, такие как Chrome или Edge). Эти данные включают ваши запросы, какие результаты поиска вы кликаете, URL-адреса посещенных вами страниц, время, проведенное на этих страницах, и метаданные (например, заголовки страниц, тип контента и т. д.) о самих страницах. Другие, НЕнезависимые поисковики (такие как DuckDuckGo) не обязательно сами собирают данные. Но они продолжают полагаться на такой сбор через их зависимость от других индексов большого технологического сектора (таких как Bing). И эти данные могут и часто ассоциируются с вами лично.
Поставщики поиска собирают такого рода данные для непрерывного роста своих индексов—списка миллиардов веб-страниц, которые они используют для предоставления результатов—и для обеспечения того, чтобы результаты всегда были релевантными и свежими. Этот сбор не является чем-то внешне плохим. Но его недостатки становятся очевидными, когда вы обращаете внимание на альтернативный способ Brave:
- Web Discovery Project позволяет вам вносить анонимные обобщённые данные.
- Web Discovery Project разработан таким образом, чтобы мы не могли связать эти данные с вами. Это означает, что у Brave нет данных для продажи рекламодателям или потери из-за кражи или взлома, позволяя нам обещать это через технологии, а не слова.
- Web Discovery Project от Brave доступен только по согласию и полностью прозрачен.
Защита от связываемости данных
Brave не использует скрытые практики других крупных технологических поисковиков. Web Discovery Project работает только по согласию, а данные, собираемые в рамках Web Discovery Project, имеют особую защиту для обеспечения анонимности. Помимо этой защиты, Web Discovery Project придерживается принципа «несвязываемости». Это означает, что мы не связываем данные с вами, вашим Браузером или вашим Устройством. Поиск Brave не имеет понятия пользовательского или сеансового идентификатора, что предотвращает возможность связывания записей. Кроме того, Web Discovery Project включает несколько механизмов защиты, предотвращающих включение веб-сайтов или поисковых запросов, специфичных для вас, либо содержащих личную или конфиденциальную информацию.
Какие ключевые слова ищутся чаще всего? На какие сайты ведут эти ключевые слова? Как происходит взаимодействие с этими сайтами? Такие направляющие вопросы помогают Поиску Brave ориентироваться в мире доступных веб-страниц и отделять сигнал от шума. Это, в свою очередь, помогает нам понять, какие части веба стоит индексировать для пользователей.
Если вы согласитесь участвовать в Web Discovery Project, ваш браузер будет обрабатывать следующие данные на вашем устройстве и безопасно отправлять их на серверы Brave:
- Часть адресов (URL) посещённых веб-страниц в Brave Браузере вместе с метриками вовлечённости (например, как много времени проведено на странице)
- Часть запросов (например, "Погода в Нью-Йорке сегодня") выполненных в некоторых поисковиках (вне Поиска Brave) в Brave Браузере, вместе с соответствующими кликами по результатам (если таковы были)
- Метаданные этих посещённых страниц (например, если страница содержит видео, информацию об авторе или владельце страницы, заголовок страницы и т.д.), никогда само содержимое страницы.
- Для полного списка, ознакомьтесь с репозиторием Brave на GitHub
С этими данными, Brave может узнать (в частном, ненадёжно связываемом виде) такие вещи, как сколько посещений сайта (например, Википедия) длились дольше 20 секунд или сколько раз заданный запрос (например, "Что такое Википедия?") привёл пользователя к клику по этому сайту. Это калибрует Поиск Brave, чтобы он знал, что сайт является легитимным и что пользователи находят содержимое ценным. Это, в свою очередь, позволяет поисковику понять релевантность результата и выдавать страницы с более высокой релевантностью в верхних строчках результатов поиска.
Эти данные не позволят Brave узнать такие вещи, как ассоциированные запросы (например, другие запросы, сделанные людьми, которые искали "Что такое Википедия?") или другие посещённые сайты. И, конечно, это не сообщает нам ничего, что могло бы позволить нам связать данные с конкретным человеком или его устройством.
По умолчанию все пользователи не участвуют в Web Discovery Project. Если вы выбрали принять участие участвовать, вы можете отказаться в любое время. Что бы вы не выбрали—участвовать или не участвовать—ваш опыт использования Brave или Поиска Brave не изменится.
Чтобы отказаться от участия, откройте новую вкладку в Браузере Brave и нажмите Настройки. Прокрутите до пункта «Web Discovery Project» и отключите этот параметр.Web Discovery Project легковесен и работает только в фоновом режиме. Не должно быть заметного влияния на скорость просмотра, скорость отрисовки страниц или другие подобные метрики. Однако может быть небольшая (но, вероятно, незаметная) нагрузка в виде дополнительного использования ЦП и пропускной способности. Note that the Web Discover Project only runs on desktop devices, so there is no impact on mobile data plans. Если вы заметите проблемы с производительностью, сообщите нам об этом немедленно.
Все отправляемые URL должны быть общедоступны—то есть у них должно быть одинаковое содержание независимо от того, кто их предоставляет. Это возможно только в том случае, если страницы не защищены логином, индивидуальной сессией или другой аутентификацией. Все отправляемые URL должны быть посещены как минимум 20 разными людьми, что создаёт распределённый кворум, схожий с k-анонимностью.
Кроме того, применяется множество эвристик, чтобы исключить URL-адреса, которые кодируют доступ, т.е. URL-адреса возможностей (например, общие документы, ссылки Dropbox, ссылки на счета и т.п.). По задумке, ни один из этих URL-адресов не отправляется. А даже если бы они как-то и отправились, протокол разрыва связи записей означает, что никто, имея доступ к данным, не смог бы восстановить другие URL-адреса с того же источника или сопоставить любые данные с кем-либо.
Указанные выше защиты также применяются к поисковым запросам. Любой запрос, содержащий что-то вроде личных данных, таких как электронные письма, номера телефонов или хэши, автоматически отклоняется, а не отправляется.
- Обзор Web Discovery Project можно найти в репозитории Brave на GitHub.
- Прочитайте README верхнего уровня.
- Просмотрите исходный код.
Если вы заметите потенциальную проблему, пожалуйста, создайте обращение в репозитории, или свяжитесь с нами.