Что такое Web Discovery Project в Brave? – Центр помощи

Web Discovery Project — это способ конфиденциального вклада в развитие и независимость Поиска Brave. Если вы согласитесь, вы предоставите анонимные данные о поисковых запросах и посещенных веб-страницах в Браузере Brave (включая страницы, посещенные через некоторые, но не все, другие поисковики). Эти данные помогают формировать независимый индекс Поиска Brave и обеспечивают показ релевантных результатов для ваших поисковых запросов, а также поддерживают более релевантные взаимодействия с продуктами и услугами Brave. Под «данными» мы понимаем поисковые запросы, клики по результатам поиска, URL-адреса страниц, посещенных в браузере, время, проведенное на этих страницах, и некоторые метаданные о самих страницах.

Web Discovery Project работает в фоновом режиме, поэтому не требует никаких усилий со стороны участников. Данные, предоставленные вами, не могут быть связаны с вами или скомпонованы вместе, что предотвращает попытки деанонимизации. Вы можете отключить это в любое время.

💡Чтобы отключить P3A в Android: Настройки --> Защита и конфиденциальность Brave --> Web Discovery Project

Почему мы создали Web Discovery Project

Предоставление релевантных результатов поиска является ключевым для создания поисковика, который люди хотят использовать. Это то, как мы создаем частный поисковик, который по качеству и полноте конкурирует с большим технологическим сектором. Чтобы обеспечить максимально релевантные результаты поиска, Brave нужно понимать ключевые вещи, включая:

Насколько точно результаты поиска соответствуют поисковым ключевым словам (точное совпадение слов, частичное совпадение или синонимы)
Насколько недавно выполнены поисковые запросы для этих ключевых слов
Как часто кликают по результату поиска для данного ключевого слова
Насколько популярны поисковые ключевые слова
Какие страницы популярны или новы
Какие сайты позволяют сканирование только поисковому роботу Google

Обеспечение релевантности также означает уменьшение «шума» от веб-контента, который делает поиск менее релевантным. Например, если вы ищете «погода в Европе» и видите результаты, связанные с европейской историей или бизнесом, вы бы сочли, что результаты менее релевантны вашему запросу. Обучение с помощью Web Discovery Project позволяет Поиску Brave отфильтровывать этот шум, но при этом сохранять конфиденциальность. Обеспечение релевантности поиска не должно происходить за счет вашей онлайн-конфиденциальности.

Контекст

Большинство поставщиков поиска, таких как Google и Microsoft, собирают данные о вашем поведении в поиске, как в поисковике, так и в браузере (напоминаем, такие как Chrome или Edge). Эти данные включают ваши запросы, какие результаты поиска вы кликаете, URL-адреса посещенных вами страниц, время, проведенное на этих страницах, и метаданные (например, заголовки страниц, тип контента и т. д.) о самих страницах. Другие, НЕнезависимые поисковики (такие как DuckDuckGo) не обязательно сами собирают данные. Но они продолжают полагаться на такой сбор через их зависимость от других индексов большого технологического сектора (таких как Bing). И эти данные могут и часто ассоциируются с вами лично.

Поставщики поиска собирают такого рода данные для непрерывного роста своих индексов—списка миллиардов веб-страниц, которые они используют для предоставления результатов—и для обеспечения того, чтобы результаты всегда были релевантными и свежими. Этот сбор не является чем-то внешне плохим. Но его недостатки становятся очевидными, когда вы обращаете внимание на альтернативный способ Brave:

Web Discovery Project позволяет вам вносить анонимные обобщённые данные.
Web Discovery Project разработан таким образом, чтобы мы не могли связать эти данные с вами. Это означает, что у Brave нет данных для продажи рекламодателям или потери из-за кражи или взлома, позволяя нам обещать это через технологии, а не слова.
Web Discovery Project от Brave доступен только по согласию и полностью прозрачен.

Защита от связываемости данных

Brave не использует скрытые практики других крупных технологических поисковиков. Web Discovery Project работает только по согласию, а данные, собираемые в рамках Web Discovery Project, имеют особую защиту для обеспечения анонимности. Помимо этой защиты, Web Discovery Project придерживается принципа «несвязываемости». Это означает, что мы не связываем данные с вами, вашим Браузером или вашим Устройством. Поиск Brave не имеет понятия пользовательского или сеансового идентификатора, что предотвращает возможность связывания записей. Кроме того, Web Discovery Project включает несколько механизмов защиты, предотвращающих включение веб-сайтов или поисковых запросов, специфичных для вас, либо содержащих личную или конфиденциальную информацию.

Какие ключевые слова ищутся чаще всего? На какие сайты ведут эти ключевые слова? Как происходит взаимодействие с этими сайтами? Такие направляющие вопросы помогают Поиску Brave ориентироваться в мире доступных веб-страниц и отделять сигнал от шума. Это, в свою очередь, помогает нам понять, какие части веба стоит индексировать для пользователей.

Что собирает Web Discovery Project, как и зачем

Если вы согласитесь участвовать в Web Discovery Project, ваш браузер будет обрабатывать следующие данные на вашем устройстве и безопасно отправлять их на серверы Brave:

Часть адресов (URL) посещённых веб-страниц в Brave Браузере вместе с метриками вовлечённости (например, как много времени проведено на странице)
Часть запросов (например, "Погода в Нью-Йорке сегодня") выполненных в некоторых поисковиках (вне Поиска Brave) в Brave Браузере, вместе с соответствующими кликами по результатам (если таковы были)
Метаданные этих посещённых страниц (например, если страница содержит видео, информацию об авторе или владельце страницы, заголовок страницы и т.д.), никогда само содержимое страницы.
Для полного списка, ознакомьтесь с репозиторием Brave на GitHub

С этими данными, Brave может узнать (в частном, ненадёжно связываемом виде) такие вещи, как сколько посещений сайта (например, Википедия) длились дольше 20 секунд или сколько раз заданный запрос (например, "Что такое Википедия?") привёл пользователя к клику по этому сайту. Это калибрует Поиск Brave, чтобы он знал, что сайт является легитимным и что пользователи находят содержимое ценным. Это, в свою очередь, позволяет поисковику понять релевантность результата и выдавать страницы с более высокой релевантностью в верхних строчках результатов поиска.

Эти данные не позволят Brave узнать такие вещи, как ассоциированные запросы (например, другие запросы, сделанные людьми, которые искали "Что такое Википедия?") или другие посещённые сайты. И, конечно, это не сообщает нам ничего, что могло бы позволить нам связать данные с конкретным человеком или его устройством.

Существует ли внешняя проверка методологии Web Discovery Project?

Методология Web Discovery Project основана на более ранней методологии (известной как «Human Web»), созданной Cliqz в 2016 году. Она используется с тех пор, без известных сбоев. Brave перенёс методологию на Brave Браузер и расширил её дополнительными системами для обеспечения конфиденциальности, такими как использование n-out-of-k схемами секретного распределения, а также проведение дополнительных проверок конфиденциальности и безопасности. Для внешних аудитов существует программа HackerOne.

Могу ли я отказаться от участия в Web Discovery Project даже после того, как согласился?

По умолчанию все пользователи не участвуют в Web Discovery Project. Если вы выбрали принять участие участвовать, вы можете отказаться в любое время. Что бы вы не выбрали—участвовать или не участвовать—ваш опыт использования Brave или Поиска Brave не изменится.

Чтобы отказаться от участия, откройте новую вкладку в Браузере Brave и нажмите Настройки. Прокрутите до пункта «Web Discovery Project» и отключите этот параметр.

Что происходит с данными, которые я предоставляю? Можно ли их удалить?

Нет. Из-за принципа невозможности связывания записей мы не можем определить, какие данные вы предоставили (это нарушило бы Политику конфиденциальности Brave и нашу собственную этику). Данные, отправленные в Brave, попадают в общий пул и неотличимы от данных, предоставленных другими людьми или устройствами. Мы не можем удалить данные, которые изначально не связаны с вами.

Существует ли политика хранения данных?

Web Discover Project data is not personal data as defined under laws like the EU General Data Protection Regulation. Они не могут быть связаны с каким-либо человеком или его устройствами, или использованы для идентификации людей. Хотя нет юридической обязанности устанавливать период хранения для таких неперсональных данных, мы решили удалять данные через год после их сбора.

Влияет ли участие в Web Discovery Project на производительность?

Web Discovery Project легковесен и работает только в фоновом режиме. Не должно быть заметного влияния на скорость просмотра, скорость отрисовки страниц или другие подобные метрики. Однако может быть небольшая (но, вероятно, незаметная) нагрузка в виде дополнительного использования ЦП и пропускной способности. Note that the Web Discover Project only runs on desktop devices, so there is no impact on mobile data plans. Если вы заметите проблемы с производительностью, сообщите нам об этом немедленно.

Является ли Web Discovery Project краулером?

В некотором смысле, да. Web Discovery Project обрабатывает задачи по загрузке данных от веб-краулера Brave. Каждые несколько секунд или минут на браузер может поступить команда для извлечения веб-страницы и отправки HTML обратно в Brave. Однако это извлечение не влияет на вашу историю браузера или cookies — оно выполняется в виде приватного вызова API fetch. Для дополнительной безопасности домены задач извлечения предварительно выбираются из небольшого набора безобидных и авторитетных доменов.

Как Web Discovery Project обрабатывает страницы с аутентификацией или страницы с личной информацией?

Все отправляемые URL должны быть общедоступны—то есть у них должно быть одинаковое содержание независимо от того, кто их предоставляет. Это возможно только в том случае, если страницы не защищены логином, индивидуальной сессией или другой аутентификацией. Все отправляемые URL должны быть посещены как минимум 20 разными людьми, что создаёт распределённый кворум, схожий с k-анонимностью.

Кроме того, применяется множество эвристик, чтобы исключить URL-адреса, которые кодируют доступ, т.е. URL-адреса возможностей (например, общие документы, ссылки Dropbox, ссылки на счета и т.п.). По задумке, ни один из этих URL-адресов не отправляется. А даже если бы они как-то и отправились, протокол разрыва связи записей означает, что никто, имея доступ к данным, не смог бы восстановить другие URL-адреса с того же источника или сопоставить любые данные с кем-либо.

Указанные выше защиты также применяются к поисковым запросам. Любой запрос, содержащий что-то вроде личных данных, таких как электронные письма, номера телефонов или хэши, автоматически отклоняется, а не отправляется.

Могу ли я получать Награды Brave за участие в Web Discovery Project?

In the future, we may offer BAT to those who opt in to the Brave Discovery Project. Однако сначала необходимо решить некоторые вопросы, связанные с мошенничеством, поэтому мы еще не внедрили это. Мы надеемся, что вскоре у нас будут обновления по этому вопросу.

Где я могу найти исходный код и более подробную техническую информацию о Web Discovery Project?

Обзор Web Discovery Project можно найти в репозитории Brave на GitHub.
Прочитайте README верхнего уровня.
Просмотрите исходный код.

Если вы заметите потенциальную проблему, пожалуйста, создайте обращение в репозитории, или свяжитесь с нами.

Статьи в этом разделе

Что такое Web Discovery Project в Brave? Подписаться

Почему мы создали Web Discovery Project

Контекст

Защита от связываемости данных

Статьи в этом разделе

Почему мы создали Web Discovery Project

Контекст

Защита от связываемости данных

Похожие статьи