Законность и этичность скрейпинга веб-страниц
17 April 2023
Инфраструктура Astro работает в качестве надежного партнера с точки зрения сбора данных. Давая пользователям возможность купить приватные прокси с геотаргетингом из 100+ стран, мы являемся востребованным сайтом прокси сервером для веб-скрейпинга. И поскольку вопрос о легальности парсинга актуален для многих, нас часто спрашивают о юридических аспектах. Сегодня наша команда постарается развеять ряд распространенных заблуждений о них. Мы попытаемся объяснить, почему дата-харвестинг — это нормально, и почему вы можете смело купить приватные прокси для этих целей.
Заблуждения о скрейпинге с сайтами прокси серверами
Это незаконно. Зависит от того, что и как извлекается при харвестинге. Скрейпинг можно сравнить с фотографированием. В 99% случаев делать снимки — не проблема. Но вот если люди фотографируют запретные огороженные зоны или конфиденциальные документы и бумаги начальства, то трудности будут.
Это похоже на хакинг. Киберпреступления подразумевают попытку получить доступ к системе и данным нестандартными способом. Когда речь идет о скрейпинге, то такие программы взаимодействуют с веб-страницами так же, как и обычные пользователи, только в автоматическом режиме. То есть не происходит взлома или эксплуатации технических уязвимостей. Так что смело можете попробовать прокси для этих целей, все в рамках закона.
Это напоминает кражу информации. Скрейпинг означает сбор общедоступной информации. Можно ли украсть нечто общедоступное? Ответ — нет.
Принципы этичного дата-харвестинга
Предположим, вы обращаетесь к Astro, чтобы купить приватные прокси или попробовать прокси бесплатно для своего скрейпера. Перед тем, как начать, проверьте, соответствует ли ваша программа законам и этическим нормам. Вот базовые:
- Скрейпер не имеет своей целью перегрузить целевую страницу;
- Получаемая информация находится в открытом доступе и не защищена паролем;
- Данные должны использоваться с соблюдением этических норм, например, для анализа продуктов или для ценообразования. Не пытайтесь выдать себя за целевую страницу с целью обмана или переманить ее посетителей;
- Полученная информация не относится к типу личной и не защищена копирайтом.
Обратите внимание на последний принцип. Проблем со сбором общедоступных данных нет, но вот если в общем доступе лежат персональные данные — возможны варианты. Некоторые юрисдикции налагают ограничения на их сбор. Кроме того, данные, защищенные копирайтом, также собирать не стоит.
Итак, старайтесь собирать как можно меньше личных данных. Если человека по ним можно идентифицировать сходу — это запрещено. Если идентифицировать можно опосредованно — то, в зависимости от страны, это тоже тонкий лед.
Суммируем: если думаете использовать сайт прокси сервер Astro, чтобы купить приватные прокси или попробовать прокси бесплатно, избегайте такой информации, как:
- Официальные данные, например, имя и фамилия, дата рождения, место регистрации и проживания, номера ID и информация о трудовой деятельности;
- Контактная информация, например, номер мобильного телефона и электронная почта;
- Данные о поведении пользователей из приложений;
- Биометрия.
Если вы случайно извлечете такую информацию, не публикуйте и не храните ее. Лучше сразу удалите. То же самое относится и к контенту, защищенному авторским правом.
Платформа Astro рада сотрудничеству со всеми законопослушными компаниями, которые следуют нормам KYC/AML. Охватывая 100+ стран, наша экосистема делает все возможное, чтобы прокси использовались в соответствии с этическими нормами и правилами. То есть, если вам нужны данные для деловых и научных целей, без намерения нарушить права чьей-то интеллектуальной собственности или нормы защиты персональных данных, обращайтесь! Служба поддержки клиентов нашего сайта прокси сервера, база знаний, статьи и прокси из белых списков будут работать на вас круглосуточно.