В подтверждении тезиса о том, что оставленная в интернете информация остается в нем навсегда, студент Амстердамского Университета с нелегким именем Matthijs R. Koot составил огромную базу данных интернет-пользователей. Его справочник включает имена, почтовые адреса, а также биографию 35 миллионов самых разных людей. Много, - скажешь ты? Нет, - ответит Matthijs R. Koot, - не много. Свою базу он собрал за один месяц.

Наградой трудолюбивому нидерландцу стал бесценный экзистенциальный опыт. Пытливому юноше было интересно узнать как легко собираются данные в интернете, каких трудов стоит какому-нибудь частному детективу насобирать персональной информации, к примеру, на  Google Profiles, в объеме, достаточном для вознаграждения трудов. Ответ перед нами: проще простого! Сами Google Profiles открыты для всех и  совершенно не против индексации информации, в отличие, например, от Facebook, чья политика запрещает вышеупомянутое под страхом смерти через отрубание головы.

Успех предприятия мистера Кута в том, что инженеры Гугла не отказывают в доступе к информации, фактически все записи о клиентах собраны в одном файле, названном profiles-sitemap.xml. Сам код голландского студента, используемый для сбора данных, находится  здесь.

"Как все это началось? Мне было скучно и я написал небольшой скриптик чтобы скачать все файлы типа sitemap-NNN(N).txt - сначала скачал 10 000, потом 100 000, пока не добрался до 1 000 000. Я был удивлен не встретив никакого сопротивления или CAPTCHA. Воодушевленный, я выпил зеленого чаю и скачал остальные 34 000 000".

В своем блоге на Blogger простой парень из Амстердама написал, что его действия служат высокой исследовательской цели и попросил не искать в них подводных камней.

"Я очень любопытный, - делится Koot, - а сейчас мне любопытнее всего, например, что может остановить другого любопытного человека от скачивания целых архивов пользовательских данных. Интересно посмотреть как отреагирует Google: предпримут ли действия для защиты персональной информации своих пользователей или продолжат делать вид, что это не важно".

Google выступил с официальным заявлением: "Буду краток: общедоступная пользовательская информация легко находится нажатием кнопки поиска. Для получения доступа к ней не нужно быть и трех пядей во лбу. Информация, полученная таким образом, не нарушает ничьих прав. Ну вы знаете, - подмигнул сотрудник, - публичная информация такая публичная…".

А между тем, Google – не единственные безалаберные стражи пользовательских данных, у которых дудочники вроде Р. Кута уводят клиентов из-под самого носа. В июне, например, независимый (имя им – легион) исследователь скомпилировал в один файл имена и URL 100 000 000 пользователей Фэйсбука и разместил для свободного скачивания. Все загрузившие релиз независимого исследователя получили доступ к этим самым страницам безотносительно того, закрыли свои профили пользователи или нет.

Аналогично Гуглу, Фэйсбук позволяет настроить профиль таким образом, чтобы страница не индексировалась, но – увы – для жертв независимого исследователя по-прежнему нет хороших новостей.

"Всю базу я загрузил с одного IP. Хочу, чтобы впредь люди думали, прежде чем постить что-нибудь на Гугл, Твиттере, Фэйсбуке или других Web 2.0 сервисах: не будете осторожными - окажетесь в ежовых рукавицах".