Каждый раз, когда вы заходите в интернет, вы невольно открываете миру все свои самые сокровенные мысли и чувства. С такой откровенностью глубоко верующие люди исповедуются священнику. Только в нашем случае тайну "исповеди" пользователей Сети никто хранить не обязан. И вся ваша конфиденциальная информация легко может стать предметом публичного обсуждения.
Думаете, для этого надо устроить за вами слежку? Ничего подобного! Достаточно просто проанализировать ваше поведение в социальной сети.
Психологи Кембриджского университета изучали, как ставят лайки (значок "нравится") 58 тысяч пользователей Фейсбука. В итоге ученые научились с точностью в 95 процентов устанавливать национальность человека и в 82 случаях из 100 могли отличать пользователя христианина от мусульманина. При этом они почти безошибочно определяют вашу, пардон, сексуальную ориентацию. Даже если вы тщательно шифруетесь! С вероятностью 88 процентов обработчики компьютерных данных могут определить, нравятся ли вам мальчики или девочки, всего лишь анализируя, какие фильмы, эстрадные хиты, бренды одежды и кулинарные блюда вы предпочитаете.
Дженнифер Голбек, специалист по компьютерному анализу социальных сетей из Университета Мэриленда, утверждает, что после обработки цифровых следов, которые вы в большом количестве оставляете после каждого захода в интернет, все свойства вашей личности проявляются как на ладони.
"Ваша дочь беременна!"
Большая наука приходит к простому человеку порой в самом экстравагантном виде. Стоит привести классический случай, когда технология компьютерной обработки Big Date (Больших данных) пришла в дом одного из американцев в виде... скидочных купонов на одежду и аксессуары для новорожденных. Отец семейства был возмущен, поскольку товары для беременных предлагались его 15-летней дочери. Отправился к менеджеру магазина "Таргет" (это одна из крупнейших сетей розничной торговли в США) и устроил скандал.
- Вы развращаете несовершеннолетних! Как вы смеете предлагать товары для беременных моей дочери, когда она еще в школу ходит! - орал отец в порыве благородного гнева.
Через несколько дней рассерженному мужчине позвонил менеджер торговой сети, чтобы принести свои извинения. Но оказалось, что инцидент исчерпан: старшеклассница призналась родителям, что она действительно ждет ребенка.
- Но как вы узнали об этом за две недели до того, как она рассказала об этом нам? - недоумевал расстроенный отец.
Оказалось, тщательно скрываемое положение школьницы было вычислено компьютерной системой прогнозирования беременности, которую создал аналитик компании "Таргет" Эндрю Пол. Он является одним из 50 сотрудников аналитического отдела, на содержание которого ежегодно тратится 4 миллиона долларов. Менеджеры компании поставили перед Полом задачу: составить программу, которая бы в режиме онлайн определяла, что женщина забеременела. "Таргет" важно было первой предложить даме товары, которые она будет заказывать для себя и своего малыша. Для определения "индекса беременности" были проанализированы поведенческие шаблоны сотен тысяч потребительниц. Ключевые штрихи сами по себе на первый взгляд ни о чем не говорили. Например, девушка купила витаминов больше, чем обычно. Или забила в поисковике "самый эффективный способ бросить курить"... Но, сопоставив эти и другие события, компьютерная программа с точностью в 87 процентов выносит вердикт: женщина ждет ребенка.
Все под колпаком
В действительности технологии анализа данных предназначены отнюдь не только для увеличения продаж подгузников. Например, российская компания SocialDataHub, занимающаяся анализом больших данных, в считанные часы смогла опознать террориста-смертника, подорвавшего в апреле поезд в питерской подземке. Имея в своем распоряжении фотографию оторванной головы предполагаемого преступника, компьютерщики с помощью программы распознавания лиц в считанные часы нашли шесть страничек Акбаржона Джалилова в социальных сетях.
Эти технологии все чаще используются для отслеживания политической активности граждан. Та же SocialDataHub за три дня до протестных акций оппозиции, которые прошли недавно в Москве, выложила исследование "Сколько человек придут на митинг 12 июня - и кто они".
Для начала аналитики изучили фотографии с более раннего протестного митинга 26 марта (все фото находились в открытом доступе) и с помощью алгоритма распознавания лиц нашли в соцсетях аккаунты участников мартовских событий. Их оказалось 37 тысяч, и школьников среди них было немного - 3 - 4%. Программисты фильтровали информацию о социальном статусе этих людей, анализировали, насколько часто они лайкали и комментировали оппозиционные посты в соцсетях, подсчитывали, сколько человек заявило о намерении участвовать в митинге и сколько на самом деле пришло. В итоге по аналогии с "индексом беременности" они составили модель поведения людей, на основе которой спрогнозировали число митингующих 12 июня. Точность цифр - это дискуссионный вопрос, но профили этих людей оказались как на ладони, что, наверное, порадовало спецслужбы. Ядро протестантов - это офисные работники, они составляют 30%, студенты - 18%, школьники - 9%.
"Мы знаем, что вы делали сегодня ночью"
В Сети не осталось места, где человек может быть незамеченным. Лучшая иллюстрация на эту тему - другое исследование SocialDataHub. На сайтах для взрослых они собрали фотографии 27 856 женщин и 1387 мужчин, которые предлагают любовь за деньги. С помощью технологии распознавания лиц отыскали реальные аккаунты этих людей в социальных сетях. И составили рейтинг вузов, чьи выпускники чаще всего зарабатывают на панели.
- Забудьте об анонимности в Сети, ее не существует, - утверждает Артур Хачуян, один из руководителей SocialDataHub.
И, пожалуй, он прав. Мы все под колпаком.
Вопрос - ребром
Как укрыться от всевидящего ока?
Что делать: закрывать свои странички в соцсетях, оставляя право доступа только для близких друзей? Может, вообще не высовывать носа в интернет?
- Думаю, для людей, которые по долгу службы не связаны с государственной тайной и военными секретами, нет смысла совершать цифровое самоубийство, - говорит антивирусный эксперт Сергей Ложкин. - Зачем отказываться от достижений технического прогресса? Общайтесь, выкладывайте фото, живите полноценной жизнью, но надо понимать, что наше поведение в интернете должно быть более ответственным. Нельзя в социальные сети выкладывать всю свою жизнь, весь свой рабочий день. Не стоит публиковать приватные вещи и очень личные фотографии.
Эту информацию могут использовать злоумышленники или недоброжелатели. Нужно отдавать себе отчет о том, что вы пишете на своей страничке. В виртуальном пространстве надо жить по законам реального мира, где вы ответственны за каждый свой поступок.
От редакции
Цифровой мир лишил нас защитной оболочки - все, что мы делаем, может стать достоянием публики. С одной стороны - плохо, что мы лишены личного пространства. С другой - возможно, технологии анализа больших данных способны сделать то, что не смогли совершить 10 заповедей: исправить грешную природу человека. Раньше грешить было проще: если делаешь это незаметно, то окружающие могут и не узнать. А сейчас каждый твой порок или опрометчивый шаг в Сети может обнаружить себя. Чем не повод стать интернет-праведником?