22-02-2017 19:15

Как мы становимся заложниками "больших данных"

Big Data или «большие данные» - это феномен, связанный с появлением технологических возможностей анализировать огромные массивы данных. В некоторых проблемных областях речь идет о всем мировом объеме данных.

Примеров того, как работают большие данные, в наше время уже немало.

Так, например, в расследовании британских властей относительно коррупции в Rolls-Royce применялись алгоритмы обработки больших данных. Робот ACE британского стартапа Ravn помог следователям проанализировать 30 млн документов. Он сделал то, что было не под силу людям - анализировал по 600 000 документов в день и делал это с минимальной погрешностью.

Однако весьма скоро наступит время, когда мы будем действовать так, как велит нам искусственный интеллект, искренне полагая, что совершаем свой выбор.

Большинство ученых, занимающихся разработкой искусственного интеллекта, полагают, что это случится уже где-то через 40–60 лет.

Об этом пишет Андрей Курпатов в колонке для "Snob.ru".

Уже очень скоро нами будет управлять искусственный интеллект, который не имеет с человеческим разумом ничего общего. И именно поэтому он будет намного умнее нас.

Впрочем, почему "будет"? Как показала феерическая предвыборная кампания Трампа, этот интеллект уже есть! Знакомьтесь.

Начнем, пожалуй, с небольшого и нехитрого следственного эксперимента. Посмотрите на пункты, представленные ниже, и скажите, насколько указанные факторы влияют на ваше настроение?

1. Ситуация на работе

2. Продолжительность сна

3. Физическое самочувствие

4. Погода на улице

5. Был ли секс накануне

6. День недели

7. Фаза менструального цикла (касается только женщин, разумеется).

Уверен, что задание не показалось вам сложным. Кому-то из нас важно хорошо выспаться. Другим секс заменяет RedBull. Третьи ждут пятницы как манны небесной. Четвертые горят на работе.

В общем, тут все ясно, понятно и закономерно. Но проблема в том, что вы ошиблись. И не важно, как именно вы ответили.

Два социальных психолога из Гарварда — Дж. Вейсс и П. Браун — попросили студенток заполнить эту анкету, а затем методично наблюдали за ними в течение нескольких месяцев. Фиксировались все упомянутые факторы, а также действительное настроение молодых женщин в течение каждого дня.

Выяснилось следующее. Во-первых, все студентки пребывали в тотальной иллюзии — никакой корреляции между их ответами и реальным положением дел обнаружено не было. Во-вторых, все женщины, заполняя свои анкеты, отвечали примерно одно и то же. То есть у гарвардских студенток есть некая единая (и предельно неадекватная) концепция того, что влияет на их женское настроение.

Гарвард вряд ли представляет собой исключение из общего правила, а его студентки вроде как круглыми дурами быть не должны. А это значит, что выводы данного исследования касаются каждого из нас.

большие данные

Но как может быть, что мы живем в совершенно искаженной модели реальности и не замечаем этого?

Все дело в нашей с вами "личности". Наша хваленая "личность", как показали исследования социального психолога Ли Росса и нейрофизиолога Маркуса Рейчела, лишь "история", "сказка", которую мы сами себе рассказываем, чтобы сохранять иллюзию собственной здравости.

Примерно тот же фокус и с нашим "сознанием". Мы, конечно, считаем его невероятно мощным, но его действительный КПД курам на смех. Рассуждая, мы можем удерживать в сознании не более семи-девяти объектов, а делая выводы, способны учесть не больше трех-четырех параметров.

Конечно, и этим можно гордиться, особенно сравнивая себя с кольчатыми червями. Но глупо делать то же самое, когда нашим конкурентом выступает машина, которая, принимая решение о нас и нашей жизни, учитывает неограниченное множество элементов ситуации.

Да, искусственный интеллект не сам стал таким сообразительным, но и не мы сделали его таковым, не надо обольщаться. Всему виной человеческая глупость и высокомерие: мы, не осознавая рисков, разоблачились перед ним подчистую, провели, так сказать, полный скрининг своей "экзистенции".

И теперь искусственный интеллект знает про нас все. Это, собственно, и есть та самая BIG DATA, а по-русски говоря, "большие данные".

Когда компания Google только начала придумывать свой автомобильный автопилот, она планировала создать робота-водителя, подобного человеку. Но скоро стало понятно, что это тупиковый путь: слишком криво и неэффективно человек решает элементарную по сути задачу — добраться до места, соблюдая правила ПДД, и ни с чем по дороге не столкнуться.

Тогда Google стала разрабатывать "умный автомобиль" — мол, если не получается сделать чатланина, то хотя бы пепелац с гравицапой изобретем! Но в 2016 году закрыла и этот проект.
Выяснилось, что для создания автопилота не нужен ни человекообразный робот, ни особенный автомобиль. Достаточно предоставить искусственному интеллекту все данные, относящиеся к задаче, и он справится с ней сам — без нас и лучше нас.

Выводы, которые делает искусственный интеллект, управляющий автомобилем на основании бесчисленного множества данных (с карт, камер, датчиков, контроллеров и т. д., и т. п.), совсем не те, что делаем мы с вами, когда сидим за рулем. Честно говоря, мы даже не знаем, какие он выводы делает. Да и "выводы" ли это?

Искусственному интеллекту не надо "думать": он просто учитывает все факты и действует соответствующе.

Мы пытаемся обхитрить узость и ограниченность собственного ума, а потому лишь фантазируем о том, как бы решить задачу. Он же просто ее решает, а поэтому и выигрывает — в шахматы у Каспарова, в го у Ли Седоля. Скоро победит и в "Формуле-1", причем с парализованным Шумахером на борту.

Или вот посмотрите, как работает переводчик Google — это же диво какое-то расчудесное! Но как он научился так складно писать на всех языках?

Сначала разработчики допустили ту же самую ошибку: они пытались учить машину языку, как первоклашку из школы для детей с отставанием в развитии. Но толку от этого было мало.

Готово ли человечество к революции технологий?

Так что и в этом случае создатели искусственного интеллекта плюнули на попытки очеловечивания электроники, загрузили в систему все документы ООН (которые, понятно, одновременно переведены на большинство языков), и искусственный интеллект сам обнаружил в этих файлах все необходимые ему взаимосвязи.

Знает ли переводчик Google язык так же, как знаем его мы? Нет. Знает ли он правила языка, которые знаем мы? Нет. Понимает ли он, о чем идет речь, когда он переводит слово за словом, предложение за предложением? Нет.

А ему и не надо, он просто очень хорошо решает поставленную задачу — сначала выявляет скрытые в больших массивах данных одному ему понятные закономерности, а затем использует их в работе уже с другими данными. Получается идеально.

Короче говоря, там, где мы действуем интуитивно, впотьмах и, мягко говоря, не всегда успешно, искусственный интеллект, взращенный на нивах больших данных, работает четко, строго и результативно. Правда, мы не знаем как. Больше того, мы нашим ограниченным сознанием этого и не поймем.

Все это я к тому, что пора уже забыть научно-фантастические фильмы о восставших роботах и законы робототехники Айзека Азимова.Когда нас накроет волна сверхмощного искусственного интеллекта, основанного на механизмах нейронного обучения и BIG DATA, мы даже не заметим, как нас сделали.

Впрочем, именно это уже и случилось. Однажды в Америке… Трамп.

Ученые шепчутся, а журналисты бодро пишут о том, что Трамп выиграл эти выборы благодаря BIG DATA.

Наверняка мы об этом, конечно, ничего не знаем. Но в том, что случилось, согласитесь, обнаруживается масса странностей.

Во-первых, оскандалились социологи: по данным предварительных соцопросов, победа Клинтон казалась неизбежной. А вот на тебе. Во-вторых, почти вся американская пресса — этот великий рупор общественного мнения, — была против Трампа. Но Дональду хоть бы хны: в огне не горит, в воде не тонет. Наконец, в-третьих, какая-то совершенно удивительная прицельная стрельба по выборщикам: по этому ключевому для результатов выборов показателю Трамп побеждает Клинтон с большим запасом, тогда как фактических голосов американцев за него отдано на два миллиона меньше.

О том, что в деле замешаны именно BIG DATA, судят по двум весьма косвенным признакам.

Первый признак: три четверти рекламного бюджета избирательной кампании было потрачено Трампом на продвижение в сети. Второй признак, куда более определенный — заявления представителей компании Cambridge Analytica, специализирующейся на "политическом микромаркетинге": мол, мы сами не ожидали, насколько повлияем на исход голосования!

Может, просто хвастаются и хотят погреться в лучах чужой славы? Не исключено. С другой стороны, Трамп нанял эту компанию после фантастического взлета Теда Круза и сразу после Brexit, а именно на их стороне и воевала Cambridge Analytica со своей "прорывной технологией по "методу океана".

Сейчас, кстати, на услуги Cambridge Analytica претендует и Марин Ле Пен. Впрочем, договариваться ей придется уже с самим Трампом: такая корова, как выясняется, нужна самому — сотрудники компании получили назначения в президентской администрации.

Так что же, как говорят, натворила Cambridge Analytica во главе с ее директором Алексом Никсом аккурат перед самыми выборами?

Система искусственного интеллекта методично бомбила пользователей социальных сетей сообщениями, четко побуждая их к определенным эмоциональным реакциям: "Возлюбите Трампа!", "Возненавидьте Клинтон!". И не просчиталась.

Авторство технологии, судя по всему, принадлежит поляку Михалу Козинскому. Работая в Кембриджской лаборатории психометрии, он сделал приложение для Facebook, которое позволило собрать огромное количество данных о психотипах пользователей этой социальной сети.

Сличив эти данные с поведением пользователей в аккаунтах, Козинский получил алгоритм, который всего по 68 лайкам в Facebook определял цвет кожи человека, его сексуальную ориентацию, политические взгляды, уровень интеллекта, религиозность, отношение к алкоголю и так далее, и тому подобное.

Первая научная статья на эту тему была опубликована в 2012 году, а с тех пор прогресс, как вы понимаете, был сделан большой.

Data science: наука, которой еще нет

Модель Козинского научилась за десять лайков узнавать человека лучше, чем коллеги по работе, а за триста — чем родители или супруг. Теперь вспоминаем гарвардских студенток и понимаем, что в целом система знает пользователей Facebook лучше, чем они сами.

Поэтому вклад BIG DATA в победу Трампа можно оспаривать, но глупо отрицать работающий здесь принцип.

Что ж, самое время вернуться к вопросу о "личности".

Козинский определяет нас лишь по пяти показателям: открытость новому, интроверсия и экстраверсия, ответственность, доброжелательность, нейротизм. У Никса и Cambridge Analytica всего пять базовых профилей личности.

Собственно, такой нехитрой математики, как выясняется, вполне достаточно, чтобы каждого из нас "посчитать". И мы можем сколько угодно рассуждать о собственной индивидуальности, исключительности, невообразимости и т. д. Но это бред сумасшедшего, страдающего манией личностного величия.

Желающие могут обманываться и дальше. Но их тоже посчитают: на непереводимом языке искусственного интеллекта будет сделана соответствующая пометка — "наивен, недальновиден, без ума от себя".

Да, мы кажемся друг другу разными, но искусственный интеллект, работающий с BIG DATA, этого не подтверждает. Подобно гарвардским студенткам, мы, в общем и целом, думаем одно и то же, а реагируем предельно ограниченным количеством способов.

Если анализировать все, что мы с вами делаем — и в онлайне, и в офлайне (к чему, собственно, и движется семимильными шагами новая технология), — а не частью и не местами, как это происходит в рамках социальной коммуникации, мы предельно предсказуемы.

Поэтому Рей Курцвейл работает сейчас над созданием индивидуального помощника, который будет знать, чего мы хотим, раньше нас. А Элон Маск — над автомобилем, который будет знать, куда мы собираемся поехать, даже если мы ничего ему об этом не сообщим.

Предсказать наше поведение и манипулировать им теперь не сложнее, чем управляться с тем самым автомобилем или переводчиком Google. И в результате какой-нибудь Трамп вполне может появиться там, где, что называется, не ждали.

Искусственные самообучающиеся нейронные сети, получившие в распоряжение всю возможную информацию о нас, включая не только данные о нашем поведении в интернете, но и с банковских карт, информацию о наших передвижениях через GPRS смартфона, наши телефонные звонки, эсэмэски, твиты, медицинские карты, фотографии, данные с видеорегистраторов, налоговые декларации и так далее, и тому подобное, возьмут нас под тотальный контроль, а мы этого даже не заметим.

И вот почему так важен пример Трампа: это не будет контролем в стиле Оруэлла или Хаксли, это будет тотальный контроль, который мы, при всем желании, не сможем идентифицировать. Мы просто будем действовать так, как велит нам искусственный интеллект, искренне полагая, что совершаем свой сознательный и личностный выбор.

Он возьмет нас голыми руками.

Алан Тьюринг страдал от замкнутости и одиночества. Он плохо понимал других людей, и те отвечали ему взаимностью.

Ему очень хотелось сделать машину разумной, чтобы она могла понять его и чтобы он смог поговорить с ней. Он даже назвал ее в честь своей юношеской влюбленности — Кристофера Морка.

Вот почему знаменитый на весь мир "тест Тьюринга" — это, по сути, тест на выявление "личности" у искусственного интеллекта. И да, из-за своего аутизма Тьюринг ввел нас в заблуждение.

Сверхмощный искусственный интеллект возникнет и обыграет человечество именно потому, что ни личности, ни сознания у него не предвидится.

Он будет трезво анализировать факты, игнорируя предрассудки, заложниками которых мы являемся. И делать то, что скажет ему…

И вот тут вопрос. Может быть, Трамп? Не знаю. Но, вероятно, субъект будет с деньгами.