Не верьте интернету
Фото: David Becker / AP

Фото: David Becker / AP

Американские ученые предупреждают о том, что данные о поведении пользователей в социальных сетях зачастую оказываются ложными

В статье, опубликованной в журнале Science, американские ученые Юрген Пфеффер и Дерек Рутс рассказывают о том, почему онлайновые опросы общественного мнения и изучение публичной активности пользователей в Сети зачастую имеют мало общего с действительностью. По их мнению, специалисты должны либо выработать новые методы проведения таких исследований, либо признать, что данные, полученные с помощью них, нерепрезентативны.

Пфеффер и Рутс указывают на то, что эта проблема стоит чрезвычайно остро, ведь огромное количество научных работ в последнее время строится на так называемых «больших данных», информации получаемой за счет изучения поведения в онлайне крупных групп людей — например, пользователей той или иной социальной сети.

Ученые признают, что интернет представляется для многих специалистов неисчерпаемым источником бесплатной информации. «Люди высказывают свое мнение о том, что происходит в мире, и поиск в социальных сетях позволяет узнать, что они думают о том или ином событии», — пишут авторы статьи. Пфеффер сам указывает на то, что после взрыва на Бостонском марафоне, он собрал 25 млн сопутствующих событию твиттов, не заплатив при этом ни цента, получив данные о реакции людей на это событие.

Но такая информация, зачастую, не представляет общество в целом. Авторы статьи отмечают несколько проблем, связанных с изучением «больших данных».

Прежде всего, они указывают на ошибочность мнения о том, что большое количество пользователей той или иной социальной платформы сгладит особенности ее аудитории. Ученые приводят в пример социальную сеть Instagram, в которой, в основном, представлены молодые люди, возраст которых колеблется от 18 до 29 лет. Помимо узкой возрастной выборки, аудитория этого ресурса по большей части состоит из женщин-афроамериканок, живущих в городах со средним годовым доходом $100 тысяч.

Существуют и определенные проблемы, связанные с программными средствами сбора информации в социальных сетях. Они, чаще всего, являются продуктом компании-владельца ресурса, и исследователи не могут знать, каким образом фирма меняет способ получения данных и фильтрацию выборки.

Ученые отмечают необходимость понимания того, является ли поведение пользователей в свете изучаемой проблемы естественным, или оно обусловлено политикой социальной сети. Известно, что большинство таких платформ старается намеренно изменить поведение своих клиентов с целью завлечь их на определенные страницы или заставить проводить больше времени на сайте. Для этого им специально подбрасываются определенные алгоритмом платформы ссылки или информация.

Рутс и Пфеффер указывают на огромное количество ботов, существующих в социальных сетях и делающих посты автоматически, с помощью заранее заготовленного контента. Существуют аккаунты, которые ведут профессионалы с целью создания искусственной личности в онлайне или даже направленного информационного воздействия на других пользователей ресурса.

Существуют и проблемы с выборкой населения, интересующей пользователя. Например, если ученый хочет получить данные относительно того, за кого будут голосовать студенты Калифорнийского университета, он просто ищет аккаунты, владельцы которых указали, что они в данный момент учатся в этом заведении. Но поскольку пользователи указывают такие данные самостоятельно и их никто не проверяет, существует большая вероятность того, что они окажутся ложными.

Ученые пишут, что часто сами исследователи становятся причиной получения нерепрезентативных данных. Используя ПО, позволяющее делать выборку на основе нескольких критериев, специалист может доиграться с его настройкой, задав такие критерии, результат по которым бы совпадал с его предположениями.

В академической среде обычно принято рассматривать только исследования, принесшие положительный результат. Не видя неудачных работ, невозможно составить точное мнение о том, насколько, к примеру, аудитория Twitter пригодна для прогнозирования результатов выборов, недостаточно только положительных экспериментов, необходимо знать и количество провалившихся, ведь иначе невозможно узнать, были конкретные удачи закономерны или скорее выбивались из общей статистики.

Как соболь и белка заменяли России нефть и газ Далее в рубрике Как соболь и белка заменяли России нефть и газНа протяжении столетий торговля мехом приносила властям Руси сверхдоходы, сопоставимые по значению с современным нефте-газовым экспортом

Комментарии

28 ноября 2014, 14:32
А еще в интернете полно троллей, которые не высказывают свое мнение, а стараются наоборот, своими высказываниями противоречить большинству, что бы вызвать их негодование. Ерунда все эти исследования.
28 ноября 2014, 16:04
Согласен с вами, и ладно бы если только в соц сетях такое было, вот на этом сайте тоже в некоторых злободневных темах куча троллей. Ну я конечно понимаю, что все они с Украины, но это не так важно, как сам факт их присутствия, что делает подобные исследования весьма не точными.
01 декабря 2014, 08:31
Как правило те, кто выдает себя за кого-то, на самом деле таковыми не являются.
30 ноября 2014, 22:43
Статья ни о чём. Такое впечатление что авторам не чем писать( отсебятина и гррафоманство
04 декабря 2014, 17:17
Вот молодцы американские ученые! А нам и не понятно ведь было, что посредством соцсетей формируется общественное мнение(((
Авторизуйтесь чтобы оставлять комментарии.
Интересное в интернете
Анализ событий России и мира
Подпишитесь на «Русскую планету» в социальных сетях и читайте статьи экспертов
Каждую пятницу мы будем присылать вам сборник самых важных
и интересных материалов за неделю. Это того стоит.
Закрыть окно Вы успешно подписались на еженедельную рассылку лучших статей. Спасибо!
Станьте нашим читателем,
сделайте жизнь интереснее!
Помимо актуальной повестки дня, мы также публикуем:
аналитику, обзоры, интервью, исторические исследования.
личный кабинет
Спасибо, я уже читаю «Русскую Планету»