Сегодня о «больших данных» говорят как о социально-экономическом феномене. Анализу подвергается всё, что только можно. Цифры поражают воображение. А в моей гуманитарной голове, если честно, вообще укладываются с трудом.
Например, 100 терабайт данных ежедневно (!) грузится в Facebook.
Гигант розничной торговли Walmart фиксирует ежечасно 1 миллион транзакций.
Ежеминутно пользователи закачивают в YouTube 100 часов видео-контента, отправляют 200 миллионов мейлов и 300 тысяч твитов.
Поэтому неудивительно, что 90% всех данных созданы за последние 2 года. С такой интенсивностью срок накопления данных будет только уменьшаться.
Откуда берутся большие данные? На то имеются три источника — Интернет (СМИ, блоги, форумы и соцсети, ага), архивы документов и показания датчиков, приборов и других устройств. Вроде бы все понятно, но масштаб все равно представить страшно.
Однако страшно или нет, нравится или нет, а жить в мире больших данных как-то надо. И желательно не просто так, а жить и радоваться.
Для бизнеса, например, большие данные – большое подспорье. Их анализ помогает принимать оптимальные бизнес-решения.
Происходит это по одинаковой схеме: собираются внешние и внутренние данные — вся возможная рыночная информация, отчетность компании. Что имеем на выходе? Зависит от задач, конечно, но вот в банковском секторе big data используется для борьбы с мошенничеством, сегментации и оценки кредитоспособности клиентов, прогнозирования очередей в отделениях и многом другом. Полезно? Еще как.
А теперь, чтобы окончательно убедить вас, что мир никогда не будет прежним, моя любимая рубрика «Знаете ли вы, что?»
Так вот, знаете ли вы, что Компания Netflix, крупнейший американский сервис онлайн-проката фильмов, построила модель предсказания удовлетворения запросов зрителя согласно истории его просмотров. Контент планируется вплоть до выбора цветов, которые будут использованы в заставке. Нами манипулируют, конечно, но делают это красиво.
Мало того: телехит Netflix, собственный политический сериал «Карточный домик» («House of Cards») c Кевином Спейси, стал таким популярным не только благодаря команде режиссеров, сценаристов и актеров. Но и благодаря Big Data. Данные помогли выяснить, сколько зрителю необходимо времени, чтобы оценить сериал, какой хронометраж должен быть у диалогов, сколько должен длиться эпизод, чтобы зритель не потерял к нему интерес… Эксперимент удался – у «Карточного домика» недавно вышел 6-й сезон. Я, правда, и второй не смогла осилить, но это другая история, и Big Brother Data тут ни при чём 🙂 .