Одно из самых громких словечек современности - Big Data, то есть большие данные. Но что конкретно это значит?
Может быть, это звучит снисходительно, но тем, кто не в теме, это нужно объяснять с нуля. Рассказывая о больших данных человеку, который не разбирается в технологиях или пришел из другой сферы, лучше не использовать профессиональные термины и сфокусироваться на объяснениях и сопоставлениях, которые он поймет.
Хороший пример, когда краткий ликбез просит CEO, которая всю жизнь занималась только руководящей работой. У нее старый смартфон, и вы с ней плохо понимаете друг друга. Но не расстраивайтесь. Пришло ваше время.
Большие данные - это именно большие данные
Вот объяснение, которое будет понятно даже маленькому ребенку. Но не стесняйтесь предлагать свои формулировки. Просто убедитесь, что они простые от начала до конца и вы не сворачиваете с выбранного пути.
Большие данные - это именно большие данные: огромный массив информации, которую сложно обрабатывать. Это чем-то напоминает архивы бюро переписи населения - там слишком много записей (поскольку опрашиваются миллионы людей), чтобы оценить их с первого взгляда.
Самое сложное - это хранить такой большой объем информации, делиться ей с остальными и выяснять, что значат эти цифры. Для обработки информации используются специальные программные инструменты. Но если данных будет слишком много, то они не справятся с ними.
Big Data - это современный, <умный> способ обработки огромных массивов данных.
Почему мы используем большие данные?
Вы можете спросить: а зачем нужна вся эта информация? Это хороший способ выявить тенденции рынка - например, узнать, сколько людей в городе любят шоколадное мороженое больше, чем ванильное.
Эта информация может быть полезной для производителя, выбирающего, какой сорт ему лучше рекламировать. Зачем ему тратить 100 долларов на рекламу ванильного мороженого и только 50 - на рекламу шоколадного, если по статистике большинство людей предпочитает шоколад?
Вот я, например, предпочитаю ванильно-шоколадный микс Чем не вариант? О нет, наши данные теперь искажены!..
Данные могут рассказать обо всем!
Данные могут дать нам ответы на все вопросы. Чем занимается тот или иной тип людей? В каком штате приютили больше всего бездомных собак? Какую одежду, еду или игрушки выбирают люди?
Эти сведения очень важны для бизнеса, потому что позволяют больше зарабатывать. А без них может получиться так, что трехколесные велосипеды для малышей будут предлагать школьникам, предпочитающим совершенно другие модели - горные и безо всяких лишних колес.
Как вы собираете большие данные?
Если у вас большой серьезный сайт, там наверняка есть тонны маркетинговых тегов и java-скриптов, которые загружают на сайт информацию. Часто эти файлы содержат полезные сведения о ваших посетителях: какую страницу они только что открывали, авторизованы ли они в Facebook или в других социальных сетях, с каких рекламных ссылок на других сайтах они к вам пришли и так далее.
Чтобы использовать эти сведения, вам понадобится инструмент вроде Ensighten, позволяющий собирать, хранить и обрабатывать все данные, которые у вас есть.
Большие данные - это звучит так просто
Может показаться, что использовать большие данные проще простого. Но на самом деле это не так. Трудно управлять тем, чего у вас очень много.
Вот смотрите: легко убрать комнату, если надо всего лишь сложить в коробку цветные мелки и бросить в корзину стопку рубашек. А если у вас только что закончилась большая вечеринка, то все гораздо хуже. В комнате полно грязных чашек и воздушных шаров, повсюду валяются недоеденные куски пиццы Все выглядит так, как будто это вообще невозможно привести в порядок. Но в обоих случаях уборкой будет называться одна и та же работа, независимо от того, насколько ее много.
Вы должны правильно управлять большими данными
Размер имеет огромное значение. Достаточно взглянуть на Годзиллу: большой монстр в любой момент может выйти из-под контроля. Поэтому большие данные - это сложная задача. Вы должны правильно управлять ими, иначе ваши дела будут идти намного хуже.
Вы же не будете убирать с помощью пылесоса грязную одежду, которая валяется на полу, верно? Пылесос - это полезная вещь, но его бессмысленно использовать для той работы, которую делают другими способами. То же самое относится к управлению большими данными.