Блог Карлоса Домингеса (Carlos Dominguez),
старшего вице-президента в офисе главы компании Cisco
Одно дело - данные, созданные людьми, и совсем другое - данные, сгенерированные машинами. В процессе перехода от Интернета вещей
к Всеобъемлющему Интернету этот факт вызывает ряд примечательных последствий.
Машины и устройства генерируют хорошо структурированные данные. Каждый датчик запрограммирован на создание данных строго определенного типа. Он может, к примеру, считать количество автомобилей, проезжающих через данный перекресток, и ничего более. Датчик работает с высокой предсказуемостью. Он передает данные через определенные промежутки времени, поэтому мы можем точно предсказать срок получения данных и быть уверены в их актуальности. Кроме того, для передачи такого трафика нужна довольно узкая полоса пропускания. Нам нужно передать всего лишь один короткий сигнал от определенного датчика с определенными данными за определенный (как правило, очень короткий) период времени.
В отличие от датчиков, люди создают данные совершенно непредсказуемым образом. У меня нет ни малейшего представления о том, кому я отправлю следующее сообщение по электронной почте, кому и когда позвоню по телефону. Кроме того, я не знаю, где и когда сделаю следующую фотографию. Человеческие данные не структурированы. Это может быть что угодно, от электронных таблиц до любительских видеоклипов. Кроме того, для этих данных (налоговых деклараций, фотографий ваших детей, рукописей новых романов и т.д.) важна историческая последовательность. Для передачи этих данных нужна средняя или широкая полоса пропускания (в зависимости от того, что именно передается). Канал связи должен быть бесперебойным и непрерывно доступным. Поэтому, говоря о Всеобъемлющем Интернете, не следует забывать о том, что речь идет о двух совершенно разных типах данных и что на наших глазах рождается совершенно новый, с исторической точки зрения, тип данных.
Как правило, ценность больших объемов обычных и исторических данных повышается по мере роста их объема и протяженности во времени. Чем больше данных вы соберете и чем длиннее период, за который вы это сделаете, тем лучше. Однако сегодня появились так называемые "мобильные данные" (Data in Motion), обладающие совсем иными характеристиками. Они привязаны к конкретному местоположению и используют телеметрию, датчики движения, данные о транспортных потоках, средства распознавания столкновений и многое другое. Это - данные реального времени. Какой смысл в данных о предстоящем столкновении двух автомобилей, если эти данные отправляются в хранилище? Мобильные данные должны мгновенно передаваться пользователю для немедленного реагирования. Таким образом, параметры, по которым оцениваются данные нового типа, порой противоположны традиционным параметрам. Данные реального времени обычно собираются на месте, а затем пользователь сам решает, сохранять их или нет, и сохранять ли их полностью или частично. В результате в хранилище может поступить всего несколько бит информации.
Очень важно понимать разницу между типами данных, но самое главное начинается, когда к этим данным начинают применяться методы прогностического анализа. Здесь-то и происходят настоящие чудеса.
"Мобильные данные" (Data in Motion) - собирательное название любых данных, приобретающих максимальную ценность в момент их "движения", то есть передачи, а иногда и создания. Мобильные данные требуют быстрой реакции в реальном времени. Они создаются для принятия практических решений в нужном месте и в нужное время. В идеальном случае эти данные можно оценивать, делая их основой для формирования знаний и мудрости. Вместе с тем даже небольшая задержка в передаче этих данных может полностью их обесценить.
Мобильные данные резко отличаются от статических данных, "лежащих на хранении" и подвергающихся аналитическому анализу (именно такие данные используются в решениях Big Data). Мобильные данные пока остаются во многом невостребованными. Розничные магазины могли бы использовать их для передачи покупателям - в реальном времени - целенаправленных предупреждений и уведомлений о скидках. Медицинские учреждения могли бы пользоваться мобильными данными для наблюдения за состоянием амбулаторных пациентов в удаленном режиме. Промышленные же предприятия могут использовать эти данные для мониторинга производственных процессов и управления ими.
Как уже говорилось, большие объемы мобильных данных генерируются растущей армадой датчиков, формирующих Всеобъемлющий Интернет. В недавнем исследовании компании Cisco под названием IoE Value Index (<Индекс ценности Всеобъемлющего Интернета>) , говорится, что в 2013 календарном году Всеобъемлющий Интернет принесет игрокам мирового рынка огромную дополнительную прибыль - не менее 613 млрд долларов. Таким образом, Всеобъемлющий Интернет - это Интернет не завтрашнего дня, а дня сегодняшнего.
Поскольку ценность данного подхода так велика и в будущем должна возрасти еще больше, руководители многих компаний задаются двумя вопросами: как извлечь реальную выгоду из мобильных данных, и какая для этого нужна инфраструктура?
Вот четыре идеи, над которыми следовало бы подумать руководителям ИТ-отделов. Во-первых, необходим системный подход. Такой подход поддерживает интеллектуальность, конвергенцию, прозрачность и информационную безопасность, и все это, в свою очередь, позволяет полностью раскрыть возможности мобильных данных и Всеобъемлющего Интернета. Системный подход можно реализовать только с помощью стандартизации и взаимодействия, то есть ломки проприетарных барьеров, ведущей к свободному обмену данными между людьми, процессами и материальными объектами.
Во-вторых, нужна новая модель информационных технологий нового поколения. Я имею в виду модель, предоставляющую приложениям доступ к ресурсам и позволяющую им автоматически в реальном времени получать данные из сети и от датчиков. Такая модель унифицирует и упростит управление вычислительными и сетевыми ресурсами, а также системами информационной безопасности. В результате приложения смогут получать мобильные данные в момент их передачи по сети.
В-третьих, данные необходимо виртуализировать точно так же, как мы уже виртуализировали вычислительные ресурсы, системы хранения, сетевые системы и системы информационной безопасности. Приложения и датчики должны получать данные в реальном времени из любой точки без копирования больших объемов информации через сеть. Недавно Cisco приобрела лидера в области виртуализации данных - компанию Composite Software, которая предоставила нам необходимый уровень абстракции, позволяющий в любой точке сети получать и использовать данные в тот момент, когда эти данные необходимы.
И, наконец, в-четвертых, огромное значение имеет информационная безопасность. Это особенно касается использования мобильных данных, которые необходимо защищать в реальном времени, распознавая попытки вторжений с максимальной скоростью, прежде чем они успеют нанести непоправимый ущерб. Такие хакерские средства, как печально известный червь Stuxnet, способны наносить огромный ущерб электростанциям и промышленным предприятиям, перекрывая потоки важной информации. Необходимо защищать данные в точках их сбора, анализа и использования, а также во всех точках, где крайне важно распознавать угрозы и защищать инфраструктуру от вторжений и злонамеренных воздействий.
Вышеизложенное наглядно иллюстрирует видеоролик - http://www.youtube.com/watch?v=yf3nNHSO9-Y.
В заключение рекомендую подготовленный компанией Cisco обзор "Increase the Value and Relevance of Data in Motion" (<Как повысить ценность и значение мобильных данных>, опубликован в разделе http://share.cisco.com/DiM/). Он содержит подробнейшую информацию о вышесказанном с примерами, касающимися деятельности операторов связи и различных отраслей: розничной торговли, здравоохранения, энергетики, промышленного производства.