5‎ > ‎4‎ > ‎x‎ > ‎

v

Прочитайте это

Рост Hadoop: почему вы не должны петабайт для большого открытия данных

  • Читать Далее

Некоторые люди видят термин «больших данных», как только широкой кистью маркетинга, покрытой ажиотаж. Но даже те, кто принимает концепцию большой данных по номинальной стоимости необходимо преодолеть определенные заблуждения.

Gartner считает, реклама может сделать это тяжелее, чтобы выбрать правильный курс действий в этой области, и мало что сделал, чтобы развеять некоторые мифы, которые все еще сохраняются.

Эти заблуждения относятся идеи, такие как 80 процентов данных неструктурированных - это не так - и что передовые аналитики просто более сложная форма нормальных аналитики - опять же, не так, в соответствии с аналитической фирмы.

В попытке установить несколько фактов, относящихся к больших данных, Gartner опубликовала два доклада, охватывающие мифы о воздействии больших данных по аналитике и об информационной инфраструктуры. Вот пятерка ошибочные убеждения.

Миф 1: Все это впереди нас в большой данных
Хотя интерес в больших технологий и услуг передачи данных работает высокой - Gartner считает 73 процентов фирм инвестируют или планируют - большинство предприятий все еще в ранних стадиях принятия.

Таким образом, люди не правы волноваться, что конкуренты продвигаются вперед с большими данными. На самом деле, только 13 процентов опрошенных на самом деле развернуты любые связанные технологии.

GartnerBigDataGraph465x225 Этапы большого принятия данных 2013 и 2014 Источник: Gartner сентября 2014

"Самые большие проблемы, с которыми сталкиваются организации, чтобы определить, как получить значение из больших данных, и как решить, с чего начать", сказал Gartner.

"Многие организации застрять на пилотной стадии, потому что они не связать технологии бизнес-процессов или конкретных сценариев использования."

Gartner делает следующий вывод: Ты не слишком поздно. Построить стратегию на реальных задач и привлекать ИТ и бизнеса.

Миф 2: Там так много данных, маленькие огрехи не имеет значения
Некоторые думают, что из-за закона больших чисел, отдельные недостатки данных незначительны и не влияют на результаты анализа.

Это правда, что каждый человек может иметь недостаток гораздо меньшее влияние на весь набор данных, чем это было, когда было меньше данных, но есть еще недостатки, чем раньше, потому что есть больше данных.

"Таким образом, общее воздействие данных некачественных на наборе данных остается такой же. Кроме того, большая часть данных, которые организации используют в контексте большой данных приходит извне, или неустановленного строения и происхождения", сказал Gartner ,

"Это означает, что вероятность того, что вопросы качества данных, даже выше, чем прежде. Таким образом, качество данных на самом деле более важным в мире больших данных».

Gartner заключает: Разработать новые подходы к качеству данных и выбрать те данные, уровень качества. Следуйте основные принципы обеспечения качества данных.

Миф 3: Большие данные будут ликвидировать интеграции данных
Надежда обработки информации с помощью схемы-на-чтения подхода позволит компании читал те же источники, использующие несколько моделей данных. Такая гибкость позволит конечным пользователям решить, как интерпретировать любой актив данных по требованию и предоставить доступ к данным с учетом индивидуальных пользователей.

Технология Pro Исследования

  • Критические шаги для успешного SMB большой стратегии данных
  • Исследование: Большие тенденции данных - затраты, выплаты, результаты, штатное расписание
  • Hadoop выступает как базовой основы большой данных
  • Большой данных Учебник для ИТ-специалистов

Тем не менее, в реальности большинство пользователей полагаться на схеме-на-записи, где данные и содержание описанного предписано, и есть договоренность о целостности данных.

Миф 4: Нет смысла использования хранилища данных для продвинутых аналитики
Некоторые думают, что строительство хранилища данных является пустой тратой времени, когда передовые аналитики могут использовать новые типы данных. На самом деле, многие передовые аналитические проекты используют хранилища данных в ходе анализа.

Кроме того, новые типы данных, возможно, потребуется уточнить, чтобы сделать их пригодными для анализа. Кроме того, решения должны сделано, о которых данные актуальны, как агрегировать его, и по уровню качества данных, необходимых.

Gartner делает следующий вывод: склады использования данных, где можно как набор данных Куратор для продвинутых аналитики.

Миф 5: Данные озера заменит хранилища данных
Данные озера часто продаются как в масштабах предприятия платформы для анализа разрозненных источников данных в форматах. Но это не так, чтобы видеть их в качестве замены для хранилищ данных или в качестве важнейших элементов аналитической инфраструктуры, сказал Gartner.

Технологии позади озера данных не хватает зрелости и широту функций, в установленном технологий информационных хранилищ: "Хранилища данных уже есть возможности для поддержки широкого круга пользователей." Предприятия не должны ждать озера данных, чтобы догнать.

Gartner делает следующий вывод: Использовать озеро данные технологии, такие как Hadoop наряду с существующими хранилищами данных. Данные озера не будет поставлять бизнес-ценность инвестиций в без навыков управления метаданными, инструментов и обучения.

В двух докладах Gartner называют Основные мифы о воздействии больших данных по аналитике и основных мифов о влиянии больших данных об информационной инфраструктуры.

Подробнее о большом данных

  • Apache Spark: Как Hortonworks стремится запустить двигатель в памяти
  • Чемпионы облако, большие данные, с открытым исходным кодом IBM для преобразования здравоохранения на саммите TED
  • Большой данные: Тем не менее преследуют страхи безопасности, но Европа догоняет
  • Почему большие евангелистов данных должны быть отправлены повторно образования лагеря

#auto

Comments