5‎ > ‎4‎ > ‎

x

Тема: Большой данных

  • Следуйте через:
  • RSS

Большой данные: Пять из самых больших мифов и почему они просто не складывается

Резюме: Являетесь ли вы в восторге от концепции больших данных или думаете, что она содержит мало нового, это, несомненно, площадь созрел для недоразумений.

Тоби Вольпе | 26 сентября 2014 - 10:00 GMT (3:00 PDT)

Следуйтеwolpe 0Комментарии
  • Email
  • Печать
  • Google+
  • Del.icio.us
  • Digg
  • StumbleUpon
  • Reddit
  • Pinterest
  • Slashdot
0Комментарии
  • Email
  • Печать
  • Google+
  • Del.icio.us
  • Digg
  • StumbleUpon
  • Reddit
  • Pinterest
  • Slashdot

Прочитайте это

Рост Hadoop: почему вам не нужно петабайт для большого открытия данных

  • Читать Далее

Некоторые люди видят термин «больших данных», как только широкой кистью маркетинга, покрытой рекламы. Но даже те, кто принимает концепцию большого данные по номинальной стоимости необходимо преодолеть определенные заблуждения.

Gartner считает, реклама может сделать это тяжелее, чтобы выбрать правильный курс действий в этой области и сделал немного, чтобы рассеять некоторые из мифов, которые до сих пор сохраняются.

Эти заблуждения относятся такие идеи, как 80 процентов данных неструктурированных - это не так - и что Продвинутая аналитика это просто более сложная форма нормальных аналитики - опять же, не так, по мнению аналитика, фирмы.

В попытке установить больше фактов, относящихся к большим данным, Gartner опубликовала два доклада, охватывающие мифы о воздействии больших данных о аналитики и об информационной инфраструктуры. Вот пять главных ошибочные убеждения.

Миф 1: Все это впереди нас в большой данных
Хотя интерес в больших технологий и услуг передачи данных работает с высоким - Gartner считает 73 процентов фирм инвестируют или планирует - большинство предприятий все еще находятся в ранней стадии принятия.

Таким образом, люди не правы волноваться, что конкуренты продвигаются вперед с большими данными. В самом деле, только 13 процентов опрошенных фактически развернуты любой связанный с технологиями.

GartnerBigDataGraph465x225 Этапы большого принятия данных, 2013 и 2014 Источник: Gartner сентября 2014

"Самые большие проблемы, с которыми сталкиваются организации, чтобы определить, как получить значение из больших объемов данных, и как решить, с чего начать", сказал Gartner.

"Многие организации застрять на пилотной стадии, потому что они не связывают технологию бизнес-процессов или конкретных сценариев использования."

Gartner делает следующий вывод: Ты не слишком поздно. Создание стратегии на реальных задач и привлекать ИТ и бизнесом.

Миф 2: Там так много данных, маленькие недостатки не имеют значения
Некоторые думают, что из-за закона больших чисел, отдельные недостатки данных незначительны и не влияют на результаты анализа.

Это правда, что каждый человек недостаток может иметь гораздо меньшее влияние на весь набор данных, чем это было, когда было меньше данных, но есть еще недостатки, чем раньше, потому что есть больше данных.

"Таким образом, общее влияние данных низкого качества на наборе данных остается такой же. Кроме того, большая часть данных, которые организации используют в контексте большой данных приходит извне, или неясной структуре и происхождению," сказал Gartner ,

"Это означает, что вероятность проблем с качеством данных даже выше, чем раньше. Так качество данных гораздо более важно, в мире больших данных».

Gartner делает следующий вывод: Разработать новые подходы к качеству данных и выбрать те данные, уровень качества. Следуйте основные принципы обеспечения качества данных.

Миф 3: Большие данные будут ликвидировать интеграции данных
Надежда обработки информации с помощью схемы-на-читать подхода позволит компании читать одни и те же источники, использующие несколько моделей данных. Такая гибкость позволит конечным пользователям решить, как интерпретировать любой актив передачи данных по требованию и предоставить доступ к данным с учетом индивидуальных пользователей.

Технология Pro Исследования

  • Основные этапы для успешного малого и среднего бизнеса большой стратегии данных
  • Исследование: большие тенденции данных - затраты, выплаты, результаты, штатное расписание
  • Hadoop выступает как базовой основы крупного данных
  • Большие Данные Грунтовка для ИТ-специалистов

Однако, в действительности большинство пользователей полагаться на схеме-на-записи, где данные представлены и содержание предписано, и есть соглашение о целостности данных.

Миф 4: Нет смысла использования хранилища данных для расширенной аналитики
Некоторые думают, что строительство хранилища данных является пустой тратой времени, когда передовые аналитики могут использовать новые типы данных. В самом деле, многие современные аналитики проекты использования хранилища данных во время анализа.

Кроме того, новые типы данных, возможно, потребуется, чтобы быть уточнены, чтобы сделать их пригодными для анализа. Кроме того, решения должны сделать, о которых данные релевантны, как агрегировать его, и по уровню качества данных, необходимых.

Gartner делает следующий вывод: склады Использование данных, где можно в виде набора Куратор данных для расширенной аналитики.

Миф 5: Данные озера заменит хранилища данных
Данные озера часто продаются как в масштабах всего предприятия платформы для анализа разрозненных источников данных в форматах. Но это неправильно, чтобы увидеть их в качестве замены для хранилищ данных или в качестве важнейших элементов аналитической инфраструктуры, сказал Gartner.

Технологии за озерах данных не хватает зрелости и широту функций, в установленном технологий информационных хранилищ: "Хранилища данных уже есть возможности для поддержки широкого круга пользователей." Предприятия не должны ждать озера данных, чтобы нагнать.

Gartner делает следующий вывод: использование озер данные технологии, такие как Hadoop наряду с существующими хранилищами данных. Данные озера не будет поставлять ценность для бизнеса без вложений в навыках управления метаданными, инструментов и подготовки кадров.

В двух докладах Gartner называют Основные мифы о воздействии больших данных о аналитики и основных мифов о влиянии больших данных об информационной инфраструктуры.

Подробнее о больших данных

  • Apache Spark: Как Hortonworks стремится запустить двигатель в памяти
  • Чемпионы облака, большие данные, с открытым исходным кодом IBM для преобразования здравоохранения на саммите TED
  • Большой данные: Тем не менее преследуют страхи безопасности, но Европа догоняет
  • Почему большие евангелисты данных должны быть направлены лагерей перевоспитания

Темы: Большие Данные, Enterprise Software

О Тоби Вольпе

Тоби Вольпе является старший репортер ZDNet в Лондоне. Он начал в технологии журналистики, когда Apple II был уровень техники.

Следуйтеwolpe Контакты Раскрытие ×

Раскрытие

Тоби Вольпе не имеет ничего раскрывать.

#auto

Subpages (1): v
Comments