По определению GSAM, большие данные (big data) обычно равнозначны росту количества и доступности данных. В это определение также входят аналитические инструменты для сбора и управления информацией с целью получения полезных сведений.
В отчете представлена инфографика, в которой отражены объемы данных, производимых пользователями сети. За один час мы производим 21,6 млн твитов, 8,5 млрд электронных писем, 34200 сайтов и 144 млн поисковых запросов в Google.
Goldman Sachs подчеркивает, как важно современных компаниям использовать большие данные и исследовать эту относительно новую сферу. В отчете сообщается, что компании, которые обращаются к большим данным, имеют в два раза больше шансов занять лидирующие позиции по финансовым показателям и в 5 раз более склонны быстро принимать решения. Некорректное агрегирование и управление данными может привести к потере 12% прибыли финансовых компаний ежегодно.
Большие данные помогли выявить закономерность в распространении эпидемий
Идеи
Важен не столько объем данных, сколько их релевантность и качество, отмечают авторы отчета. GSAM приводит несколько сценариев применения big data в разных отраслях. В финансовом секторе большие данные позволяют эффективно заниматься финансовой аналитикой, и строить надежные прогнозы. В сфере транспорта решить многие проблемы могут беспилотные автомобили, которые используют различные дата-сеты и машинное обучение, чтобы эффективно ориентироваться в пространстве. В политике big data поможет таргетированно воздействовать на электорат и наладить связь с избирателями.
GSAM рассматривает большие данные в максимально широком смысле — как сбор любой информации, которая может быть полезна. Вот некоторые примеры успешного и выгодного применения данных, которые приводит отчет:
- Страховые компании предоставляют льготы клиентами, которые используют регистраторы. Телематика позволяет отследить поведение водителя во время вождения, например, определить, с какой скоростью он ездит и насколько резко тормозит;
- Оптимизация работы с пациентами позволит сократить расходы медицинских учреждений на $300-450 млрд ( по оценкам McKinsey & Co.);
- «Сельское хозяйство высокой точности» (precision agriculture) использует высокотехнологичное оборудование, облачные системы и аналитику данных, чтобы добиваться максимально высоких урожаев, сокращать траты и меньше вредить экологии;
- Туристические сайты позволяют экономно бронировать отели и в реальном времени рассчитывать стоимость поездки за счет использования большого количества источников одновременно;
- В спорте создание продвинутой статистики для каждого спортсмена позволит создавать идеальные команды и правильно оценивать таланты.
Как большие данные изменят медицину
Технологии
GSAM кратко резюмирует пять основных вещей, которые нужно знать о больших данных.
- Новые источники данных открывают новые возможности. Технологии машинного обучения, такие как система обработки естественной речи, позволяют компьютерам быстрее, чем когда-либо прежде, собирать сведения из широкого спектра источников: новостных выпусков, телеконференций, социальных сетей, видео и изображений.
- Большим данным необходима аналитика. Усовершенствованная аналитика и современные технологии обработки — это главные ключи, с помощью которых из огромного потока информации можно выделить главное.
- Преимущества выходят за рамки технологий. Большие данные приносят большую пользу — от повышения урожая до совершенствования здравоохранения и уменьшения стоимости страховки. Грамотная аналитика данных может привести к инновациям в целом ряде отраслей.
- Здравая оценка необходима. Чтобы обнаружить «сигнал» в потоке информации, необходим здравый логический взгляд человека. Это важнейший инструмент в аналитике данных.
- Данные становятся более демократичными. Повышение скорости и мощности компьютеров, а также широкое распространение технологий обработки и аналитики данных делают big data доступным как предпринимателям, так и обычным людям.