С каждым годом увеличивается перечень хранимых данных, и растёт их объём. К 2015 году примерно 90% цифровых данных в мире было создано только за предыдущие два года. По оценкам IBM, к 2015 году ежедневно генерировалось 2,5 квинтиллиона байт данных. Непрерывно растёт объём электронных корреспонденций в сотовых, социальных, финансовых, научных и многих других компьютерных сетях, служебного и общественного характера. Благодаря этому каждые два года мировой объём данных увеличивается более чем в два раза.
В 2009 году компании Arbor Networks и Merit Network совместно с Мичиганским университетом (University of Michigan) проанализировали мировой интернет-трафик. Только за два года он составил 256 эксабайт информации.
В 2004 году интернет-трафик пропорционально распределялся среди десятков тысяч сетей. В 2007 году 15 тысяч сетей отвечали за 50% всего трафика. К 2009 году 60% трафика приходилось всего на сто сетей. К примеру, Google отвечал за 6% всего глобального трафика, и являлся его крупнейшим генератором, а трафик в месяц на YouTube был эквивалентен суммарному трафику всей Глобальной Сети за 2000 год. При этом 52% всего онлайн-трафика составлял веб-трафик, тогда как на остальные протоколы приходилось 42%.
В 2007 году соотношение было противоположным – доля HTTP-протокола составляла 42%, а от 25% до 40% всего веб-трафика приходилось на онлайн-видео. Значительную долю в общем количестве онлайн-трафика составлял файлообмен через P2P-сети.
Большие данные стали неотъемлемым элементом государственной политики. Они позволяют получать сведения о социально-экономической температуре общества, прогнозировать безработицу и общественные настроения. Данные сетей подвижной связи и социальных сетей в Интернет, по сути, сегодня единственный обладающий глобальным социально-экономическим покрытием источник информации.
Благодаря большим данным происходит прогресс в области автоматизации. Накопление значительных массивов структурированных данных позволяет разбивать сложные операции на простые операции с чётко заданными правилами и использовать компьютеры в различных областях человеческой деятельности избавляя человека от рутиной и механической работы.
Большие данные всё больше проникают в повседневную жизнь людей. Так, сведения о произведенных платежах с геопривязкой позволяют оптимизировать маршрут передвижений в большом городе, сократить время на покупки или эффективнее спланировать свой рабочий график. Способов использования больших данных может быть достаточно много, поскольку конвергенция компьютерных технологий с масс-медиа, книгой, телефоном, банковским делом или медицинскими приборами сделало инфосферу Интернет универсальным средством общения и пользования накопленным опытом и знаниями.