Аналитика и Data Science. Для не-аналитиков и даже 100% гуманитариев… - страница 26

Шрифт
Интервал


Консолидация данных в единый файл

Часто данные содержатся в разных файлах или системах. И чтобы свести всё в единый массив, придется их собирать в одном файле.

Хорошо, когда это могут сделать ИТ специалисты, предоставив единый файл согласно Вашего запроса.

Но если этого не получается сделать, то может помочь такая функция Excel как ВПР (VLOOKUP). Она позволяет свести данные из множества разрозненных файлов в один файл-массив.

Главное, чтобы во всех разрозненных файлах содержался единый идентифицирующий признак.

Например, Вы работаете в компании и кадровые данные (пол, возраст, стаж, зарплата и т. д.) по сотрудникам содержатся в HR системе Ulcimus, фактические начисления и отчисления – в 1С, а оценка эффективности в Success Factor. Тогда идентификатором может являться либо ИНН (если он содержится во всех системах), либо ФИО (если нет полностью совпадающих ФИО), либо е-мейл.

Если Вы собираете данные с многих разных точек (например, магазинов, цехов, дочерних компаний или филиалов), то заранее приготовьте единую структуру Excel-файла. По однообразным таблицам можно осуществить их объединение вручную или осуществить быструю автоматическую консолидацию (через соответствующий макрос или меню команд Excel).

Если Вам необходимо собрать данные в виде мнений или экспертных оценок (например, провести опрос насколько сотрудники довольны программой страхования или клиенты новыми тарифами) – то можно воспользоваться специальными он-лайн программами. Есть отличные программы типа Key Survey или Monkey Survey. Даже Google Form позволит Вам быстро и бесплатно получить массив данных для анализа.

Если Вы провели бумажный опрос (социолог, психолог, политолог, маркетолог, HR…) или собирали данные в бумажном виде – то надо проверить заполненность анкет и организовать их ввод в электронную базу. Также для считывания данных с бумажных анкет и ускорения формирования базы данных можно использовать специальные сканеры.

Но замечу, что на сегодня уже основная масса данных собирается «готовой к употреблению» сразу в электронном виде. Даже опросы в торговых точках, супермаркетах, производственных цехах и т. д. проводятся с применением Touch Pad технологий (интервьюер с интерактивным экраном, на котором отмечает ответы клиентов / сотрудников), позволяющих сразу же сформировать электронную базу данных.