Шаги для аналитики данных
Каждое назначение аналитики данных отличается, но они часто следуют многоэтапному процессу поиска, проверки, исправления и представления данных для ответа на вопросы. Процедура может выглядеть примерно так:
1. Узнайте, какие типы данных вам нужны, чтобы ответить на конкретные вопросы, и определите цели исследования.
2. Сбор данных, в зависимости от ваших требований. Эти данные могут включать количественный и качественный анализ. Аналитики данных могут собирать эти данные внутри компании с помощью программного обеспечения для управления взаимоотношениями с клиентами (CRM) и планирования ресурсов предприятия (ERP), а также из внешних источников, таких общедоступные данные Google и сторонние сайты. Первичные качественные данные реже используются аналитиками данных, чем количественные данные, но могут включать интервью и личные наблюдения. При сборе данных вы захотите обеспечить согласованность своей методологии (например, задавая всем интервьюируемым одни и те же вопросы).
3. Очистка данных. В исходном наборе данных вы можете найти пропущенные, неполные или повторяющиеся данные, которые могут повлиять на результаты. Вы захотите проверить выбросы и убедиться, что показатели, такие как среднее значение, медиана, режим и диапазон, имеют смысл с учетом контекста. Иногда вам также необходимо преобразовать данные в формат, который читается инструментами анализа данных.
4. Анализ данных с помощью инструментов, выбранных вашей организацией, и проверка статистической значимости результатов.
5. Предоставление результатов. После того как данные собраны и проанализированы, аналитики данных часто должны представить их в удобном для понимания формате. Многие компании разрабатывают внутренние панели мониторинга, которые отслеживают ключевые показатели эффективности с помощью графиков и диаграмм.