Перейти к содержимому

Лекция 1: Введение в Data Engineering и Data Science

Data Engineering и Data Science — две ключевые области в современной индустрии данных. Они работают вместе, но решают разные задачи.

Data Engineering — это создание и поддержка инфраструктуры для работы с данными.

Что делает Data Engineer:

  • Разрабатывает пайплайны для сбора данных
  • Настраивает хранилища данных
  • Обеспечивает доступ к данным для аналитиков
  • Оптимизирует производительность систем

Data Science — это анализ данных для извлечения инсайтов.

Что делает Data Scientist:

  • Анализирует данные для поиска закономерностей
  • Строит прогнозные модели
  • Визуализирует результаты
  • Внедряет ML решения в бизнес
Источники данных → Сбор → Хранение → Обработка → Анализ → Визуализация
↓ ↓ ↓ ↓ ↓ ↓
API, DB ETL/ELT DW, Lake Spark ML/DL Dashboard
РольОсновной фокусЧастые инструменты
Data EngineerИнфраструктура данныхSQL, Spark, Airflow
Data ScientistАнализ и MLPython, pandas, scikit-learn
Data AnalystБизнес-аналитикаSQL, Excel, BI инструменты
ML EngineerПродуктовизация MLDocker, Kubernetes

Data Engineering и Data Science — одни из самых быстрорастущих направлений в IT. Спрос на специалистов растёт, а зарплаты выше среднего по рынку.