Лекция 3: Основы Python для работы с данными
Почему Python для данных?
Заголовок раздела «Почему Python для данных?»Python — самый популярный язык для Data Science и Data Engineering:
- Простой и читаемый синтаксис
- Огромная экосистема библиотек
- Активное сообщество
- Хорошая интеграция с C/C++ для производительности
Базовый синтаксис
Заголовок раздела «Базовый синтаксис»Переменные
Заголовок раздела «Переменные»# Переменные объявляются без типаname = "Алексей"age = 25price = 99.99is_student = True
# Статическая типизация (опционально)name: str = "Алексей"age: int = 25Типы данных
Заголовок раздела «Типы данных»# Числаx = 10 # inty = 3.14 # floatz = 1 + 2j # complex
# Строкиs = "Привет"s2 = 'Мир's3 = """Многострочнаястрока"""
# Логическиеb1 = Trueb2 = False
# Спискиlst = [1, 2, 3, "четыре"]
# Словариdct = {"key": "value", "name": "Ivan"}# Созданиеnums = [1, 2, 3, 4, 5]
# Доступfirst = nums[0] # 1last = nums[-1] # 5subset = nums[1:3] # [2, 3]
# Методыnums.append(6) # [1, 2, 3, 4, 5, 6]nums.remove(3) # [1, 2, 4, 5, 6]nums.insert(0, 0) # [0, 1, 2, 4, 5, 6]
# Длинаlen(nums) # 6Словари
Заголовок раздела «Словари»# Созданиеperson = { "name": "Алексей", "age": 25, "city": "Москва"}
# Доступname = person["name"]age = person.get("age", 0)
# Добавление и изменениеperson["email"] = "alex@example.com"
# Удалениеdel person["city"]
# Ключи и значенияkeys = person.keys()values = person.values()Условия
Заголовок раздела «Условия»age = 20
if age < 18: print("Младший")elif age < 65: print("Взрослый")else: print("Пенсионер")# For loopfor i in range(5): print(i)
# For loop по спискуfruits = ["яблоко", "банан", "груша"]for fruit in fruits: print(fruit)
# While loopcount = 0while count < 5: print(count) count += 1Функции
Заголовок раздела «Функции»def greet(name: str) -> str: """Приветствие.""" return f"Привет, {name}!"
# Вызовmessage = greet("Мир")print(message) # Привет, Мир!Работа со строками
Заголовок раздела «Работа со строками»text = "Привет, мир!"
# Длинаlen(text) # 12
# Регистрtext.upper() # ПРИВЕТ, МИР!text.lower() # привет, мир!
# Поиск"мир" in text # Truetext.find("мир") # 7
# Разделениеwords = text.split(",") # ["Привет", " мир!"]
# Заменаtext.replace("мир", "universe")Виртуальное окружение
Заголовок раздела «Виртуальное окружение»Виртуальное окружение (venv) — изолированная среда для проекта.
# Созданиеpython -m venv venv
# Активация (Windows)venv\Scripts\activate
# Активация (Linux/Mac)source venv/bin/activate
# Установка библиотекpip install requests beautifulsoup4
# Сохранение зависимостейpip freeze > requirements.txt
# Установка из файлаpip install -r requirements.txt
# ДеактивацияdeactivateПолезные библиотеки для данных
Заголовок раздела «Полезные библиотеки для данных»| Библиотека | Назначение |
|---|---|
requests | HTTP запросы |
beautifulsoup4 | Парсинг HTML/XML |
pandas | Работа с таблицами |
numpy | Численные вычисления |
matplotlib | Визуализация |
sqlite3 | Работа с SQLite |
transformers | NLP модели |