Перейти к содержимому

Лекция 3: Основы Python для работы с данными

Python — самый популярный язык для Data Science и Data Engineering:

  • Простой и читаемый синтаксис
  • Огромная экосистема библиотек
  • Активное сообщество
  • Хорошая интеграция с C/C++ для производительности
# Переменные объявляются без типа
name = "Алексей"
age = 25
price = 99.99
is_student = True
# Статическая типизация (опционально)
name: str = "Алексей"
age: int = 25
# Числа
x = 10 # int
y = 3.14 # float
z = 1 + 2j # complex
# Строки
s = "Привет"
s2 = 'Мир'
s3 = """Многострочная
строка"""
# Логические
b1 = True
b2 = False
# Списки
lst = [1, 2, 3, "четыре"]
# Словари
dct = {"key": "value", "name": "Ivan"}
# Создание
nums = [1, 2, 3, 4, 5]
# Доступ
first = nums[0] # 1
last = nums[-1] # 5
subset = nums[1:3] # [2, 3]
# Методы
nums.append(6) # [1, 2, 3, 4, 5, 6]
nums.remove(3) # [1, 2, 4, 5, 6]
nums.insert(0, 0) # [0, 1, 2, 4, 5, 6]
# Длина
len(nums) # 6
# Создание
person = {
"name": "Алексей",
"age": 25,
"city": "Москва"
}
# Доступ
name = person["name"]
age = person.get("age", 0)
# Добавление и изменение
person["email"] = "alex@example.com"
# Удаление
del person["city"]
# Ключи и значения
keys = person.keys()
values = person.values()
age = 20
if age < 18:
print("Младший")
elif age < 65:
print("Взрослый")
else:
print("Пенсионер")
# For loop
for i in range(5):
print(i)
# For loop по списку
fruits = ["яблоко", "банан", "груша"]
for fruit in fruits:
print(fruit)
# While loop
count = 0
while count < 5:
print(count)
count += 1
def greet(name: str) -> str:
"""Приветствие."""
return f"Привет, {name}!"
# Вызов
message = greet("Мир")
print(message) # Привет, Мир!
text = "Привет, мир!"
# Длина
len(text) # 12
# Регистр
text.upper() # ПРИВЕТ, МИР!
text.lower() # привет, мир!
# Поиск
"мир" in text # True
text.find("мир") # 7
# Разделение
words = text.split(",") # ["Привет", " мир!"]
# Замена
text.replace("мир", "universe")

Виртуальное окружение (venv) — изолированная среда для проекта.

Окно терминала
# Создание
python -m venv venv
# Активация (Windows)
venv\Scripts\activate
# Активация (Linux/Mac)
source venv/bin/activate
# Установка библиотек
pip install requests beautifulsoup4
# Сохранение зависимостей
pip freeze > requirements.txt
# Установка из файла
pip install -r requirements.txt
# Деактивация
deactivate
БиблиотекаНазначение
requestsHTTP запросы
beautifulsoup4Парсинг HTML/XML
pandasРабота с таблицами
numpyЧисленные вычисления
matplotlibВизуализация
sqlite3Работа с SQLite
transformersNLP модели