1: Що таке Pandas і навіщо він потрібен?
2: Структури даних: Series та DataFrame
3: Створення DataFrame та робота з файлами
- Завантаження DataFrame з CSV
- Збереження DataFrame в CSV
- Завантаження DataFrame з Excel
- Збереження DataFrame в Excel
4: Дослідження даних, основні атрибути та методи роботи з DataFrame
- df.head() - показати перші рядки
- df.shape - кількість рядків і стовпців
- df.columns - назви стовпців
- df.index - індекси рядків
- df.dtypes - типи даних у кожному стовпці
- df.describe - статистика по числових стовпцях
- df.info() - інформація про таблицю
- df.copy() - копія DataFrame
5: Доступ до даних та робота зі стовпцями в DataFrame
- Вибір рядків за індексом/порядковим номером, методи .iloc та .loc
- Вибір стовпців
- Додавання нового стовпця
- Перейменування стовпців
- Видалення стовпців
6: Фільтрація та сортування даних
- Фільтрація за умовами
- isin() — для фільтрації по списку значень
- Використання query() для фільтрації
- Аналіз унікальних значень: методи unique(), nunique(), value_counts()
- Сортування sort_values()
7: Агрегування та групування даних
- Основні функції агрегації: sum(), mean(), count(), min(), max()
- Групування даних методом groupby()
- Багатофункціональна агрегація з agg() (одразу кілька метрик)
8: Зведені таблиці: pivot_table()
- Створення базової pivot_table
- Кілька агрегацій в pivot_table
- Кілька полів для групування в pivot_table
- Розподіл по колонках
- Заповнення пропущених значень
- pivot_table з підсумками
9: Робота з пропущеними значеннями
- df.isna() - для пошуку пропущених значень
- df.isnull() - виявлення пропущених значень
- df.fillna() - заповнення пропущених значень
- df.dropna() - видалення пропущених значень
10: Об'єднання кількох DataFrame
- Об'єднання за допомогою concat()
- Об'єднання за допомогою merge()
- Об'єднання за допомогою join()
У результаті: ви зможете з легкістю аналізувати величезні таблиці — і все це в кілька рядків коду