GEOP019 - Расширенный Анализ Данных и Машинное Обучение для интегрированных подповерхностных решений
Дисциплина: Геология, петрофизика и разработка месторождений
Уровень курса: Продвинутый
О чем этот курс?
Специалисты по нефти и газу ежедневно работают с огромным объемом информации. Эта информация необходима для построения точных статических и динамических моделей коллектора. Однако значительная часть информации остается неиспользованной человеческой «погрешностью» и из-за ограниченных вычислительных ресурсов. Эта недостающая часть может оказать значительное влияние на точность модели коллектора. Понимание машинного обучения и методов Big Data может помочь наиболее полно использовать входную информацию и достичь наиболее точных результатов.
Этот курс объясняет и дает рекомендации более опытным участникам о том, как эффективно применять методы машинного обучения в наших реальных проектах. Он построен для объяснения теории методов машинного обучения (регрессии, деревьев решений, нейронных сетей, опорных векторных машин, ансамблей алгоритмов), предлагает рекомендации по практическому использованию этих методов и стратегии для наиболее подходящего выбора метода.
Этот 10-дневный курс более практичен, всем специалистам будут представлены все инструменты и алгоритмы для создания моделей машинного обучения. Это отличная возможность получить практический опыт для сбора и подготовки входных данных, применяя методы машинного обучения
Для кого этот курс?
Геологоразведчики и инженеры-геофизики, инженеры-геодезисты, специалисты по геостатистике и профессионалы, желающие понять концепции машинного обучения, применять методы машинного обучения в практических задачах, совершенствовать свои аналитические и интерпретирующие навыки
Чему Вы научитесь?
Программа курса
1. Введениe
- • Знакомство с курсом и зачем его проходить
- • Как устроена специализация анализа данных и машинного обучения
- • Знакомство с Python и его установка
- • Знакомство и работа с IPyton Notebook
- • Синтаксис Python
- • Библиотеки Python (Pandas, NumPy, Scipy, Matplotlib)
2. Повторение базовых понятий математического анализа и основ линейной алгебры для понимания теории методов машинного обучения
- • Производная и градиент
- • Векторы, Матрицы и операции с ними
3. Повторение базовых концепций теории вероятностей и статистики, которые необходимы для понимания механизма работы всех методов анализа данных
- • Вероятность и случайная величина
- • Распределение, плотность и свойства распределений
- • Основные формулы теории вероятности
- • Виды распределений (нормальное, Бернулли)
4. Знакомство с методами оптимизации
- • Метод градиентного спуска
- • Метод Ньютона
5. Введение в машинное обучение
- • Основные термины в машинном обучении
- • Типы задач в машинном обучении (обучение с учителем (supervised learning), задачи классификации и регрессии, обучение без учителя (unsupervised learning), clustering, anomaly detection, dimensionality reduction)
- • Метрики качества и функции потерь
- • Регуляризация
- • Проблема переобучения: bias-variance tradeoff
- • Кросс-валидация (cross-validation)
- • Знакомство с библиотекой scikit-learn для анализа петрофизических данных
- • Обзор open source data community (Kaggle, etc)
6. Линейная и логистические регрессии
- • Подготовка данных для обучения (создание и проверка признаков, очистка данных)
- • Визуализация данных
- • Lab: подготовка данных для обучения
- • Линейная регрессия
- • Lab: линейная регрессия на петрофизических данных
- • Логистическая регрессия
- • Lab: логистическая регрессия на петрофизических данных
7. Деревья решений и их композиции
- • Основы деревьев решений
- • Lab: построение дерева решений
- • Random Forest
- • Lab: тренировка Random Forest на петрофизических данных
- • Градиентный бустинг
- • Lab: тренировка композиции деревьев решений на петрофизических данных с использованием библиотеки XGBoost
8. Нейронные сети
- • Основы нейронных сетей
- • Backpropagation
- • Lab: тренировка нейронной сети на петрофизических данных с использованием библиотеки Keras
- • Deep Learning и другие типы нейронных сетей (autoencoder, recurrent neural networks, convolutional neural networks, generative adversarial networks)
9. Метод опорных векторов (SVM)
- • Основы метода опорных векторов
- • Понятие ядра
- • Lab: тренировка SVM на петрофизических данных
10. Обучение без учителя
- • Методы кластерного анализа (на примере метода K-Means)
- • Метод главных компонент (PCA)
- • Смесь нормальных распределений (Mixture of Gaussians)
11. Рекомендации и заключение
- • Как подготовить «сырые» данные к обучению и создать новые признаки?
- • Как выбрать лучший алгоритм?
- • Как настроить алгоритм и выбрать лучший набор параметров?
- • Как оценить качество работы алгоритма?
12. Байесовские модели
13. Подробнее о методах кластеризации
14. Обзор статей по машинному обучению при решении геолого-седиментологических задач
Предварительные требования
- Знания в данной области не ниже базового уровня
Доступные форматы
- Под руководством инструктора онлайн
Источник: https://tecedu.academy/ru/courses/GEOP019