Написать диплом по теме «Разработка моделей прогнозирования поведения цен акций, валют и товаров с использованием методов машинного обучения»
Если вы студент ВШЭ по направлению 09.03.02 «Прикладная информатика» и работаете над темой «Разработка моделей прогнозирования поведения цен акций, валют и товаров с использованием методов машинного обучения», эта статья — ваш пошаговый гид. Здесь вы найдёте структуру ВКР, примеры кода на Python, требования к оформлению по ГОСТ 7.0.100-2018, чек-лист перед защитой и типичные ошибки. Всё — с учётом методичек ВШЭ и практики реальных проектов.
Нужен разбор вашей темы Разработка моделей прогнозирования поведения цен акций, валют и товаров с использованием методов машинного обучения? Получите бесплатную консультацию: @Diplomit | +7 (987) 915-99-32 (WhatsApp)
Актуальность темы
Финансовые рынки — это поток данных в реальном времени. Каждая минута — новые котировки, объемы, новости. Вручную анализировать это невозможно. По данным ЦБ РФ (2024), 68% торговых операций на Московской бирже уже выполняются с помощью алгоритмов. Это значит — ручной трейдинг уходит в прошлое.
Машинное обучение позволяет выявлять скрытые паттерны в поведении цен. Например, модель может научиться распознавать признаки разворота тренда на основе исторических данных, новостей и волатильности. По исследованию ВШЭ (2025), использование ML-моделей в прогнозировании цен на сырьё повышает точность прогноза на 23–37% по сравнению с традиционными методами.
Заметьте: актуальность не в том, что ML «популярен». А в том, что он решает реальную проблему — снижение рисков и повышение прибыльности. Особенно это критично для компаний, зависящих от цен на энергоносители, металлы или валютные колебания.
Цель и задачи
Цель: разработка и внедрение модели прогнозирования поведения цен на выбранный актив с использованием методов машинного обучения.
Задачи исследования:
- Проанализировать существующие подходы к прогнозированию цен (ARIMA, GARCH, LSTM, Prophet).
- Выбрать и обосновать объект прогнозирования (например, золото, нефть Brent, USD/RUB).
- Собрать и предобработать исторические данные (очистка, нормализация, оконное преобразование).
- Разработать модель на основе LSTM-нейросети с использованием библиотек Keras и TensorFlow. <5>Оценить точность модели (MAE, RMSE, R²).
- Сравнить результаты с базовой моделью (например, ARIMA).
- Рассчитать экономическую эффективность внедрения (снижение потерь, рост прибыли).
Задачи соответствуют структуре методички ВШЭ: от анализа до экономики. Каждая задача — отдельный логический блок в главах.
Структура ВКР
Рекомендуемая структура дипломной работы
| Раздел ВКР | Рекомендуемый объем |
|---|---|
| Введение | 3–5 страниц |
| Теоретическая глава | 25–30 страниц |
| Аналитическая часть | 30–40 страниц |
| Практическая часть | 30–40 страниц |
| Экономическая эффективность | 20–25 страниц |
| Заключение | 3–5 страниц |
Пример введения для ВШЭ
В условиях высокой волатильности финансовых рынков точное прогнозирование цен на акции, валюты и товары становится ключевым фактором успешного управления активами. Традиционные эконометрические методы, такие как ARIMA и GARCH, показывают ограниченную точность при работе с нестационарными и шумными данными. Современные подходы, основанные на методах машинного обучения, позволяют учитывать нелинейные зависимости и большие объёмы информации, включая текстовые данные из новостей и соцсетей.
Объектом исследования выступает рынок валютных пар, в частности, курс USD/RUB. Предмет — процесс прогнозирования динамики цен с использованием рекуррентных нейронных сетей (LSTM). Цель работы — разработка и оценка эффективности модели прогнозирования на основе LSTM.
Информационная база включает данные с Yahoo Finance, официальную документацию TensorFlow, публикации в eLibrary и CyberLeninka за 2023–2025 гг. Методы: анализ, синтез, математическое моделирование, сравнительный анализ.
Как написать заключение по Прикладная информатика
В ходе работы была разработана модель прогнозирования цен на валютную пару USD/RUB с использованием LSTM-сети. Модель показала RMSE = 0.42 при прогнозе на 7 дней вперёд, что на 31% точнее, чем ARIMA. Практическая значимость — возможность интеграции в систему риск-менеджмента коммерческого банка.
Рекомендуется использовать модель как часть аналитического модуля для автоматизированной торговой системы. Для дальнейшего улучшения точности — добавить внешние факторы: новости, макроэкономические индикаторы, социальные данные. Цель достигнута: модель разработана, протестирована, экономический эффект обоснован.
Требования к списку литератууры ВШЭ
Список литературы оформляется по ГОСТ Р 7.0.100-2018. Обязательно: минимум 20 источников, из них не менее 10% — за последние 2 года.
Примеры реально существующих источников:
- ЦБ РФ. Отчёт о финансовой стабильности. 2024. https://www.cbr.ru/finstability/
- Chollet, F. Deep Learning with Python. Manning, 2023. https://www.manning.com/books/deep-learning-with-python
- ВШЭ. Методические рекомендации по выполнению ВКР. 2025. https://www.hse.ru/edu/methods
Уникальный пример: код LSTM-модели
Раскрыть: пример реализации модели LSTM на Python
import numpy as np
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
# Загрузка данных
data = pd.read_csv('usd_rub.csv', index_col='Date', parse_dates=True)
prices = data['Close'].values.reshape(-1,1)
# Нормализация
scaler = MinMaxScaler()
scaled_data = scaler.fit_transform(prices)
# Оконное преобразование
def create_sequences(data, seq_length):
X, y = [], []
for i in range(len(data) - seq_length):
X.append(data[i:i+seq_length])
y.append(data[i+seq_length])
return np.array(X), np.array(y)
SEQ_LENGTH = 60
X, y = create_sequences(scaled_data, SEQ_LENGTH)
# Разделение
split = int(0.8 * len(X))
X_train, X_test = X[:split], X[split:]
y_train, y_test = y[:split], y[split:]
# Модель
model = Sequential([
LSTM(50, return_sequences=True, input_shape=(SEQ_LENGTH, 1)),
LSTM(50, return_sequences=False),
Dense(25),
Dense(1)
])
model.compile(optimizer='adam', loss='mse')
model.fit(X_train, y_train, batch_size=32, epochs=50, validation_data=(X_test, y_test))
# Оценка
predictions = model.predict(X_test)
predictions = scaler.inverse_transform(predictions)
Застряли на этапе реализации модели? Наши эксперты по Прикладная информатика помогут разобраться. Написать в Telegram или +7 (987) 915-99-32 (WhatsApp)
⭐ MAКСТипичные ошибки студентов
⚠️ Типичные ошибки при написании Разработка моделей прогнозирования поведения цен акций, валют и товаров с использованием методов машинного обучения
- Ошибка: Использование "готового" кода без адаптации под конкретный актив → Как проверить: запустите модель на ваших данных, сравните с базовой линией (ARIMA).
- Ошибка: Отсутствие экономической интерпретации → Решение: рассчитайте, сколько денег модель "сохранила" или "заработала" за тестовый период.
- Ошибка: Несоответствие задач цели → Чек-лист: каждая задача должна быть отражена в заключении.
- Ошибка: Игнорирование требований ГОСТ 7.0.100-2018 → Решение: проверьте оформление источников через официальный сайт Росстандарта.
Частые вопросы по теме «Разработка моделей прогнозирования поведения цен акций, валют и товаров с использованием методов машинного обучения»
- В: Сколько страниц должна быть практическая часть? О: В ВШЭ — 40–60 стр. Включая код, графики, оценку точности. Смотрите методичку кафедры.
- В: Нужен ли реальный код в приложении? О: Да. Обязательны фрагменты ключевых модулей (предобработка, обучение, оценка). Объём — до 400 строк.
- В: Как проверить уникальность перед сдачей? О: Только через Антиплагиат.ВУЗ с настройками вашего вуза. Цель — >75%.
- В: Можно ли использовать open-source решения? О: Да, но с обязательным указанием источника и адаптацией под ТЗ.
- В: Какой актив лучше выбрать? О: Берите тот, по которому есть открытые данные: USD/RUB, золото, нефть. Избегайте экзотики.
Вопросы, которые часто задают студенты
Можно ли использовать готовые решения в ВКР?
Да, но с оговорками. Вы можете использовать готовые модели (например, Prophet от Facebook), но обязаны адаптировать их под свой кейс, провести сравнение с альтернативами и доказать эффективность. Просто скопированный ноутбук из Kaggle — это не ВКР. Научный руководитель ждёт анализа, а не демонстрации.
Сколько страниц должна быть практическая часть?
Рекомендуемый объём — 40–60 страниц. Включая: описание архитектуры модели, код, графики прогноза, таблицы метрик, интерпретацию результатов. Важно: не "раздувайте" текст. Каждый график должен быть описан, каждый расчёт — обоснован.
Можно ли использовать open-source решения?
Абсолютно можно. Библиотеки типа scikit-learn, TensorFlow, Prophet — стандарт. Главное — не просто использовать, а объяснить, почему выбрали именно их, как настраивали гиперпараметры, как оценивали результат. Это покажет понимание, а не механическое применение.
Что проверить перед сдачей
✅ Чек-лист перед защитой Разработка моделей прогнозирования поведения цен акций, валют и товаров с использованием методов машинного обучения
- □ Все задачи из введения выполнены и отражены в заключении
- □ Структура соответствует требованиям методички ВШЭ
- □ Уникальность >75% по Антиплагиат.ВУЗ (настройки вуза)
- □ Источники оформлены по ГОСТ Р 7.0.100-2018
- □ Работа содержит реальные данные, а не шаблоны
- □ Код в приложении читаем и работает
- □ Экономический эффект измерим (в рублях/процентах)
Нужна помощь с вашей работой?























