Программируем выигрыш!

2
Статистика
Статистика
2
Статистика темы
  • Популярность
    Топ-4864
  • Постов
    18
  • Просмотров
    2,032
  • Подписок
    2
  • Карма автора
    0
  • Математическое моделирование различных игр набирает обороты. Компьютерные программы уже давно обыгрывают людей в шахматы. Не так давно компьютер обыграл человека в Go. Вскоре очередь дойдет и до покера, в этом нет сомнений.

    Мне как программисту интересно разобраться в этой предметной области. Мне интересно две сферы: покер и ставки.

    Делать бота для покера сложнее. Дело даже не в математической модели (что очень сложно), а борьба с сопутствующими сложностями, такие как определение текущей ситуации за столом с экрана, моделирование поведения человека, чтобы бота не обнаружил рум и тд.

    Так что мой выбор пал на спортивные ставки. В первом приближение буду делать программу со следующим функционалом: сбор исторической статистики и коэффициентов, создание математической модели, построение модели прогноза.

    В начале разработки мне представляется программа, которая будет делать первичный отсев событий, может быть когда-нибудь и получится курочка несущая золотые яйца (запустил и смотри как растет прибыль), но сейчас сконцентрируемся на следующей цели: из всего многообразия спортивных событий и ставок, программа должна отбирать события с высокой вероятностью положительного прогноза, который будет +EV по сравнение с коэффициентами букмекеров.

    Я не буду выкладывать программный код, а лишь писать мысли и если получится работающие алгоритмы. Блог мне нужен для того, чтобы структурировать полученную информацию. Так же если я буду заходить не туда, то сообщество даст дельные советы .
    Ответить Цитировать
    1/11
    + 0
  • На Хабре есть отличная статья:

    https://habrahabr.ru/post/306944/

    https://habrahabr.ru/post/307422/

    Представлены отличные идеи для машинного обучения, только есть одно но, прогноз получается в чистом виде, отсутствует сравнение с кеффами букмекеров. По сути такой прогноз ничего не дает. Если кефф будет ниже % прогноза, то на дистанции будет минус.

    Но идеи конечно стоящие. Будем заимствовать.
    Ответить Цитировать
    2/11
    + 1
  • iSmart, статья вода водой и большая ее часть является переводом некоторых абзацев лишь из одной(!) научной работы. А вот из той научной работы можно действительно много всего подцепить на начальном этапе.

    Да, и, кстати, данная статья, очевидно, реклама сервиса, который якобы написан выпускниками Физтеха и ВМиК МГУ (ВМиК, блин, да никто с ВМК так не напишет никогда). 162 ставки за 3 месяца (!). Автоматизированная система, которая делает по 50 ставок в месяц это как то не очень, что-ли.
    "Валидация модели проводилась на матчах 2015 года." - ну хорошо, за 2015 год можно набрать около 12к матчей, этого вполне достаточно для валидации.
    "Результат: 12% ROI за 2015 год" - 12% да это круто. Реально и круто.
    "Всего с начала 2015 г по настоящий момент алгоритм дал 452 прогноза, 350 за 2015" - Стоп, что!? 350 ставок. 12% ROI на дистанции 350 ставок со сред. коэф. 1.74 может показать даже жутко отрицательный алгоритм во время апстрика.

    И если вы таким образом оптимизировали алгоритм, что он отсекает 97% матчей, чтобы оставаться прибыльным, то, скорее всего у вас проблемы.
    Сообщение отредактировал Alea - 11.10.2016, 19:55
    Ответить Цитировать
    1/4
    + 0
  • Alea, Есть ссылка на оригинальную статью?
    Ответить Цитировать
    3/11
    + 0
  • iSmart @ 11.10.2016
    Alea, Есть ссылка на оригинальную статью?


    В статье есть целый список литературы.
    11. M. Sipko. Machine Learning for the Prediction of Professional Tennis Matches. Technical report, Imperial College London, London, 2015.

    Гугл найдет.
    Ответить Цитировать
    2/4
    + 0
  • В начале сконцентрируюсь на НХЛ .

    Во-первых, мне больше всего нравиться следить за хоккеем.

    Во-вторых, сезон стартует завтра.

    В-третьих, множество матчей каждый день.
    Ответить Цитировать
    4/11
    + 0
  • Первым делом надо получить историю коэффициентов. За основу возьмем pinnacle.

    Нашел сайт http://scanbet.ru/archive/pinnacle

    Достаточно в удобном виде представлены движение коэффициентов, но только с 1 января 2015 г. Для начала хватит, но в дальнейшем придется искать дополнительный источник.

    Парсер сделать не проблема, структура страниц представлена в удобном виде.

    Набьем базу данных информацией за прошлый сезон.
    Ответить Цитировать
    5/11
    + 0
  • "Так же если я буду заходить не туда, то сообщество даст дельные советы"

    Не, ну раз ты сам говоришь, что сообщество может давать тебе советы, то, пожалуй, я начну

    Вообще вот так вот сразу браться за командные виды спорта - это смело. Вроде бы мат модель для командных видов спорта выглядит гораздо сложнее индивидуальных и не факт, что на имеющейся статистике можно построить что-либо, что может давать +.

    Это я к тому, что есть более просты виды спорта для построения мат. модели, к примеру Дартс и Снукер. Да, это смолл маркеты, но сейчас, на первом этапе, важно ведь просто попробовать. Дартс я сам занимался, могу подсказать что использовать и где статистику брать. Да и по снукеру тоже знаю где статистику тащить.
    Ответить Цитировать
    3/4
    + 0
  • iSmart @ 11.10.2016
    Блог мне нужен для того, чтобы структурировать полученную информацию. .


    В интернетах тебе обязательно структурировать? Пиши как есть цели.
    Ответить Цитировать
    1/1
    + 1
  • iSmart, Не ну раз решил начать с НХЛ то вперед за продвинутой статистикой.
    Ответить Цитировать
    1/1
    + 1
  • Так, получилось взять движение коэффициентов за прошлый сезон НХЛ от пинакла.

    Коэффициенты делятся на результаты в основное время и с учетом овертайма (П1 П2; Ф1 Ф2; Тотал);

    Всего записей в базе: 42918.

    Выкладываю дамп MySQL, вдруг кому пригодится.

    NHL20151016.zip (593 килобайт) Кол-во скачиваний: 129

    Ответить Цитировать
    6/11
    + 3
  • Rumomote @ 12.10.2016
    iSmart, Не ну раз решил начать с НХЛ то вперед за продвинутой статистикой.


    Расширенная статистика это конечно хорошо, но в первом приближение возьму только результаты игр.

    Для начала задача сопоставить результаты и коэффициенты, а дальше расширять данные.
    Ответить Цитировать
    7/11
    + 1
  • Результаты игр беру со sports.ru. Выбор банален. Легкий формат страниц для парсинга.
    Ответить Цитировать
    8/11
    + 1
  • получается, цель - кибер для валуев, так? собрать и отобрать не так сложно вроде, я далеко не прогер, но интересовался, а вот фильтры и алгоритмы проест мозг, если уже руками получалось делать, но просто времязатратно, то годно, если нет модели игры, то я чет не очень понял, зачем собирать данные и их отбирать, для чего?)
    Ответить Цитировать
    1/1
    + 0
  • Ну и дамп с результатами игр.

    NHL20152016.zip (609 килобайт) Кол-во скачиваний: 125

    Ответить Цитировать
    9/11
    + 1
  • alcofriend22 @ 19.10.2016
    получается, цель - кибер для валуев, так? собрать и отобрать не так сложно вроде, я далеко не прогер, но интересовался, а вот фильтры и алгоритмы проест мозг, если уже руками получалось делать, но просто времязатратно, то годно, если нет модели игры, то я чет не очень понял, зачем собирать данные и их отбирать, для чего?)


    Иду от простого сложного. Сначала получаем данные, потом их структурируем, дальше строим модели и алгоритмы
    Ответить Цитировать
    10/11
    + 1
  • Сразу откидываю идеи делать алгоритмы вида: последовательность событий приводит к определенному результату.

    Например на главной джипситим была статья: https://www.gipsyteam.online/news/5271-sport-i-stavki-5-18-oktyabrya

    В ней расписывался алгоритм "фактор выездной серии". Автор сделал вывод, что при таком подходе можно играть в плюс.

    У всех БК есть программное обеспечение, которое может рассчитать такие стратегии. Даже не стратегии, а вероятные исходы. Так, что такие стратегии дают плюс на удачу. Либо плюс на прошлых результатах. Подогнать несложно.

    Я думаю, что на дистанции это явный минус.

    Надо копать в другую сторону. В какую? Это вопрос ...
    Ответить Цитировать
    11/11
    + 1
  • iSmart @ 20.10.2016
    Так, что такие стратегии дают плюс на удачу. Либо плюс на прошлых результатах. Подогнать несложно.


    так все просто. Надо просто понимать какое кол-во матчей должно быть в тестирующей выборке, чтобы можно было считать итог достоверным.
    Ответить Цитировать
    4/4
    + 1
  • У меня есть материал для тебя, напиши почту куда отправить.
    Ответить Цитировать
    1/1
    + 0
1 человек читает эту тему (1 гость):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.