Ставочный Пазл: Data в Ставках

21
MdL
Статистика
Статистика
21
Статистика темы
  • Популярность
    Топ-4944
  • Постов
    22
  • Просмотров
    4,074
  • Подписок
    21
  • Карма автора
    +26
1 2
  • Всем привет, Джипситим!

     

    Я убеждён, что глубокий анализ числовых данных позволяет количественно оценить практически любые процессы в мире, в том числе выявлять и использовать преимущества в ставках. И вот мне пришла идея: собрать всю доступную информацию о матчах в одном месте и системно её проанализировать.

     

    Чтобы это сделать, я решил разработать собственный софт. Он будет автоматически собирать данные с официальных источников, структурировать их в удобные таблицы.

     

    И да, это ни в коем случае не реклама готовых решений — всё я пишу сам, исключительно для личных экспериментов и удовольствия. Для меня это хобби и возможность глубже погрузиться в аналитическую сторону ставок, а заодно, кто знает, выловить пару интересных точек для профита.

     

    В этом блоге буду делиться результатами разработки и первыми инсайтами примерно раз в несколько дней. Буду рад вашим вопросам, советам и идеям!

    Ответить Цитировать
    1/10
    + 2
  • Заметил одно любопытное явление: команды могут первые десять или даже двадцать туров идти претендентами на титул, хотя до начала сезона никто этого не ждал. Бывают и более экстремальные случаи, например «Лестер» в сезоне 2015/16: он не только провёл первые 10–20 туров на высоком уровне, но и выиграл АПЛ. Такие вспышки захватывают, но обычно гаснут в течение одного сезона. Даже если команде удаётся удержаться на вершине весь сезон, как «Лестеру», в следующем она часто возвращается в тень.

     

    С другой стороны, есть «Бавария», «Барселона», «Реал», «Ливерпуль», «Манчестер Сити» и им подобные. Пусть у них не задалось пару туров или даже весь сезон, все знают, что они исправят ситуацию и не превратятся в середняков. В этих клубах столько ресурсов и опыта управления, что временное падение воспринимается лишь как заминка.

     

    Мне хочется смотреть не на результаты команды в конкретный момент, а на её развитие в целом. Если команда начала хуже, чем от неё ожидали, это случайность или у неё реальные проблемы? Если старт удачный, есть ли база для долгосрочного роста или это случайный фейерверк? Поскольку я буду анализировать не одну и даже не десять стран, а гораздо больше, я начал разрабатывать свой инструмент. Он будет собирать данные из разных лиг, упорядочивать их в понятные таблицы и помогать быстро оценивать, насколько сильны были результаты в прошлых сезонах по сравнению с её текущим положением.

    Ответить Цитировать
    2/10
    + 0
  •  Это ты автор этого творения?  https://habr.com/en/articles/706128/

    Ответить Цитировать
    1/7
    + 0
  • Первое, что удалось настроить – это автоматический сбор «сырых» данных турнирных таблиц по сезонам. Скрипт проходит по списку чемпионатов и лет, парсит таблицы с сайта и сохраняет результат в файлы с полями «команда», «матчи», «победы», «ничьи», «поражения», «разница мячей», «очки» и так далее. Например, вот как выглядит выгрузка АПЛ за последний сезон.

     

     

    Сейчас я приступаю к следующему этапу – организации базы данных для хранения этих таблиц. Планирую сделать реляционную схему с таблицами сезонов, команд и их позиций, настроить индексы по лигам и годам. После этого будет просто конвертировать «сырые» SQL-таблицы, а дальше – создавать представления и отчёты, на основе которых можно строить визуализации и дашборды.

     

    Fabolous @ 31.05.25  

     Это ты автор этого творения?  https://habr.com/en/articles/706128/

    Какова, по-твоему, вероятность?

    Ответить Цитировать
    3/10
    + 0
  • Ну всё, держитесь с.. буки!

    Все подобные инструменты: а) нерабочие и б) нерентабельны. Обратного еще никто не доказал (фантики на мониторингах не в счет).

    Ответить Цитировать
    1/2
    + 0
  • А компот  кф?

    Ответить Цитировать
    2/7
    + 0
  • Расширил сбор данных:

     

     


    Создал и настроил базу данных football.db в SQLite. Там есть шесть простых таблиц:

    1. Country: список стран (id, название, код).

    2. Division: лиги в каждой стране (id, название, country_id).

    3. Season: сезоны лиг (id, метка «2024/2025», год начала, год окончания, division_id).

    4. Team: команды (id, название, country_id, slug).

    5. TeamSeason: какие команды играли в каком сезоне и лиге (id, team_id, season_id, division_id).

    6. Standing: позиции и статистика команд в сезоне (id, ts_id, место, очки, матчи, победы, поражения, голы и т. д.).

     

    С такой схемой легко вытягивать нужную статистику. Для локальной разработки SQLite пока хватает. Когда данных станет много, можно перейти на PostgreSQL или MySQL.

     

    Ответить Цитировать
    4/10
    + 0
  • Идея о экспериментах по теме появилась именно сейчас, или есть какие -то подобные наработки с помощью более простых программ ранее? Вообще ставками увлекся давно и какие результаты в последнее время, не важно теоретика или практика.

    Ответить Цитировать
    3/7
    + 0
  • Fabolous @ 31.05.25 

    Идея о экспериментах по теме появилась именно сейчас, или есть какие -то подобные наработки с помощью более простых программ ранее? Вообще ставками увлекся давно и какие результаты в последнее время, не важно теоретика или практика.

    Ставками увлекаюсь уже лет двадцать. Конечно, в итоге я в минусе, но ставки для меня безобидное развлечение. Готов проигрывать по 100-200 долларов в месяц, суммы, которые никак не влияют на меня или на мою семью.

     

    Идея заняться чем-то подобным крутится в моей голове уже два года. Постоянно появляются разные мысли, но я откладывал всё из-за занятости. Сейчас решил наконец выделить свободное время на это увлечение и посмотреть, что получится. Не стоит воспринимать этот блог как попытку заработать деньги, это скорее хобби.

    Ответить Цитировать
    5/10
    + 1
  •  MdL, Немного странно почему желание начать такую трудную работу возникло именно в конце сезона, лето , отдых впереди, почему не зимой, когда дел нет никаких, ничего не отвлекает, кучу времени до начала нового сезона, ведь статистика многогранна, куча мелочей.

    Ответить Цитировать
    4/7
    + 0
  • Fabolous @ 31.05.25  

     Это ты автор этого творения?  https://habr.com/en/articles/706128/

    Почитал.

    Нет дефицита в таких "дрочистах", верящих в то что 2+2 может быть 5 и что они могут предсказывать будущее. Но букмекеры почему-то до сих пор не обанкротились. Запомните, как букмекер вам говорю. Нет специалистов по будущему, есть по прошлому, да и те не очень хорошие.

     

    Помните, лет 15 назад, чуть меньше, был такой проект Betegy (на ютубе есть это видео). Даже Сергей Стиллавин брал у них интервью на радиво. Тоже цыганили что статистика и составы могут в будущее. Хорошо стелили для обывателя. Давно уже в b2b перешли. Потому что понимают, что вся эта предсказательная чепуха не работает от слова совсем.

     

    Я конечно не против безумцев и с уважением к бездельникам увлеченным людям. Если топикстартер докажет обратное. Но такого не случится с вероятностью 100%.

    Ответить Цитировать
    2/2
    + 1
  • Планируешь учитывать минуты забитых голов и результаты первого тайма, чтобы использовать это для поиска валуйности при ставке после нулевого 1 тайма, вести парсинг и кубковых турниров (ведь есть мотивационное влияние на состав и схему игры во внутреннем чемпионате перед или после , условно ЛЧ, ЧМ и т.д., и это отделение матчей возможно давало бы более точные результаты), парсинг кф нескольких периодов жизни линии?

    Ответить Цитировать
    5/7
    + 0
  • Behter @ 31.05.25 

    Почитал.

    Нет дефицита в таких "дрочистах", верящих в то что 2+2 может быть 5 и что они могут предсказывать будущее. Но букмекеры почему-то до сих пор не обанкротились. Запомните, как букмекер вам говорю. Нет специалистов по будущему, есть по прошлому, да и те не очень хорошие.

     

    Помните, лет 15 назад, чуть меньше, был такой проект Betegy (на ютубе есть это видео). Даже Сергей Стиллавин брал у них интервью на радиво. Тоже цыганили что статистика и составы могут в будущее. Хорошо стелили для обывателя. Давно уже в b2b перешли. Потому что понимают, что вся эта предсказательная чепуха не работает от слова совсем.

     

    Я конечно не против безумцев и с уважением к бездельникам увлеченным людям. Если топикстартер докажет обратное. Но такого не случится с вероятностью 100%.

     Бех, тебе никто ничего не докажет. Ведь ты точная копия Давида Багдасарова, так же не исключаю что ты и есть Давид.

    Ответить Цитировать
    6/7
    + 0
  • Fabolous @ 31.05.25 

     MdL, Немного странно почему желание начать такую трудную работу возникло именно в конце сезона, лето , отдых впереди, почему не зимой, когда дел нет никаких, ничего не отвлекает, кучу времени до начала нового сезона, ведь статистика многогранна, куча мелочей.

    Привет. Зимой у меня очень много работы и заказов, так что свободного времени почти нет. Летом же поток заказов заметно падает, работы становится меньше, и появляется время на хобби.

     

    Fabolous @ 31.05.25 

    Планируешь учитывать минуты забитых голов и результаты первого тайма, чтобы использовать это для поиска валуйности при ставке после нулевого 1 тайма, вести парсинг и кубковых турниров (ведь есть мотивационное влияние на состав и схему игры во внутреннем чемпионате перед или после , условно ЛЧ, ЧМ и т.д., и это отделение матчей возможно давало бы более точные результаты), парсинг кф нескольких периодов жизни линии?

    На первом этапе я планирую работать только с силой команд и составами. Анализ будет полностью ручным, без автоматизации. Софт разрабатываю именно для удобного ручного анализа.

     

    За три дня реализовал следующее: 

    1. Полностью пересмотрел и оптимизировал структуру базы данных. 

    2. Собрал и загрузил информацию по всем странам, турнирам и сезонам. 

     

    В итоге получилось более 15 000 сезонов. Сейчас готовлю базу к следующему этапу - загрузке турнирных таблиц для всех этих сезонов. 

     

     

     

    Все идет по плану, полет нормальный.

    Ответить Цитировать
    6/10
    + 0
  • MdL @ 03.06.25 

    На первом этапе я планирую работать только с силой команд и составами. Анализ будет полностью ручным, без автоматизации. Софт разрабатываю именно для удобного ручного анализа.

     Странное решение.  Здесь ведь главное оборот, который обеспечивает диверсификацию рисков, снижение дисперсии, и максимизацию профита.

    Ответить Цитировать
    7/7
    + 0
  • Рад сообщить, что удалось загрузить в базу более 15 000 турнирных таблиц различных футбольных турниров. Это позволяет получить полный «скелет» для дальнейшей аналитики.


    Следующем шагом стало начало создания веб-приложения.


    Добавил в него список стран и турниров. На скриншоте показаны все доступные страны, но пока есть пара дубликатов. Планирую в ближайшее время убрать их. Еще проблема что помимо стран представлены континентые игры (Европа, Африка и т. д.). Уберу, но позже. Не очень критично.

     

     

    Следующим добавлением стали Турниры и Сезоны. Для каждой страны отображаются все доступные турниры и их сезонов. Например, для Италии сразу видно, сколько там лиг и дивизионов.

     

     

     

    Страница сезона. Пока что доступна только базовая «турнирная таблица». Еще не загружал матчи, календарь и составы команд, статистику матчей. Буду все это подключать на следующем этапе.

     

     

    И последнее что удалось уже реализорвать - История выступлений клуба. Есть простая страница с результатами команды по сезонам (например, Wycombe Wanderers). Пока - только итоги (место, победы/ничьи/поражения, голы, очки).

     

     

    В общем пока так. Что это может дать? Ведь все турнирки можно найти в свободном доступе, но важно понимать что данные которые я вывел - это лишь визуал. Самое главное это наличие всех этих цифр в базе данных. Например захотел и вывел историю клуба по сезонам в удобном виде - такое редко где найдешь.

     

    Главное что для анализов я смогу создавать удобные метрики и страницы. И конечно база статистики сильно расширится: там появятся составы команд, сила игроков, статистика матчей и возможно коэффициенты команд если их где-то удобно найти.

    Ответить Цитировать
    7/10
    + 0
  • Прошло 11 дней с момента последнего поста. За это время у меня произошли большие изменения. Я закачал базу из 2.5 миллионов футбольных матчей. 

     

     

    На текущем этапе в базе есть ключевая информация: страна, чемпионат, сезон, дата матча, соперники и итоговый счет. Статистику по игре и составы пока не затягивал – это следующий этап.

     

    В прошлом посте я упоминал, что скачал турнирные таблицы для более чем 16 000 сезонов. Но после загрузки всех матчей полностью отказался от этих таблиц – теперь я рассчитываю собственные, на основе сырых данных о матчах. Это дает ряд преимуществ. Например, можно будет сделать функционал, который покажет актуальную таблицу на любую выбранную дату в прошлых сезонах. Пока это не реализовано, но точно сделаю.

     

    На странице с информацией по странам я реализовал группировку турниров по гендерному признаку, а также отдельное разделение на взрослые и юношеские турниры. Внутри каждой категории добавил сортировку по уровню – теперь можно увидеть, какой дивизион в стране сильнейший, какой – второй и так далее.

     

     

    Кроме удобства навигации это позволяет строить вот такие графики:

     

     

    На графике выше показано, как сезон за сезоном росла сила команды Борнмут – по показателю "разница голов / количество матчей в чемпионате". Хорошо видно, как команда в 2008 году выступала в четвертом по уровню дивизионе Англии и постепенно шаг за шагом добралась до АПЛ. Также можно отследить, в какие сезоны ее показатели улучшались, а в какие – проседали. Для меня это один из ключевых инструментов анализа перспектив команд на следующий сезон. Благодаря таким графикам я смогу оценивать, где команда, скорее всего, будет развиваться и улучшать результаты – а где наоборот.

     

    Пример – Честерфилд.

    Команда вышла на пик в сезоне 14/15: тогда в третьем по силе дивизионе у нее было +0.28 гола за игру. Но дальше началось свободное падение – в каждом из следующих двух сезонов разница ухудшалась на катастрофические -0.5 гола за игру. Команда вылетела в четвертый дивизион, где в первый же сезон сыграла с разницей -0.78 – даже хуже, чем годом ранее в третьем. Результат – новое понижение. Только спустя два сезона в пятом дивизионе удалось остановить это падение. И с тех пор, на протяжении четырех сезонов в пятом дивизионе, команда стабильно улучшала показатели. В итоге, спустя шесть лет, она сделала +0.89 за игру и вернулась в четвертый дивизион. А там – уже солидные +0.41 гола за матч. Очевидно, что в последние годы Честерфилд развивается. Пять лет подряд – стабильный рост. Значит, руководство работает грамотно.

     

    Дальше буду смотреть летние трансферы: кто ушел, кто пришел, какой возраст у ключевых игроков. Если возрастной – стоит ожидать снижения уровня прошлогодних лидеров, если наоборот – может быть еще рост. В общем, много интересных мыслей, но сначала – сбор статистики и составов для всех матчей.


    Из мелочей – довел до ума главную страницу. Удалил дубликаты, вынес международные матчи в отдельный блок, а аматорские лиги временно убрал.

     

     

    Работы впереди очень много. Но именно это и драйвит.

    Ответить Цитировать
    8/10
    + 11
  •  MdL, Отличный блог, буду следить. Занимаюсь данными плотно, давно и профессионально. Но не ставками на спорт.

     

    Пока моя мысль by default, что букмекеров я не обыграю. Но есть идея изучить что происходит на https://polymarket.com/ Там люди иногда сильно пере\недооценивают шансы просто в силу психологии. И есть доступ к их API чтобы торгового бота сделать. Но я пока сильно поверхностно в этом. Жду когда время появится.

    Ответить Цитировать
    1/1
    + 4
  • И зачем всё это ? Эти данные детские в сравнении  с аналитическими мощностями букмекеров. 

     

    Борьба с ветряными мельницами не иначе

    Ответить Цитировать
    1/1
    + 1
  • Efflorescence @ 17.06.25 

    И зачем всё это ? Эти данные детские в сравнении  с аналитическими мощностями букмекеров. 

     

    Борьба с ветряными мельницами не иначе

    MdL @ 31.05.25 

    Для меня это хобби и возможность глубже погрузиться в аналитическую сторону ставок.

    Ответить Цитировать
    9/10
    + 2
1 2
1 человек читает эту тему (1 гость):
Зачем регистрироваться на GipsyTeam?
  • Вы сможете оставлять комментарии, оценивать посты, участвовать в дискуссиях и повышать свой уровень игры.
  • Если вы предпочитаете четырехцветную колоду и хотите отключить анимацию аватаров, эти возможности будут в настройках профиля.
  • Вам станут доступны закладки, бекинг и другие удобные инструменты сайта.
  • На каждой странице будет видно, где появились новые посты и комментарии.
  • Если вы зарегистрированы в покер-румах через GipsyTeam, вы получите статистику рейка, бонусные очки для покупок в магазине, эксклюзивные акции и расширенную поддержку.