Заметил одно любопытное явление: команды могут первые десять или даже двадцать туров идти претендентами на титул, хотя до начала сезона никто этого не ждал. Бывают и более экстремальные случаи, например «Лестер» в сезоне 2015/16: он не только провёл первые 10–20 туров на высоком уровне, но и выиграл АПЛ. Такие вспышки захватывают, но обычно гаснут в течение одного сезона. Даже если команде удаётся удержаться на вершине весь сезон, как «Лестеру», в следующем она часто возвращается в тень.
С другой стороны, есть «Бавария», «Барселона», «Реал», «Ливерпуль», «Манчестер Сити» и им подобные. Пусть у них не задалось пару туров или даже весь сезон, все знают, что они исправят ситуацию и не превратятся в середняков. В этих клубах столько ресурсов и опыта управления, что временное падение воспринимается лишь как заминка.
Мне хочется смотреть не на результаты команды в конкретный момент, а на её развитие в целом. Если команда начала хуже, чем от неё ожидали, это случайность или у неё реальные проблемы? Если старт удачный, есть ли база для долгосрочного роста или это случайный фейерверк? Поскольку я буду анализировать не одну и даже не десять стран, а гораздо больше, я начал разрабатывать свой инструмент. Он будет собирать данные из разных лиг, упорядочивать их в понятные таблицы и помогать быстро оценивать, насколько сильны были результаты в прошлых сезонах по сравнению с её текущим положением.
Это ты автор этого творения? https://habr.com/en/articles/706128/
Первое, что удалось настроить – это автоматический сбор «сырых» данных турнирных таблиц по сезонам. Скрипт проходит по списку чемпионатов и лет, парсит таблицы с сайта и сохраняет результат в файлы с полями «команда», «матчи», «победы», «ничьи», «поражения», «разница мячей», «очки» и так далее. Например, вот как выглядит выгрузка АПЛ за последний сезон.
Сейчас я приступаю к следующему этапу – организации базы данных для хранения этих таблиц. Планирую сделать реляционную схему с таблицами сезонов, команд и их позиций, настроить индексы по лигам и годам. После этого будет просто конвертировать «сырые» SQL-таблицы, а дальше – создавать представления и отчёты, на основе которых можно строить визуализации и дашборды.
Fabolous @ 31.05.25Это ты автор этого творения? https://habr.com/en/articles/706128/
Какова, по-твоему, вероятность?
Ну всё, держитесь с.. буки!
Все подобные инструменты: а) нерабочие и б) нерентабельны. Обратного еще никто не доказал (фантики на мониторингах не в счет).
А компот кф?
Расширил сбор данных:
Создал и настроил базу данных football.db в SQLite. Там есть шесть простых таблиц:
1. Country: список стран (id, название, код).
2. Division: лиги в каждой стране (id, название, country_id).
3. Season: сезоны лиг (id, метка «2024/2025», год начала, год окончания, division_id).
4. Team: команды (id, название, country_id, slug).
5. TeamSeason: какие команды играли в каком сезоне и лиге (id, team_id, season_id, division_id).
6. Standing: позиции и статистика команд в сезоне (id, ts_id, место, очки, матчи, победы, поражения, голы и т. д.).
С такой схемой легко вытягивать нужную статистику. Для локальной разработки SQLite пока хватает. Когда данных станет много, можно перейти на PostgreSQL или MySQL.
Идея о экспериментах по теме появилась именно сейчас, или есть какие -то подобные наработки с помощью более простых программ ранее? Вообще ставками увлекся давно и какие результаты в последнее время, не важно теоретика или практика.
Fabolous @ 31.05.25Идея о экспериментах по теме появилась именно сейчас, или есть какие -то подобные наработки с помощью более простых программ ранее? Вообще ставками увлекся давно и какие результаты в последнее время, не важно теоретика или практика.
Ставками увлекаюсь уже лет двадцать. Конечно, в итоге я в минусе, но ставки для меня безобидное развлечение. Готов проигрывать по 100-200 долларов в месяц, суммы, которые никак не влияют на меня или на мою семью.
Идея заняться чем-то подобным крутится в моей голове уже два года. Постоянно появляются разные мысли, но я откладывал всё из-за занятости. Сейчас решил наконец выделить свободное время на это увлечение и посмотреть, что получится. Не стоит воспринимать этот блог как попытку заработать деньги, это скорее хобби.
MdL, Немного странно почему желание начать такую трудную работу возникло именно в конце сезона, лето , отдых впереди, почему не зимой, когда дел нет никаких, ничего не отвлекает, кучу времени до начала нового сезона, ведь статистика многогранна, куча мелочей.
Fabolous @ 31.05.25Это ты автор этого творения? https://habr.com/en/articles/706128/
Почитал.
Нет дефицита в таких "дрочистах", верящих в то что 2+2 может быть 5 и что они могут предсказывать будущее. Но букмекеры почему-то до сих пор не обанкротились. Запомните, как букмекер вам говорю. Нет специалистов по будущему, есть по прошлому, да и те не очень хорошие.
Помните, лет 15 назад, чуть меньше, был такой проект Betegy (на ютубе есть это видео). Даже Сергей Стиллавин брал у них интервью на радиво. Тоже цыганили что статистика и составы могут в будущее. Хорошо стелили для обывателя. Давно уже в b2b перешли. Потому что понимают, что вся эта предсказательная чепуха не работает от слова совсем.
Я конечно не против безумцев и с уважением к бездельникам увлеченным людям. Если топикстартер докажет обратное. Но такого не случится с вероятностью 100%.
Планируешь учитывать минуты забитых голов и результаты первого тайма, чтобы использовать это для поиска валуйности при ставке после нулевого 1 тайма, вести парсинг и кубковых турниров (ведь есть мотивационное влияние на состав и схему игры во внутреннем чемпионате перед или после , условно ЛЧ, ЧМ и т.д., и это отделение матчей возможно давало бы более точные результаты), парсинг кф нескольких периодов жизни линии?
Behter @ 31.05.25Почитал.
Нет дефицита в таких "дрочистах", верящих в то что 2+2 может быть 5 и что они могут предсказывать будущее. Но букмекеры почему-то до сих пор не обанкротились. Запомните, как букмекер вам говорю. Нет специалистов по будущему, есть по прошлому, да и те не очень хорошие.
Помните, лет 15 назад, чуть меньше, был такой проект Betegy (на ютубе есть это видео). Даже Сергей Стиллавин брал у них интервью на радиво. Тоже цыганили что статистика и составы могут в будущее. Хорошо стелили для обывателя. Давно уже в b2b перешли. Потому что понимают, что вся эта предсказательная чепуха не работает от слова совсем.
Я конечно не против
безумцеви с уважением кбездельникамувлеченным людям. Если топикстартер докажет обратное. Но такого не случится с вероятностью 100%.
Бех, тебе никто ничего не докажет. Ведь ты точная копия Давида Багдасарова, так же не исключаю что ты и есть Давид.
Fabolous @ 31.05.25MdL, Немного странно почему желание начать такую трудную работу возникло именно в конце сезона, лето , отдых впереди, почему не зимой, когда дел нет никаких, ничего не отвлекает, кучу времени до начала нового сезона, ведь статистика многогранна, куча мелочей.
Привет. Зимой у меня очень много работы и заказов, так что свободного времени почти нет. Летом же поток заказов заметно падает, работы становится меньше, и появляется время на хобби.
Fabolous @ 31.05.25Планируешь учитывать минуты забитых голов и результаты первого тайма, чтобы использовать это для поиска валуйности при ставке после нулевого 1 тайма, вести парсинг и кубковых турниров (ведь есть мотивационное влияние на состав и схему игры во внутреннем чемпионате перед или после , условно ЛЧ, ЧМ и т.д., и это отделение матчей возможно давало бы более точные результаты), парсинг кф нескольких периодов жизни линии?
На первом этапе я планирую работать только с силой команд и составами. Анализ будет полностью ручным, без автоматизации. Софт разрабатываю именно для удобного ручного анализа.
За три дня реализовал следующее:
1. Полностью пересмотрел и оптимизировал структуру базы данных.
2. Собрал и загрузил информацию по всем странам, турнирам и сезонам.
В итоге получилось более 15 000 сезонов. Сейчас готовлю базу к следующему этапу - загрузке турнирных таблиц для всех этих сезонов.
Все идет по плану, полет нормальный.
MdL @ 03.06.25На первом этапе я планирую работать только с силой команд и составами. Анализ будет полностью ручным, без автоматизации. Софт разрабатываю именно для удобного ручного анализа.
Странное решение. Здесь ведь главное оборот, который обеспечивает диверсификацию рисков, снижение дисперсии, и максимизацию профита.
Рад сообщить, что удалось загрузить в базу более 15 000 турнирных таблиц различных футбольных турниров. Это позволяет получить полный «скелет» для дальнейшей аналитики.
Следующем шагом стало начало создания веб-приложения.
Добавил в него список стран и турниров. На скриншоте показаны все доступные страны, но пока есть пара дубликатов. Планирую в ближайшее время убрать их. Еще проблема что помимо стран представлены континентые игры (Европа, Африка и т. д.). Уберу, но позже. Не очень критично.
Следующим добавлением стали Турниры и Сезоны. Для каждой страны отображаются все доступные турниры и их сезонов. Например, для Италии сразу видно, сколько там лиг и дивизионов.
Страница сезона. Пока что доступна только базовая «турнирная таблица». Еще не загружал матчи, календарь и составы команд, статистику матчей. Буду все это подключать на следующем этапе.
И последнее что удалось уже реализорвать - История выступлений клуба. Есть простая страница с результатами команды по сезонам (например, Wycombe Wanderers). Пока - только итоги (место, победы/ничьи/поражения, голы, очки).
В общем пока так. Что это может дать? Ведь все турнирки можно найти в свободном доступе, но важно понимать что данные которые я вывел - это лишь визуал. Самое главное это наличие всех этих цифр в базе данных. Например захотел и вывел историю клуба по сезонам в удобном виде - такое редко где найдешь.
Главное что для анализов я смогу создавать удобные метрики и страницы. И конечно база статистики сильно расширится: там появятся составы команд, сила игроков, статистика матчей и возможно коэффициенты команд если их где-то удобно найти.
Прошло 11 дней с момента последнего поста. За это время у меня произошли большие изменения. Я закачал базу из 2.5 миллионов футбольных матчей.
На текущем этапе в базе есть ключевая информация: страна, чемпионат, сезон, дата матча, соперники и итоговый счет. Статистику по игре и составы пока не затягивал – это следующий этап.
В прошлом посте я упоминал, что скачал турнирные таблицы для более чем 16 000 сезонов. Но после загрузки всех матчей полностью отказался от этих таблиц – теперь я рассчитываю собственные, на основе сырых данных о матчах. Это дает ряд преимуществ. Например, можно будет сделать функционал, который покажет актуальную таблицу на любую выбранную дату в прошлых сезонах. Пока это не реализовано, но точно сделаю.
На странице с информацией по странам я реализовал группировку турниров по гендерному признаку, а также отдельное разделение на взрослые и юношеские турниры. Внутри каждой категории добавил сортировку по уровню – теперь можно увидеть, какой дивизион в стране сильнейший, какой – второй и так далее.
Кроме удобства навигации это позволяет строить вот такие графики:
На графике выше показано, как сезон за сезоном росла сила команды Борнмут – по показателю "разница голов / количество матчей в чемпионате". Хорошо видно, как команда в 2008 году выступала в четвертом по уровню дивизионе Англии и постепенно шаг за шагом добралась до АПЛ. Также можно отследить, в какие сезоны ее показатели улучшались, а в какие – проседали. Для меня это один из ключевых инструментов анализа перспектив команд на следующий сезон. Благодаря таким графикам я смогу оценивать, где команда, скорее всего, будет развиваться и улучшать результаты – а где наоборот.
Пример – Честерфилд.
Команда вышла на пик в сезоне 14/15: тогда в третьем по силе дивизионе у нее было +0.28 гола за игру. Но дальше началось свободное падение – в каждом из следующих двух сезонов разница ухудшалась на катастрофические -0.5 гола за игру. Команда вылетела в четвертый дивизион, где в первый же сезон сыграла с разницей -0.78 – даже хуже, чем годом ранее в третьем. Результат – новое понижение. Только спустя два сезона в пятом дивизионе удалось остановить это падение. И с тех пор, на протяжении четырех сезонов в пятом дивизионе, команда стабильно улучшала показатели. В итоге, спустя шесть лет, она сделала +0.89 за игру и вернулась в четвертый дивизион. А там – уже солидные +0.41 гола за матч. Очевидно, что в последние годы Честерфилд развивается. Пять лет подряд – стабильный рост. Значит, руководство работает грамотно.
Дальше буду смотреть летние трансферы: кто ушел, кто пришел, какой возраст у ключевых игроков. Если возрастной – стоит ожидать снижения уровня прошлогодних лидеров, если наоборот – может быть еще рост. В общем, много интересных мыслей, но сначала – сбор статистики и составов для всех матчей.
Из мелочей – довел до ума главную страницу. Удалил дубликаты, вынес международные матчи в отдельный блок, а аматорские лиги временно убрал.
Работы впереди очень много. Но именно это и драйвит.
MdL, Отличный блог, буду следить. Занимаюсь данными плотно, давно и профессионально. Но не ставками на спорт.
Пока моя мысль by default, что букмекеров я не обыграю. Но есть идея изучить что происходит на https://polymarket.com/ Там люди иногда сильно пере\недооценивают шансы просто в силу психологии. И есть доступ к их API чтобы торгового бота сделать. Но я пока сильно поверхностно в этом. Жду когда время появится.
И зачем всё это ? Эти данные детские в сравнении с аналитическими мощностями букмекеров.
Борьба с ветряными мельницами не иначе
Всем привет, Джипситим!
Я убеждён, что глубокий анализ числовых данных позволяет количественно оценить практически любые процессы в мире, в том числе выявлять и использовать преимущества в ставках. И вот мне пришла идея: собрать всю доступную информацию о матчах в одном месте и системно её проанализировать.
Чтобы это сделать, я решил разработать собственный софт. Он будет автоматически собирать данные с официальных источников, структурировать их в удобные таблицы.
И да, это ни в коем случае не реклама готовых решений — всё я пишу сам, исключительно для личных экспериментов и удовольствия. Для меня это хобби и возможность глубже погрузиться в аналитическую сторону ставок, а заодно, кто знает, выловить пару интересных точек для профита.
В этом блоге буду делиться результатами разработки и первыми инсайтами примерно раз в несколько дней. Буду рад вашим вопросам, советам и идеям!