Sabermetrics (первоначально SABRmetrics ) — это оригинальный или общий термин для спортивной аналитики , эмпирического анализа бейсбола , особенно разработки расширенных метрик, основанных на статистике бейсбола , которые измеряют игровую активность. Термин происходит от прародителей движения, членов Общества американских исследований бейсбола (SABR), основанного в 1971 году, и был придуман Биллом Джеймсом , [ когда? ], который является одним из его пионеров и считается его самым выдающимся сторонником и публичным лицом. [1]
Термин «маниболл» используется для обозначения практики использования показателей для выявления «недооцененных игроков» и подписания с ними контрактов, которые в идеале станут контрактами «ниже рыночной стоимости», что дебютировало в попытках небольших рыночных команд конкурировать с гораздо большими ресурсами крупных рыночных команд.
Англо-американский спортивный обозреватель Генри Чедвик разработал систему счёта в Нью-Йорке в 1858 году. Это был первый способ, с помощью которого статистики смогли описать бейсбольный спорт, отслеживая различные аспекты игры в цифрах. [2] Создание системы счёта дало бейсбольным статистикам сводку индивидуальных и командных результатов в конкретной игре. [3]
То, что станет самым ранним исследованием Sabermetrics в 1970-х и 1980-х годах, началось в середине 20-го века с трудов Эрншоу Кука , одного из первых аналитиков бейсбола. Книга Кука 1964 года Percentage Baseball была одной из первых в своем роде. [4] Сначала большинство организованных бейсбольных команд и профессионалов отвергли работу Кука как бессмысленную. Идея науки о бейсбольной статистике начала обретать законность в 1977 году, когда Билл Джеймс начал выпускать Baseball Abstracts , свой ежегодный сборник данных по бейсболу. [5] [6] Однако идеи Джеймса не спешили находить широкое признание. [1]
Билл Джеймс считал, что существует широко распространенное заблуждение о том, как играют в бейсбол, утверждая, что этот вид спорта не определяется его правилами, а на самом деле, как резюмировал профессор инженерии Ричард Дж. Пуэрцер, «определяется условиями, в которых проводится игра, — в частности, бейсбольными стадионами, но также игроками, этикой, стратегиями, оборудованием и ожиданиями публики». [2] Ранние саберметристы — иногда считавшиеся бейсбольными статистиками — начали пытаться улучшить такую фундаментальную бейсбольную статистику, как средний показатель отбивания (просто количество отбиваний, деленное на количество попаданий) с помощью продвинутых математических формул. [7] [8] Также была исследована корреляция между средним показателем отбивания команды и набранными очками, [7] поскольку именно отбивания, а не попадания, приносят победу в бейсбольных матчах. Таким образом, хорошей мерой ценности игрока была бы его способность помогать своей команде набирать очки, которая, как было замечено, тесно коррелировала с количеством его попаданий на базу, что привело к разработке нового показателя — «процент попаданий на базу».
До того, как Билл Джеймс популяризировал саберметрику, Дэйви Джонсон , тогда второй бейсмен, игравший за Baltimore Orioles начала 1970-х годов в Главной лиге бейсбола (MLB), использовал IBM System/360 в пивоварне владельца команды Джерольда Хоффбергера для написания компьютерной симуляции бейсбола на основе FORTRAN . Несмотря на свои результаты, он не смог убедить своего менеджера Эрла Уивера , что он должен быть вторым в составе. Он написал программы на IBM BASIC, чтобы помочь ему управлять Tidewater Tides , и после того, как стал менеджером New York Mets в 1984 году, он договорился с сотрудником команды о написании приложения dBASE II для компиляции и хранения расширенных показателей по статистике команды. [9] Крейг Р. Райт был еще одним сотрудником MLB, работавшим с Texas Rangers в начале 1980-х годов. Во время работы в Rangers он стал известен как первый сотрудник фронт-офиса в истории MLB, работавший под названием «саберметрик». [10] [11]
Дэвид Смит основал Retrosheet в 1989 году с целью компьютеризировать результаты всех когда-либо сыгранных матчей высшей лиги бейсбола, чтобы точнее собирать и сравнивать статистику игры.
Команда Oakland Athletics начала использовать более количественный подход к бейсболу, сосредоточившись на принципах саберметрики в 1990-х годах. Первоначально это началось с Сэнди Олдерсона в качестве генерального менеджера команды, когда он использовал принципы для получения относительно недооцененных игроков. [1] Его идеи были продолжены, когда Билли Бин занял пост генерального менеджера в 1997 году, и занимал эту должность до 2015 года, и нанял своего помощника Пола ДеПодесту . [8] В течение сезона 2002 года известная «манибол» команда Oakland A выиграла 20 игр подряд, [12] термин (и подход к игре), который вскоре получил национальное признание, когда Майкл Льюис опубликовал книгу «Манибол: искусство побеждать в нечестной игре» (где «нечестность» отражала неравенство в ресурсах, доступных командам с большим рынком по сравнению с малыми) в 2003 году, чтобы подробно описать использование Бином расширенных метрик. В 2011 году вышел фильм, основанный на книге Льюиса, также называемый «Манибол » , который широко освещал методы, используемые в главном офисе «Окленд Атлетикс».
Sabermetrics отражал желание горстки любителей бейсбола расширить свое понимание игры, открыв новые идеи, которые могли быть скрыты в ее традиционной статистике. Их ранние усилия в конечном итоге переросли в оценку игроков в каждом аспекте игры, включая отбивание, подачу, бег по базе и игру в поле.
Средний показатель отбивания (BA) игрока в бейсбол (просто количество ударов, деленное на количество выходов на биту ) был исторической мерой эффективности нападения игрока, дополненной процентом сильных ударов (SA) [a] , который включал в себя его способность наносить сильные удары.
Билл Джеймс, как и другие ранние саберметристы, был обеспокоен тем, что средний показатель отбивания не учитывает другие способы, которыми отбивающий может достичь базы, помимо попадания, поскольку отбивающий на базе может набирать очки, а очки, а не попадания, приносят победу в бейсбольных матчах. [13]
Несмотря на то, что процент попаданий на базу и ранняя форма процента попаданий на базу (OBP), которая учитывает мячи, выведенные на базу («уок») и попадания по питчу , появились как минимум в 1941 году [14] , еще до Билла Джеймса (родился в 1949 году) и SABR (созданной в 1971 году), [13] пионеры бейсбольной статистики эпохи SABR уделили особое внимание взаимосвязи времени нахождения на базе и результатов за пробежки.
SA и OBP были объединены для создания современной статистики на базе плюс слаггинг (OPS). OPS представляет собой сумму процента на базе и процента слаггинга. Эта современная статистика стала полезной при сравнении игроков и является мощным методом прогнозирования очков, набранных любым игроком. [15] Расширенная версия OPS, «OPS+», включает в себя OPS, историческую статистику, приблизительные соображения и весовые коэффициенты защитной позиции, чтобы попытаться сравнить результаты игроков разных эпох.
Некоторые другие расширенные показатели, используемые для оценки эффективности отбивания, включают среднее взвешенное значение на базе , вторичное среднее значение , созданные раны и эквивалентное среднее значение .
Традиционной мерой эффективности питчера является средний заработанный пробег (ERA). Он рассчитывается как заработанные пробеги, разрешенные за девять иннингов. Средний заработанный пробег не отделяет способности питчера от способностей полевых игроков, с которыми он играет. [16] Еще одной классической мерой для питчера является процент побед питчера . Процент побед рассчитывается путем деления побед на общее количество решений (победы плюс поражения). Процент побед также сильно зависит от команды питчера, особенно от количества набранных ею пробегов.
Sabermetricians пытались найти различные меры производительности подачи, которые исключают производительность вовлеченных полевых игроков. Одним из самых ранних разработанных и одним из самых популярных в использовании является walks plus hits per inning pitched (WHIP), который, хотя и не является полностью независимым от защиты, имеет тенденцию указывать, сколько раз питчер, скорее всего, поставит игрока на базу (либо через walk, hit-by-pitch, либо base hit) и, таким образом, насколько эффективны бьющие против конкретного питчера в достижении базы.
Более поздним развитием стало создание системы статистики питчинга, независимой от защиты (DIPS). Воросу Маккракену приписывают разработку этой системы в 1999 году. [17] Благодаря своим исследованиям Маккракен смог показать, что между питчерами практически нет разницы в количестве попаданий, которые они допускают по мячам, введенным в игру, независимо от уровня их мастерства. [18] Некоторые примеры этой статистики — ERA, независимый от защиты , питчинг, независимый от поля, и компонент ERA, независимый от защиты . Другие специалисты по саберметрике продолжили работу в области DIPS, например, Том Танго, который управляет веб-сайтом Tango on Baseball sabermetrics.
Baseball Prospectus создала еще одну статистику, называемую периферийной ERA . Эта мера производительности питчера учитывает хиты, прогулки, пропущенные хоумраны и страйкауты с поправкой на факторы бейсбольного поля. [16] Каждый бейсбольный стадион имеет разные размеры, когда дело касается стены аутфилда, поэтому питчер не должен измеряться одинаково для каждого из этих парков. [19]
Средний показатель отбивания мячей в игре (BABIP) — еще один полезный показатель для определения производительности питчера. [18] Если у питчера высокий показатель BABIP, он часто будет демонстрировать улучшения в следующем сезоне, в то время как питчер с низким показателем BABIP часто будет демонстрировать спад в следующем сезоне. [18] Это основано на статистической концепции регрессии к среднему значению . Другие создали различные способы попытки количественно оценить отдельные подачи на основе характеристик подачи, в отличие от заработанных очков или отбитых мячей.
Value over replacement player (VORP) когда-то считался популярной статистикой sabermetric. [ уточнить ] Эта статистика пытается продемонстрировать, какой вклад игрок вносит в свою команду по сравнению с гипотетическим игроком, играющим на минимальном уровне, необходимом для удержания позиции в составе команды высшей лиги. Она была изобретена Кейтом Вулнером, бывшим автором sabermetric group/веб-сайта Baseball Prospectus .
Победы выше замены (WAR) — еще одна популярная саберметрическая статистика для оценки вклада игрока в его команду. [20] Подобно VORP, WAR сравнивает данного игрока с игроком уровня замены, чтобы определить количество дополнительных побед, которые игрок обеспечивает своей команде по сравнению со средним игроком на его позиции. [21] WAR, как и VORP , является кумулятивной статистикой, в значительной степени отражающей количество игрового времени игрока. [21]
«Статическая» статистика, основанная на простых соотношениях уже накопленных данных (например, средний показатель отбивания) и накопительных подсчетах (например, победах в питчинге), не раскрывает в полной мере все аспекты игры, представленные в их числовых итогах. [22] : 189–198 Расширенные метрики все больше разрабатываются и нацелены на рассмотрение внутриигровых действий (например, когда команда должна попытаться украсть базу, [23] и когда следует привлекать клоузеров ).
Sabermetrics обычно используются для всего: от спортивной журналистики до рассмотрения Зала славы бейсбола, выбора игроков и оценки стратегических вариантов в игре. Расширенные статистические меры могут использоваться для определения наград в течение сезона и в конце сезона (например, Игрок недели и MVP). Те, которые наиболее полезны для оценки прошлых результатов и прогнозирования будущих результатов, ценны для определения вклада игрока в его команду, [15] потенциальных обменов, переговоров по контрактам и арбитража.
Недавно [ когда? ] саберметрика была расширена для изучения результатов бейсболистов низшей лиги в AA и AAA по методу, аналогичному оценке на уровне высшей лиги, известному как эквивалентность низшей лиги. [15]
Машинное обучение и другие формы искусственного интеллекта (ИИ) могут быть с пользой применены для прогнозирования будущих результатов в моделировании бейсбола, в игровой стратегии, управлении персоналом, а также при составлении состава команды и заключении контрактов.
Две книги Билла Джеймса, The Bill James Historical Baseball Abstract (1985) и Win Shares (2002), продолжили развивать область саберметрики. [24] Работа его бывшего помощника Роба Нейера , который позже стал старшим писателем на ESPN.com и национальным редактором бейсбола SBNation, также способствовала популяризации саберметрики с середины 1980-х годов. [25]
Нейт Сильвер , бывший писатель и управляющий партнер Baseball Prospectus , изобрел PECOTA ( Алгоритм эмпирического сравнения и оптимизации игроков [26] ) в 2002–2003 годах, представив его публике в книге Baseball Prospectus в 2003 году. [27] Он предполагает, что карьеры похожих игроков будут следовать по схожей траектории. [28]
Начиная с бейсбольного сезона 2007 года, MLB начала искать технологию для записи подробной информации о каждом броске, сделанном в игре. Это стало известно как система PITCHf/x , которая использует видеокамеры для записи скорости подачи в точке ее выпуска и пересечения пластины, местоположения и угла (если таковой имеется) брейка. [13]
FanGraphs — это веб-сайт, который использует эту информацию и другие данные по матчам для публикации расширенной бейсбольной статистики и графиков. [29]