Sports Analytics 101 — Ancaman yang Diharapkan (xT) – Menuju AI

Sports Analytics 101 — Ancaman yang Diharapkan (xT) – Menuju AI

Pengarang: Nitin Chauhan

Awalnya diterbitkan di Towards AI the World’s Leading AI and Technology News and Media Company. Jika Anda sedang membangun produk atau layanan terkait AI, kami mengundang Anda untuk mempertimbangkan untuk menjadi sponsor AI. Di Towards AI, kami membantu menskalakan AI dan startup teknologi. Biarkan kami membantu Anda melepaskan teknologi Anda kepada massa.

Sports Analytics 101 — Ancaman yang Diharapkan (xT)

Ancaman kebobolan gol atau ancaman lawan mencetak gol melalui permainan. Courtesy: Gambar melalui Omar Ram

Sebagai bagian dari seri pengantar tentang analisis olahraga untuk pemula, saya menulis serangkaian artikel yang membahas dampak dan manfaat pembelajaran mesin dan analisis data. Sepanjang hidup saya sebagai calon ilmuwan data, saya selalu mencari panduan yang akan membantu saya mendapatkan pemahaman yang lebih dalam tentang analisis olahraga. Selama bertahun-tahun yang saya habiskan untuk meneliti dan mengikuti kursus, saya telah menemukan konsep panduan berjudul Sports Analytics 101. Harapan saya adalah panduan ini akan membantu orang-orang seperti saya dalam memahami dan menghargai analisis olahraga + data dengan lebih baik.

Mengapa Ancaman yang Diharapkan (xT)?

Dari pelatih hingga pramuka hingga penggemar, salah satu pertanyaan kritis adalah bagaimana kami mengevaluasi kualitas seorang pemain berdasarkan data. Kami sekarang memahami bahwa mencetak banyak gol berarti mereka bagus, dan menemukan peluang mencetak gol yang bagus (memiliki xG yang tinggi) juga penting. Bagaimana kami menilai semua operan, dribel, blok, dan intersepsi itu?

Sebuah konsep yang disebut Expected Threat telah diadopsi oleh Athletic ketika membahas kinerja pemain dan tim. Contoh peta probabilitas seperti itu diberikan di bawah ini, yang memberikan nilai untuk setiap titik di lapangan sepak bola berdasarkan probabilitas bahwa memiliki bola di sana akan menghasilkan gol.

Kotak zona lapangan sepak bola dengan setiap zona dialokasikan probabilitas ancaman yang diharapkan.

Apa Ancaman yang Diharapkan (xT)?

Menurut model ancaman yang diharapkan, pertandingan dibagi menjadi kepemilikan, yang merupakan periode di mana tim yang sama memiliki bola. Menurut xT, (1) pemain bertindak dengan sengaja untuk meningkatkan peluang mencetak gol bagi timnya, dan (2) peluang mencetak gol dapat ditangkap secara memadai dengan hanya mempertimbangkan lokasi bola.

Sebagai hasil dari poin (2), xT mewakili status permainan semata-mata dengan memanfaatkan lokasi bola saat ini. Akibatnya, xT melapisi kisi-kisi titik M*N di atas lapangan untuk membaginya menjadi beberapa zona. Pada gambar di bawah, xT(z) diilustrasikan sebagai akibat dari seberapa mengancam tim di setiap zona z.

Bagan ini menunjukkan Ancaman yang Diharapkan untuk berbagai bagian lapangan. Ini menunjukkan seberapa besar kemungkinan gol akan dicetak, mengingat tim memiliki penguasaan bola di lokasi tersebut.

Expected Threat (xT) dihitung dari tengah lapangan. Pergerakan ke arah gawang lebih mungkin daripada tembakan yang kebobolan dari posisi itu; Courtesy: Gambar melalui Karun Singh
Expected Threat (xT) dihitung di dekat kotak penalti. Ada peluang lebih tinggi dari gol yang kebobolan oleh tim di sekitar zona itu oleh lawan; Courtesy: Gambar melalui Karun Singh

Kami mengevaluasi tindakan berdasarkan efeknya pada kemungkinan penilaian. Harapan Ancaman (xT) didefinisikan sebagai perubahan kemungkinan penilaian. Pemain telah meningkatkan xT yang menguntungkan tim mereka jika mereka membuat operan yang memindahkan bola dari tempat di mana tim mereka tidak mungkin mencetak gol ke tempat di mana mereka memiliki kemungkinan lebih besar untuk mencetak gol. Ada aturan umum bahwa semakin dekat Anda dengan gawang, semakin besar kemungkinan tim Anda akan mencetak gol (walaupun umpan balik ke kiper juga bisa sangat berharga).

Memanfaatkan metrik Ancaman yang Diharapkan (xT)

Ruang memiliki nilai lebih besar daripada yang lain. Hal yang sama juga terjadi di lapangan sepak bola. Jika Anda memiliki bola di setengah Anda, itu kurang berharga daripada jika berada di dekat tepi kotak lawan Anda. Kita mengetahui dua hal itu secara intuitif, tetapi bagaimana kita mengukurnya? Ancaman yang diharapkan (xT, singkatnya) adalah solusi efektif untuk masalah ini karena berbagai alasan. Tidak semua serangan terhubung.

https://medium.com/media/9acff157cbe3a398218aee2c12d52c90/href

Sarah Rudd, yang menemukan Ancaman yang Diharapkan pada tahun 2011. Dia tidak menyebutnya begitu. Dia tidak menyebutnya apa-apa, tetapi dia memiliki wawasan matematika, menggunakan rantai Markov, yang menjadi dasarnya, yang dapat Anda lihat di video ini. Atas dasar ini, dia direkrut oleh StatDNA, yang diperoleh Arsenal tak lama kemudian. Karun Singh pertama kali menggunakan nama xT dalam sebuah posting blog pada tahun 2018, dan kemudian digunakan kembali di ruang publik.

Ketika kita melihat contoh yang jelas dari seorang ilmuwan wanita yang mengemukakan gagasan yang sekarang digunakan di mana-mana di wilayah yang didominasi laki-laki, penting untuk berhenti sejenak dan memberi tahu orang lain dari mana asalnya. Ilmu pengetahuan memiliki sejarah melupakan kontribusi perempuan, dan akan memalukan jika kita melakukan kesalahan yang sama di sepakbola, terutama di era modern.

Oleh karena itu, kita harus ingat bahwa ketika kita mendengar bahwa Liverpool menggunakan tujuan yang diharapkan ditambahkan dalam perekrutan selama 2018–19 atau bahwa Opta dan Statsbomb memiliki versi Ancaman yang diharapkan, ini semua terjadi karena seorang wanita muda yang sangat bertekad pergi ke banyak analisis olahraga konferensi sebanyak mungkin selama sepuluh tahun terakhir dan mengganggu semua orang yang dia temui sampai dia mendapatkan salah satu pekerjaan pertama dalam analisis sepakbola.

Dengan penjelasan itu, saya ingin membuat poin yang lebih halus. Ada banyak cara untuk mengukur Ancaman yang diharapkan, dibandingkan dengan tujuan yang diharapkan. Metodologi kami di Twelve Football berbeda dari yang diuraikan di atas. Selain itu, lebih baik… (Saya tidak mengatakan bahwa itu lebih baik daripada yang digunakan Rudd di Arsenal, tetapi ada banyak kemajuan sejak dia berbicara di 2011) Tetapi jika Anda memiliki, misalnya, data acara Opta, Statbomb, atau Wyscout , ini adalah metode terbaik untuk mengimplementasikan xT.

Ini logika kita. Sepak bola adalah permainan yang dinamis. Umpan tidak hanya berharga untuk di mana mereka berakhir tetapi juga untuk bagaimana mereka mengubah pertahanan. Oleh karena itu, kami menyertakan koordinat awal dan akhir operan saat menghitung Ancaman operan. Kami tidak menilai terlalu tinggi umpan silang ‘berharap’ di dalam kotak serta kualifikasi, seperti apakah itu umpan silang atau umpan terobosan.

Pemain dengan xT tertinggi di Premier League musim 202–21; Courtesy: Gambar melalui The Athletic

Ancaman terletak pada bagaimana bola dipindahkan daripada di mana bola berada. Akibatnya, bola lintas lapangan lebih berharga, dan backpass tidak menghasilkan poin minus, karena perubahan murni pada XT mungkin. Empat dari pengumpan terbaik di sepertiga terakhir musim lalu telah memberikan contoh umpan berharga menggunakan metode rantai kepemilikan.

Model ini mengakui pentingnya umpan silang Trent Alexander Arnold. Ancaman Ziyech (peringkat 7) terutama merupakan hasil dari umpan pendek ke dalam kotak, yang menempatkannya di peringkat ketiga di Liga Premier per 90 selama sepertiga terakhir musim ini. De Bruyne menempati peringkat pertama di sepertiga terakhir musim ini.

Metode ini didasarkan pada kekuatan rantai kepemilikan. Setiap urutan permainan dikelompokkan berdasarkan siapa yang memegang bola. Ketika sebuah tim mencetak skor, bola keluar dari permainan, atau lawan menyentuh bola dua kali atau lebih, sebuah rantai putus. Video di bawah ini mengilustrasikan bagaimana nilai operan dapat diukur berdasarkan ini.

Meskipun sekarang kami menyembunyikan situs peringkat online kami (karena kami ingin Anda mengunduh aplikasi kami yang penuh warna), Anda masih dapat melihatnya di sini.

Sebarkan plot ancaman yang diharapkan di Liga Premier oleh tim berdasarkan permainan terbuka; Courtesy: Gambar melalui Karun Singh

Kerangka

Untuk mendekati masalah ini secara kuantitatif, Anda dapat menggunakan beberapa kerangka kerja yang ada:

Assist adalah salah satu cara untuk melihat kontribusi, tetapi jumlahnya tidak akan diperhatikan oleh kontribusi seperti Ozil. Ini dapat dilihat di xGCain, di mana xG tembakan terakhir (= 0,13 dalam kasus ini) dibagi rata di antara semua peserta. Kolasinac, Ozil, Aubameyang, Maitland-Niles, dan Lacazette akan menerima jumlah xGCain yang sama di sini, yang tidak mencerminkan kontribusi asli. xGBuildup, kuantitas terkait lainnya, membagi xG secara merata di antara semua orang yang terlibat sebelum assist (yaitu, Ozil, Maitland-Niles, dan Lacazette), tetapi memiliki masalah yang sama. Ini lebih baik, tetapi umpan yang mengancam tidak selalu mengarah ke posisi menembak yang baik. Anda dapat mengamati perbedaan xG yang disebabkan oleh setiap tindakan. Misalnya, umpan Ozil membelah pertahanan, tetapi Kolasinac tidak menerimanya dalam posisi menembak yang ideal. Umpan Ozil unik karena memberikan Kolasinac peluang yang darinya ia dapat dengan mudah menciptakan peluang bagus.

Calon Inklusi Masa Depan

Untuk mengatasi kekurangan dari pendekatan yang ada, kami ingin membuat kerangka kerja yang dapat:

Hadiahi tindakan pemain individu (operan, dribel) dalam permainan penumpukan. Karena keterbatasan ketersediaan, operasikan pada data tingkat peristiwa. Tindakan hadiah tidak tergantung pada hasil akhir penguasaan bola (yaitu, hadiah Ozil tidak boleh bergantung pada tembakan atau skor Aubameyang). Hadiah menggerakkan bola tidak hanya ke posisi pemotretan xG tinggi tetapi juga ke posisi ‘mengancam’ yang dapat, pada gilirannya, mengarah ke posisi pemotretan xG tinggi dengan kemungkinan tinggi.

Seperti biasa, ada trade-off antara kompleksitas pemodelan dan akurasi. Tidak ada satu solusi yang ‘benar’ di sini. Namun, tujuan dari posting ini adalah untuk memperkenalkan satu pendekatan pemodelan yang mungkin dan menunjukkan bagaimana hal itu dapat diimplementasikan dan digunakan untuk menganalisis permainan penumpukan.

Takeaways Kunci

Sangat penting untuk menentukan probabilitas mencetak gol karena sepak bola adalah olahraga dengan skor yang relatif rendah. Sebagai hasil dari ancaman yang diharapkan, pakar dan analis dapat mengukur cerita yang ingin didengar oleh penggemar sepak bola dengan alat lain. Tim mana yang berjuang dengan kreativitas & finishing mereka? Performa tim mana yang menunjukkan bahwa mereka harus berada di posisi yang lebih tinggi di klasemen liga?

Referensi

Untuk blog baru, atau peringatan artikel, klik berlangganan. Juga, jangan ragu untuk terhubung dengan saya di LinkedIn, dan mari menjadi bagian dari jaringan yang menarik.

Sports Analytics 101 — Expected Threats (xT) awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Menuju AI

Author: Scott Anderson