Sports Analytics 101 — Sasaran yang Diharapkan (xG) – Menuju AI

Sports Analytics 101 — Sasaran yang Diharapkan (xG) – Menuju AI

Pengarang: Nitin Chauhan

Awalnya diterbitkan di Towards AI the World’s Leading AI and Technology News and Media Company. Jika Anda sedang membangun produk atau layanan terkait AI, kami mengundang Anda untuk mempertimbangkan untuk menjadi sponsor AI. Di Towards AI, kami membantu menskalakan AI dan startup teknologi. Biarkan kami membantu Anda melepaskan teknologi Anda kepada massa.

Sports Analytics 101 — Sasaran yang Diharapkan (xG)

Courtesy: Gambar melalui Sven Kucinic

Sebagai bagian dari seri pengantar tentang analisis olahraga untuk pemula, saya menulis serangkaian artikel yang membahas dampak dan manfaat pembelajaran mesin dan analisis data. Sepanjang hidup saya sebagai calon ilmuwan data, saya selalu mencari panduan yang akan membantu saya mendapatkan pemahaman yang lebih dalam tentang analisis olahraga. Selama bertahun-tahun yang saya habiskan untuk meneliti dan mengikuti kursus, saya telah menemukan konsep panduan berjudul Sports Analytics 101. Harapan saya adalah panduan ini akan membantu orang-orang seperti saya dalam memahami dan menghargai analisis olahraga + data dengan lebih baik.

Mengapa Sasaran yang Diharapkan (xG)?

Selama beberapa tahun terakhir, sepak bola semakin bergantung pada data dan statistik. Salah satu metrik analisis sepakbola yang paling banyak digunakan dan berwawasan luas adalah tujuan yang diharapkan (atau xG). Itu diperkenalkan oleh Opta’s Sam Green pada tahun 2012 dan sejak itu menjadi salah satu metrik yang paling banyak digunakan.

Sekarang telah menjadi fitur reguler untuk penyiar arus utama seperti Sky Sports dan BBC’s Match of the Day, mengikuti adopsi awal dari tujuan yang diharapkan di pasar taruhan dan profesional. Dari laptop analis ke mulut manajer Liga Premier, xG telah mendapatkan popularitas. Dalam wawancara baru-baru ini, Jurgen Klopp telah membandingkan hasil gol yang diharapkan Liverpool dengan Manchester City, sementara Dean Smith telah menggunakan metrik untuk membahas kinerja Aston Villa musim ini.

Selama beberapa tahun terakhir, tujuan yang diharapkan pasti telah dikritik oleh penggemar sepak bola umum yang semakin menyadarinya (lihat Jeff Stelling pada 2017) — permainan yang dilihat secara tradisional versus dunia analitik data yang akan datang. Namun, sebelum menilai metrik, penting untuk memahami bagaimana metrik beroperasi dan bagaimana seharusnya digunakan.

Rasio Expected Goal (xG) untuk striker top di Bundesliga musim 2019/20; Courtesy: Gambar melalui dua puluh3

Apa Sasaran yang Diharapkan (xG)?

Dengan menghitung probabilitas bahwa peluang yang diberikan akan dicetak dari lokasi tertentu di lapangan selama fase permainan tertentu, gol yang diharapkan (xG) dihitung untuk menentukan kualitas peluang. Sebagai hasil dari perhitungan ini, beberapa faktor diperhitungkan sebelum bidikan diambil. Dalam hal xG, nol mewakili kemungkinan bahwa seorang pemain tidak mungkin mencetak gol, sementara satu mewakili kemungkinan bahwa mereka cenderung mencetak gol secara konsisten.

Dalam situasi seperti itu, seorang pemain lebih kecil kemungkinannya untuk mencetak gol dari garis tengah daripada dari dalam kotak. Dengan mengukur xG, kita dapat menilai probabilitas seorang pemain mencetak gol dari masing-masing situasi ini. Sebagai contoh, asumsikan bahwa peluang seorang pemain mencetak gol di dalam kotak dengan serangkaian karakteristik pra-tembakan bernilai 0,1 xG. Jadi, dalam situasi ini, seorang pemain kemungkinan akan mencetak satu gol dari setiap sepuluh tembakan, atau 10% dari waktu.

Penggemar sepak bola dan komentator telah menggunakan frasa ini selama bertahun-tahun sebelum xG diperkenalkan — “dia mencetak sembilan dari sepuluh kali” atau “dia seharusnya mencetak hat-trick.”

Kesalahpahaman Standar tentang xG

Sebagian besar kritik terhadap tujuan yang diharapkan (xG) muncul dari aplikasi metrik yang salah. Salah satu contohnya adalah level permainan. Memiliki xG tertinggi dalam sebuah pertandingan tidak berarti tim harus menang. xG adalah ukuran kualitas peluang, bukan hasil yang diharapkan. Gol mengubah permainan, dan skor memengaruhi cara tim bermain, seperti pepatah lama. Jika sebuah tim memimpin lebih awal, mereka tidak perlu ‘perlu’ menghasilkan lebih banyak peluang. Kami biasanya mengharapkan lawan untuk menciptakan lebih banyak peluang mencetak gol selama sisa pertandingan untuk membuat comeback.

Kedua, ada kesalahpahaman tentang interpretasi literal nama metrik. Kami tidak “mengharapkan” tujuan terjadi persis seperti yang diprediksi oleh kemungkinan. Selain itu, sebagian kecil dari tujuan tidak dapat dicapai. Ukuran probabilitas suatu hasil yang terjadi dikenal sebagai “tujuan yang diharapkan,” berasal dari konsep matematika “nilai yang diharapkan.” Nilai yang diharapkan dari lemparan koin yang adil adalah 50% di kepala dan 50% di ekor (probabilitas mendarat di kepala adalah 0,5). Daripada mengharapkan tepat setengah dari lemparan kami mendarat di setiap hasil, kami mengantisipasi kemunduran keseimbangan ini atas jumlah lemparan koin yang lebih signifikan. Tujuan yang diharapkan tidak berbeda. Perbedaan dari nilai yang diharapkan tidak dapat dihindari, dan ini adalah informasi berharga yang dapat kita manfaatkan untuk menganalisis skor sepak bola.

Seperti yang ditunjukkan oleh Gambler’s Fallacy, jika seorang pemain atau tim telah melebihi kinerja xG mereka, mereka tidak perlu berkinerja buruk untuk mundur ke ekspektasi. Meskipun kami mengharapkan mereka untuk kembali mencetak gol seperti yang mereka harapkan dengan tembakan masa depan mereka, mereka telah ‘menyimpan’ kinerja yang berlebihan ini. Akibatnya, kami harus mengharapkan mereka untuk tetap berkinerja lebih baik dengan jumlah agregat ini sepanjang musim. Dengan cara yang sama, lemparan koin yang mendarat di kepala sepuluh kali berturut-turut memiliki kemungkinan yang sama untuk mendarat di kepala sebagai ekor di masa depan, tetapi sepuluh kali telah mendarat di kepala sudah di belakang kita.

Menghitung Sasaran yang Diharapkan (xG)

Kami dapat mengetahui secara intuitif peluang mana yang kemungkinan besar atau kecil akan berakhir dengan gol berdasarkan faktor-faktor seperti seberapa dekat si penembak dengan gawang, apakah mereka menembak dari sudut yang bagus, apakah itu satu lawan satu atau apakah itu tembakan yang tepat. kepala.

Akibatnya, kita harus menghitung probabilitas rata-rata 25 tembakan per game, yang semuanya bisa merupakan hasil dari keadaan yang unik. Kami sekarang dapat mengukur efek dari variabel di atas dan lainnya pada kemungkinan bahwa gol akan dicetak menggunakan model sasaran yang kami harapkan. Kami dapat menilai kualitas peluang untuk semua 9.398 tembakan yang diambil di Liga Premier musim 2019–20 dalam hitungan detik.

Model xG Statistics Perform dibuat menggunakan model regresi logistik yang diturunkan dari ratusan ribu tembakan yang dikumpulkan dari data Opta historis kami dan menggabungkan beberapa variabel yang memengaruhi peluang pemain untuk mencetak gol, termasuk yang berikut:

Sudut gawang Jarak dari gawang Peluangnya tinggi Bagian tubuh (misalnya, kepala atau kaki) Dalam situasi satu lawan satu Jenis assist (misalnya, umpan terobosan, umpan silang, pull-back, dll.) Jenis tendangan bermain (misalnya, ruang terbuka, istirahat cepat, tendangan bebas langsung, tendangan sudut, lemparan ke dalam, dll.)

Menyadari keunikan beberapa situasi, kami juga memodelkannya secara independen. Penalti diberikan nilai konstan sesuai dengan tingkat konversi keseluruhan (0,79 xG); tendangan bebas langsung memiliki modelnya sendiri, dan peluang sundulan dinilai secara berbeda untuk bola mati dan permainan terbuka.

Versi model yang akan datang akan mencakup tekanan tembakan dan kualifikasi kejelasan tembakan pada setiap tembakan, yang secara eksplisit mengukur tekanan dan posisi pemain bertahan dan penjaga gawang.

Memanfaatkan Tujuan yang Diharapkan (xG)

Di Liga Premier dan Serie A, Gabriel Jesus dari Manchester City dan Hakan Calhanoglu dari AC Milan dibandingkan. Meskipun melakukan tepat 100 tembakan musim lalu (tidak termasuk penalti), kedua pemain masing-masing mencetak 14 dan 8 gol. Mengapa tembakan mereka berbeda?

Dengan mengukur kualitas dari 100 peluang setiap pemain, xG memberikan pemahaman yang lebih mendalam tentang tembakan mereka, melampaui metrik tradisional seperti tembakan tepat sasaran atau jarak tembakan rata-rata.

Nilai XG untuk Hakan Calhanoglu; Courtesy: Gambar melalui Analis
Nilai XG untuk Gabriel Jesus; Courtesy: Gambar melalui Analis

Rata-rata pemain akan mencetak hampir 18 gol (17,7 xG) berdasarkan peluang Gabriel Jesus. Di sisi lain, berdasarkan peluang Hakan Calhanoglu, rata-rata pemain hanya akan mencetak 7 gol (7,0 xG). Kami dapat segera memahami alasan perbedaan mereka dalam hasil mencetak gol. Meskipun Jesus melebihi ekspektasi dan Calhanoglu sedikit berkinerja buruk berdasarkan hasil gol yang mereka harapkan, 100 peluang mereka sangat berbeda kualitasnya, mencerminkan hal ini.

Profil tembakan pemain dapat dibandingkan dengan menentukan sasaran yang diharapkan per tembakan (atau xG per tembakan), ukuran kualitas rata-rata peluang mencetak golnya. Menurut Gabriel Jesus, dia mencetak sekitar satu gol untuk setiap lima upaya yang dia lakukan berdasarkan xG per tembakannya, yaitu 0,18. Sebaliknya, bidikan Calhanoglu memiliki xG per bidikan yang jauh lebih rendah (0,07), seperti yang dapat dilihat pada peta bidikannya di atas, di mana titik yang lebih besar menunjukkan nilai xG yang lebih tinggi.

Meskipun kami telah berfokus pada pemain individu di sini, metrik sasaran yang diharapkan juga dapat diterapkan dengan cara yang sama pada tim atau permainan. Seorang pemain atau tim dapat mencetak skor lebih sering atau lebih jarang daripada yang ditunjukkan oleh nilai xG mereka, tetapi varians ini adalah varians yang sekarang dapat dianalisis. Apakah skor pemain kurang dari yang seharusnya? Siapa yang menerima peluang dari situasi xG tinggi?

Takeaways Kunci

Mengingat sepak bola adalah olahraga dengan skor yang relatif rendah, menentukan kemungkinan mencetak gol sangat penting. Sebagai hasil dari tujuan yang diharapkan, pakar dan analis dapat mengukur cerita yang ingin didengar oleh setiap penggemar sepak bola dengan alat lain. Striker mana yang kesulitan dengan penyelesaian akhir mereka? Performa tim mana yang menunjukkan bahwa mereka harus berada di posisi yang lebih tinggi di klasemen liga?

Sebagai hasil dari kedalaman data Stats Perform yang tak tertandingi, kami sekarang memiliki lebih dari 2.500.000 tembakan yang diperkaya dengan nilai xG untuk lebih dari 66.000 pemain yang memungkinkan kami membandingkan dan memahami kinerja pemain dan tim di seluruh dunia.

Aspek penting dari statistik adalah menentukan seberapa bagus tim dalam menciptakan peluang dan seberapa bagus penyerang dalam memperoleh opsi. Berdasarkan pekerjaan dengan tujuan yang diharapkan, konsensus analitik umum menunjukkan bahwa kemampuan pemain untuk menerima peluang — yang diukur dengan xG — secara signifikan memengaruhi apa yang membuat striker bagus lebih dari kemampuan mereka untuk menyelesaikan.

Referensi:

Untuk blog baru, atau peringatan artikel, klik berlangganan. Juga, jangan ragu untuk terhubung dengan saya di LinkedIn, dan mari menjadi bagian dari jaringan yang menarik.

Sports Analytics 101 — Sasaran yang Diharapkan (xG) awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Menuju AI

Author: Scott Anderson