3 Tips Teratas Saya untuk Mendapatkan Peringkat Pakar Kaggle Dengan 5 Pertama Anda… – Menuju AI

3 Tips Teratas Saya untuk Mendapatkan Peringkat Pakar Kaggle Dengan 5 Pertama Anda… – Menuju AI

Author(s): Pere Martra

Awalnya diterbitkan di Towards AI the World’s Leading AI and Technology News and Media Company. Jika Anda membuat produk atau layanan terkait AI, kami mengundang Anda untuk mempertimbangkan menjadi sponsor AI. Di Towards AI, kami membantu menskalakan AI dan startup teknologi. Biarkan kami membantu Anda melepaskan teknologi Anda kepada massa.

Menjadi ahli Kaggle membutuhkan usaha, tetapi itu adalah tujuan yang sangat dapat dicapai. Saya akan memberi tahu Anda tiga tips yang paling membantu saya melakukannya hanya dengan lima notebook.

Foto oleh sporlab di Unsplash

Kaggle adalah situs kompetisi ilmu data paling bergengsi. Memiliki profil yang baik di Kaggle dapat membuka banyak pintu, dan merupakan salah satu tempat terbaik di mana Anda dapat memamerkan keterampilan pemecahan masalah Ilmu Data Anda.

Kaggler mendapat medali berdasarkan seberapa baik mereka melakukannya di kompetisi. Tapi Kaggle bukan hanya tentang persaingan. Ada empat kategori di mana Anda dapat maju.

Kompetisi. Mungkin kategori paling bergengsi di dalam Kaggle. Anda dapat menerima medali tergantung pada hasil kompetisi yang Anda ikuti. Kumpulan data. Ilmuwan Data dapat mempublikasikan kreasi DataSet mereka. Medali diberikan berdasarkan suara Kaggler lainnya. Notebook. Mungkin kategori paling bergengsi setelah kompetisi. Tidak semua buku catatan yang diunggah harus dikaitkan dengan kompetisi Kaggle yang aktif. Notebook apa pun bisa mendapatkan suara dari komunitas. Seperti dalam kasus Kumpulan Data, semakin banyak suara yang diperoleh, semakin tinggi kualitas medalinya dan semakin tinggi peringkatnya. Diskusi. Ini adalah yang paling bergengsi dari semua kategori. Suara diperoleh untuk komentar yang dibuat di platform Kaggle.

Di masing-masing kategori ini, Anda dapat memilih 5 peringkat: Pemula, Kontributor, Pakar, Master, dan Grand Master.

Dua peringkat awal sangat mudah didapat. Katakanlah dengan mengisi profil, sedikit berinteraksi dengan komunitas, dan memposting pekerjaan, Anda sudah mencapai level Kontributor. Tetapi untuk mendapatkan peringkat Pakar membutuhkan usaha, itu adalah peringkat pertama yang harus diperoleh dengan mendapatkan medali.

Pada artikel kali ini, saya akan membahas cara meraih peringkat Expert di kategori Notebook, yang mungkin paling prestisius setelah kompetisi.

Apa persyaratan untuk mencapai peringkat Pakar dalam kategori Notebook di Kaggle?

Sangat mudah! Kami harus mendapatkan setidaknya lima medali perunggu. Untuk mendapatkan medali, kita harus mendapatkan lima suara dari Kaggler dengan kategori lebih tinggi dari Pemula. Memang kelihatannya sederhana, tetapi kita harus memperhitungkan bahwa hanya 1 dari 20 buku catatan di Kaggle yang menerima lebih dari 2 suara. Apa yang akan kami coba adalah menerima lebih dari 5 suara dari Kaggler di 100% buku catatan kami.

Gambar oleh Penulis

Pada gambar, kita bisa melihat persyaratan untuk masing-masing kategori. Seperti yang Anda lihat, saya hanya memiliki tanda centang di kategori Buku Catatan. Jadi, saya hanya bisa dianggap ahli dalam kategori itu.

Ilmuwan Data dengan lebih banyak pengalaman atau yang lebih berdedikasi pada Kaggle dapat memperoleh peringkat ahli dalam lebih banyak kategori. Dengan apa yang biasanya digambarkan sebagai Kaggle Expert *n. Menjadi n jumlah kategori di mana dia dianggap ahli.

Kompetisi adalah kategori paling bergengsi, diikuti oleh Notebook dan Kumpulan Data, dan terakhir, diskusi.

Lima Notebook pertama saya.

Ini adalah buku catatan pertama saya. Saat ini, ia memiliki medali perak. Diberikan karena mendapatkan lebih dari 20 suara dari Kaggler yang berperingkat lebih tinggi dari Pemula.

Saya bermaksud untuk mendapatkan skor setinggi mungkin dalam Kompetisi MNIST dengan Model yang saya buat. Di Notebook, ada beberapa teknik yang jarang digunakan. Misalnya, alih-alih menggunakan lapisan Dropout, saya menggunakan SpatialDropout. Saya juga berjuang dengan fungsi panggilan balik dan mencoba mencapai skor setinggi mungkin. Yang paling penting adalah Notebook menjelaskan alasan dari setiap teknik yang digunakan.

Notebook kedua kini juga memiliki medali perak. Seperti yang sebelumnya, itu juga merupakan bagian dari salah satu kompetisi dasar Kaggle. Pendekatan yang satu ini sama sekali berbeda. Saya fokus 100% pada transformasi data, dan menjelaskan langkah demi langkah alasan dari setiap modifikasi.

Model yang digunakan adalah model regresi dari library SciKit. Aku tidak membuang waktu bersamanya. Saya akan mengatakan bahwa sebagian besar pekerjaan diinvestasikan dalam pemrosesan data dan pembuatan grafik untuk memahami data dan transformasinya.

Selain itu, saya mencoba membuat beberapa fungsi dapat disesuaikan dengan variabel. Sehingga Kaggler lain dapat bermain dengan Notebook dan menguji cara kerjanya dengan mengubah nilai-nilai ini.

Notebook ini bukan bagian dari kompetisi apa pun. Tapi saya menggunakan salah satu Kumpulan Data Kaggle yang paling terkenal: Deteksi penipuan kartu.

Itu hanya percobaan menggunakan pustaka SciKit Learn, di mana saya mencoba membuat fungsi yang mampu mengubah data dengan sendirinya. Menerapkan algoritma untuk mendapatkan kinerja yang baik tanpa partisipasi Ilmuwan Data.

Notebook itu diterima jauh lebih baik daripada yang saya harapkan.

Notebook ini juga merupakan bagian dari salah satu kompetisi dasar. Ini adalah buku catatan yang sangat mengejutkan saya karena mendapat begitu banyak suara. Saat ini, ia memiliki medali perak. Di dalamnya, saya tidak mencoba untuk mendapatkan skor yang bagus, tetapi sebaliknya, saya membuat Model Regresi Logistik Sederhana secara manual. Itu dimaksudkan sebagai panduan sederhana untuk mempelajari cara membuat model sederhana secara manual.

Dengan mengikuti kompetisi yang sama dengan Notebook sebelumnya dan mendapatkan skor yang jauh lebih baik, Notebook mendapatkan suara yang jauh lebih sedikit. Ini mengejutkan saya pada awalnya, tetapi kemudian, setelah melakukan tur ke notebook pesaing lainnya, saya dapat mengatakan bahwa notebook ini berkontribusi sangat sedikit. Itu hanyalah salah satu notebook yang menggunakan Transfer Leaning untuk menyelesaikan persaingan.

Memang benar bahwa model yang digunakan bukanlah salah satu yang paling banyak digunakan dan saya mencoba menjadikannya sebagai pendekatan dasar Transfer Learning. Tetap saja, untungnya, dia menerima medali perunggu, yang memungkinkan saya naik ke level Pakar Kaggle di kategori Buku Catatan. Dengan lima buku catatan pertamaku.

Tiga tips untuk diikuti.

Sekarang saya memiliki beberapa buku catatan lagi di Kaggle dan hanya satu yang tidak memiliki medali. Saya punya beberapa ide tentang apa yang harus dimiliki Notebook untuk mendapatkan medali atau mendapatkan suara terbanyak.

Tip 1: Jaga presentasi.

Apakah ini benar-benar tip pertama? Ya itu! Ada banyak buku catatan di Kaggle. Fakta bahwa seseorang memberi Anda waktu lebih dari lima detik dapat bergantung pada sesuatu yang sederhana seperti kesan pertama mereka. Jika saya masuk ke buku catatan dan melihat frasa yang ditempatkan Kaggle secara default di awal, saya biasanya keluar tanpa melihat lebih jauh.

Gambar Oleh Penulis

Presentasi saya tidak fantastis. Saya seorang pengembang, dan seperti yang Anda tahu, kami tidak pandai menggabungkan warna atau bentuk. Tapi saya sudah mencoba menggunakan highlight untuk judul dan font yang berbeda.

Untuk ini, saya menggunakan sel yang saya sembunyikan di Notebook. Sel berisi kode HTML yang memodifikasi presentasi.

dari IPython.core.display mengimpor HTML
HTML(“””

.output_png {
tampilan: tabel-sel;
perataan teks: tengah;
perataan vertikal: tengah;
horizontal-align: tengah;
}
h1 {
perataan teks: tengah;
background-color: Biru;
padding: 20px;
margin: 2;
font-family: monospace;
warna: DimGray;
border-radius: 20px
}

h2 {
perataan teks: tengah;
warna latar belakang: Merah;
padding: 20px;
margin: 0;
font-family: monospace;
warna: DimGray;
border-radius: 20px
}

h3 {
perataan teks: tengah;
background-color: Hijau;
padding: 15px;
margin: 0;
font-family: monospace;
warna: DimGray;
border-radius: 15px
}

tubuh, p {
font-family: monospace;
ukuran font: 15px;
warna: arang;
}
div {
ukuran font: 14px;
margin: 0;

}

h4 {
padding: 0px;
margin: 0;
font-family: monospace;
warna ungu;
}

“””)

Saya meninggalkan kode untuk Anda, tetapi saya ingin Anda tahu bahwa saya telah mengubah beberapa hal sehingga Buku Catatan Anda mungkin terlihat berbeda dari milik saya.

Tip 2. Bawalah sesuatu yang berbeda atau berguna.

Buku catatan yang paling berhasil bagi saya adalah buku catatan yang tidak hanya saya coba lakukan sesuatu yang berbeda tetapi juga menjelaskan alasannya. Saya pikir jika seseorang mempelajari sesuatu di buku catatan Anda, mereka lebih cenderung memilihnya karena mereka berterima kasih.

Di notebook MNIST, saya menunjukkan beberapa fungsi panggilan balik dan lapisan SpatialDropout. Ini bukan pengetahuan yang benar-benar canggih, tetapi ini adalah salah satu yang mungkin tidak diketahui oleh banyak orang yang memulai dengan TensorFlow.

Di Buku Catatan Harga Rumah, Saya menjelaskan masing-masing teknik transformasi data, dan kenyataannya ada banyak sekali. Saya yakin bahwa ini adalah salah satu buku catatan dengan lebih banyak penjelasan dalam hal ini.

Mungkin contoh terbaik adalah Notebook yang menganalisis sentimen Tweet dengan membuat model regresi logistik. Ini bukan notebook mengkilap, jauh dari itu. Anda tidak mendapatkan kinerja yang hebat. Tapi itu hampir unik. Ini mengajarkan cara yang berbeda untuk menangani masalah dari yang biasa, dan mengajarkan cara membuat model dari awal.

Notebook yang mendapat suara paling sedikit adalah yang berbasis Transfer Learning, dan sungguh, dilihat dari kejauhan, itu adalah notebook yang paling normal. Banyak notebook dapat ditemukan dengan menggunakan teknik yang sama.

Kiat 3. Akhiri Buku Catatan dengan kesimpulan.

Di akhir setiap Buku Catatan, saya menyertakan sebagian dari kesimpulan. Mencoba menutupnya dengan rangkuman tentang apa yang telah diperoleh dan apa yang telah dilihat.

Tidak hanya itu, di sebagian besar dari mereka, saya mendorong orang untuk bercabang dan memberi mereka ide tentang bagaimana notebook dapat ditingkatkan, sehingga mereka dapat mencobanya.

Hal yang sama berlaku untuk penyebutan atau inspirasi. Saya selalu berusaha menunjukkan bahwa buku catatan atau artikel lain yang telah saya konsultasikan untuk pembuatan Buku Catatan tersebut.

Apakah itu semuanya?

Bagi saya, ini adalah tiga nasihat terpenting yang dapat saya berikan. Ada orang yang berdedikasi untuk meminta suara di komentar, dan saya yakin mereka sukses dengan strategi itu. Tapi saya pikir itu tidak layak.

Jauh lebih baik untuk menaruh sedikit perhatian pada Buku Catatan kita agar isinya menarik dan dijelaskan dengan baik. Buku catatan dengan kode yang brilian, tetapi tanpa penjelasan sama sekali, mungkin berkinerja sangat baik dalam persaingan tetapi akan mengalami kesulitan dalam kategori Buku Catatan, di mana Anda bergantung pada suara Kaggler lainnya.

Nasihat terakhir adalah bersenang-senang dengan Kaggle! Jangan terpaku pada medali, gunakan Kaggle untuk belajar.

Saya harap kita akan melihat Anda di sana! Jangan ragu untuk menghubungi saya melalui Kaggle, atau di komentar, saya akan dengan senang hati mengunjungi Buku Catatan Anda!

Gambar Oleh Penulis

Saya menulis tentang TensorFlow dan pembelajaran mesin secara teratur. Pertimbangkan untuk mengikuti saya di Medium untuk mendapatkan pembaruan tentang artikel baru. Dan, tentu saja, Anda dipersilakan untuk terhubung dengan saya di LinkedIn.

Jika Anda menyukai TensorFlow dan ingin mengetahui beberapa teknik menarik, lihat seri saya: TensorFlow Beyond The Basics.

TensorFlow melampaui dasar-dasarnya

3 Tips Teratas Saya untuk Mendapatkan Peringkat Pakar Kaggle Dengan 5 Buku Catatan Pertama Anda awalnya diterbitkan di Menuju AI di Medium, di mana orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Menuju AI

Author: Scott Anderson