
Pengarang: Gencay I.
Awalnya diterbitkan di Towards AI the World’s Leading AI and Technology News and Media Company. Jika Anda sedang membangun produk atau layanan terkait AI, kami mengundang Anda untuk mempertimbangkan untuk menjadi sponsor AI. Di Towards AI, kami membantu menskalakan AI dan startup teknologi. Biarkan kami membantu Anda melepaskan teknologi Anda kepada massa.
Machine Learning Sebelum Bagian 2 & Analisis Data
Analisis Bingkai Data dengan Python
Foto oleh Markus Spiske di Tabel Konten Unsplash · Pendahuluan
Instalasi
· Bagaimana cara mengumpulkan data Anda?
Contoh
· Berapa lama bingkai data Anda? Apa saja tipe data kolom? Bagaimana saya bisa melihat sedikit data saya?
Informasi
Bentuk
Sampel
Kepala
ekor
Jelaskan
Hitungan Nilai
· Bagaimana cara memilih baris yang telah ditentukan sebelumnya?
· Bagaimana cara memilih beberapa kolom?
Dua Kolom Pertama
Pilih Kolom dengan Nama
Pilih Kolom dengan Indeksnya
· Bagaimana saya bisa mengurutkan nilai?
· Bagaimana saya bisa melihat mean/standar deviasi/maks dari satu kolom per kategorinya?
· Bagaimana saya bisa menjatuhkan Nilai NA?
· Kesimpulan
pengantar
Hai dari Tutorial Pembelajaran Mesin lainnya. Saya ingin menjelaskan ini kepada kalian secara singkat di sini dan benar-benar memikirkannya, bagaimana saya bisa menjelaskannya secara singkat? Membaca terlalu banyak artikel mungkin telah membantu saya. Saya ingin menjelaskan kepada kalian perpustakaan panda dengan pertanyaan dan jawaban mereka.
Instalasi
Sekarang mari kita mulai dengan proses instalasi.
Berikut adalah halaman utama perpustakaan panda.
Pip atau conda, ini akan tergantung pada pengaturan Anda.
pip install panda
conda install panda
Sekarang saatnya mengimpor paket Anda.
impor panda sebagai pd
Bagaimana cara mengumpulkan data Anda?
Sekarang saatnya mengunduh Data Anda.
CSV adalah jenis file yang paling banyak digunakan ketika Anda akan berurusan dengan panda.
url = ” ”
kol =
df = pd.read_csv(“”) URL yang akan anda download datanya. Kolom yang ingin Anda pilih untuk dilihat. Tentukan bingkai data Anda sebagai df.
Berikut adalah dokumentasi metode ini, dan Anda dapat melihat kode berikut.
Contoh
Sekarang mari kita lihat contoh kehidupan nyata.
Dataset Iris sangat terkenal, Anda dapat mengunduhnya dengan menggunakan modul sklearn datasets atau seaborn atau melalui URL.
Ini mungkin database paling terkenal yang dapat ditemukan dalam literatur pengenalan pola. Makalah Fisher adalah klasik di lapangan dan sering dirujuk hingga hari ini. (Lihat Duda & Hart, misalnya.) Kumpulan data berisi 3 kelas masing-masing 50 instance, di mana setiap kelas mengacu pada jenis tanaman iris. Satu kelas dapat dipisahkan secara linear dari 2 kelas lainnya; yang terakhir TIDAK dapat dipisahkan secara linier satu sama lain.
Atribut yang diprediksi: kelas tanaman iris.
Berikut adalah detail yang tersisa dari Dataset ini.
Sekarang, mari kita terapkan kode kita di Dataset itu;
Gambar oleh Penulis
https://medium.com/media/81231adbfd1207af95f0c1c6a3a64afe/href
Berapa lama bingkai data Anda? Apa saja tipe data kolom? Bagaimana saya bisa melihat sedikit data saya?
Info
Ini akan memberikan tipe data kolom Anda.
df.info()
Tipe data kolom Anda.
Gambar oleh Penulis
Membentuk
Ini akan memberikan dimensi dari Dataframe Anda.
df.bentuk()
Bentuk df Anda.
Gambar oleh Penulis
Sampel
Ini akan memberikan “n” sampel acak dari Dataframe Anda.
df.contoh(5)
5 sampel acak df . Anda
Gambar oleh Penulis
Kepala
Mencari baris “n” pertama dari bingkai Data Anda.
df.head(5)
Mencari 5 baris pertama df Anda.
Gambar oleh Penulis
Ekor
Melihat baris “n” terakhir dari bingkai Data Anda.
df.ekor(5)
Mencari 5 baris terakhir dari df Anda.
Gambar oleh Penulis
Menggambarkan
Menampilkan ringkasan fitur numerik.
df.deskripsi()
Menampilkan ringkasan fitur numerik.
Gambar oleh Penulis
Hitungan Nilai
Melihat jenis kolom kategoris Anda.
df[“Column”].nilai_jumlah()
Melihat tipe data nilai ini.
Gambar oleh Penulis
Bagaimana cara memilih baris yang telah ditentukan sebelumnya?
Dengan menggunakan metode loc.
Sekarang Anda ingin melihat kelas Iris-virginica dan kelas Iris-virginica saja.
Selain itu, jika Anda ingin panjang sepal Anda lebih besar dari lima dan panjang kelopak lebih kecil dari lima, maka kode Anda akan seperti itu;
Gambar oleh Penulis
Bagaimana cara memilih beberapa kolom?
Dua Kolom Pertama
Sekarang “:” pertama berarti semua baris, dan 0:2 berarti mulai dari kolom pertama, berakhir dari kolom ketiga tetapi jangan pilih yang ketiga.
Gambar oleh Penulis
Pilih Kolom dengan Nama
Dengan menggunakan dua kurung.
Gambar oleh Penulis
Pilih Kolom dengan Indeksnya
Memilih kolom pertama dan ketiga dengan menggunakan metode indeks;
Gambar oleh Penulis
Bagaimana saya bisa mengurutkan nilai?
Gambar oleh Penulis oleh = Kolom yang ingin Anda urutkan
Jika Anda ingin urutan itu berbeda, maka Anda harus menambahkan argumen berikut:
Gambar oleh Penulis
Selengkapnya kunjungi disini
Bagaimana saya bisa melihat mean/standar deviasi/maks dari satu kolom per kategorinya?
Sekarang, jika Anda ingin menjadi programmer yang baik, Anda harus mulai membaca dokumen hari ini.
Berikut penjelasannya;
Sebuah grup dengan operasi melibatkan beberapa kombinasi pemisahan objek, menerapkan fungsi, dan menggabungkan hasil. Ini dapat digunakan untuk mengelompokkan sejumlah besar data dan menghitung operasi pada grup ini.
Anda dapat mencari argumen dari metode ini, kunjungi di sini dan mulai membaca dokumen dari perpustakaan ini.
Bagaimana saya bisa menjatuhkan Nilai NA?
Sekarang ada terlalu banyak pendekatan untuk melakukan itu.
Anda dapat mengisi rata-rata kolom ke Nilai NA jika dataset Anda kecil dan Anda tidak ingin kehilangan data Anda.
df.dropna()
Sekarang, saya tidak bisa memberikan penjelasan kehidupan nyata kepada Anda karena dataset saya tidak mengandung nilai NA, namun, seperti yang saya sebutkan sebelumnya, akan baik bagi Anda untuk membaca dokumen perpustakaan.
Di sini Anda dapat menemukan contoh lain di sini, dokumen resmi.
Kesimpulan
Saya mencoba untuk sesingkat mungkin.
Meskipun ada terlalu banyak metode lain yang mungkin telah membantu Anda sepanjang perjalanan pembelajaran mesin, saya pikir pengetahuan sebelumnya ini akan baik-baik saja untuk meluncurkan Model Pembelajaran Mesin pertama Anda.
Selain semua itu, terima kasih atas dukungan Anda terhadap artikel saya sebelumnya, reaksi Anda sangat memotivasi saya untuk terus menulis tutorial dan artikel.
Jika Anda ingin diperhatikan dalam artikel saya yang akan datang melalui email, di sini ;
Dapatkan email setiap kali Gencay I. menerbitkan.
Sebenarnya saya sudah menjelaskan kepada kalian sebelumnya tentang persiapan saya untuk E-Book, dalam hal ini, saya akan berencana untuk menjelaskan kepada kalian semua konsep secara rinci, kali ini tidak secara singkat, dan dengan penjelasan dan kumpulan data kehidupan nyata.
Pembelajaran mesin adalah penemuan terakhir yang dibutuhkan umat manusia.” Nick Bostrom
Terima kasih.
Python Prior Machine Learning Bagian 2 & Analisis Data awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.
Diterbitkan melalui Menuju AI