Pembelajaran Mesin Sebelumnya Python Bagian 2 & Analisis Data – Menuju AI

Pembelajaran Mesin Sebelumnya Python Bagian 2 & Analisis Data – Menuju AI

Pengarang: Gencay I.

Awalnya diterbitkan di Towards AI the World’s Leading AI and Technology News and Media Company. Jika Anda sedang membangun produk atau layanan terkait AI, kami mengundang Anda untuk mempertimbangkan untuk menjadi sponsor AI. Di Towards AI, kami membantu menskalakan AI dan startup teknologi. Biarkan kami membantu Anda melepaskan teknologi Anda kepada massa.

Machine Learning Sebelum Bagian 2 & Analisis Data

Analisis Bingkai Data dengan Python

Foto oleh Markus Spiske di Tabel Konten Unsplash · Pendahuluan
Instalasi
· Bagaimana cara mengumpulkan data Anda?
Contoh
· Berapa lama bingkai data Anda? Apa saja tipe data kolom? Bagaimana saya bisa melihat sedikit data saya?
Informasi
Bentuk
Sampel
Kepala
ekor
Jelaskan
Hitungan Nilai
· Bagaimana cara memilih baris yang telah ditentukan sebelumnya?
· Bagaimana cara memilih beberapa kolom?
Dua Kolom Pertama
Pilih Kolom dengan Nama
Pilih Kolom dengan Indeksnya
· Bagaimana saya bisa mengurutkan nilai?
· Bagaimana saya bisa melihat mean/standar deviasi/maks dari satu kolom per kategorinya?
· Bagaimana saya bisa menjatuhkan Nilai NA?
· Kesimpulan

pengantar

Hai dari Tutorial Pembelajaran Mesin lainnya. Saya ingin menjelaskan ini kepada kalian secara singkat di sini dan benar-benar memikirkannya, bagaimana saya bisa menjelaskannya secara singkat? Membaca terlalu banyak artikel mungkin telah membantu saya. Saya ingin menjelaskan kepada kalian perpustakaan panda dengan pertanyaan dan jawaban mereka.

Instalasi

Sekarang mari kita mulai dengan proses instalasi.

Berikut adalah halaman utama perpustakaan panda.

Pip atau conda, ini akan tergantung pada pengaturan Anda.

pip install panda
conda install panda

Sekarang saatnya mengimpor paket Anda.

impor panda sebagai pd

Bagaimana cara mengumpulkan data Anda?

Sekarang saatnya mengunduh Data Anda.

CSV adalah jenis file yang paling banyak digunakan ketika Anda akan berurusan dengan panda.

url = ” ”
kol =
df = pd.read_csv(“”) URL yang akan anda download datanya. Kolom yang ingin Anda pilih untuk dilihat. Tentukan bingkai data Anda sebagai df.

Berikut adalah dokumentasi metode ini, dan Anda dapat melihat kode berikut.

Contoh

Sekarang mari kita lihat contoh kehidupan nyata.

Dataset Iris sangat terkenal, Anda dapat mengunduhnya dengan menggunakan modul sklearn datasets atau seaborn atau melalui URL.

Ini mungkin database paling terkenal yang dapat ditemukan dalam literatur pengenalan pola. Makalah Fisher adalah klasik di lapangan dan sering dirujuk hingga hari ini. (Lihat Duda & Hart, misalnya.) Kumpulan data berisi 3 kelas masing-masing 50 instance, di mana setiap kelas mengacu pada jenis tanaman iris. Satu kelas dapat dipisahkan secara linear dari 2 kelas lainnya; yang terakhir TIDAK dapat dipisahkan secara linier satu sama lain.

Atribut yang diprediksi: kelas tanaman iris.

Berikut adalah detail yang tersisa dari Dataset ini.

Sekarang, mari kita terapkan kode kita di Dataset itu;

Gambar oleh Penulis

https://medium.com/media/81231adbfd1207af95f0c1c6a3a64afe/href

Berapa lama bingkai data Anda? Apa saja tipe data kolom? Bagaimana saya bisa melihat sedikit data saya?

Info

Ini akan memberikan tipe data kolom Anda.

df.info()
Tipe data kolom Anda.
Gambar oleh Penulis

Membentuk

Ini akan memberikan dimensi dari Dataframe Anda.

df.bentuk()
Bentuk df Anda.
Gambar oleh Penulis

Sampel

Ini akan memberikan “n” sampel acak dari Dataframe Anda.

df.contoh(5)
5 sampel acak df . Anda
Gambar oleh Penulis

Kepala

Mencari baris “n” pertama dari bingkai Data Anda.

df.head(5)
Mencari 5 baris pertama df Anda.
Gambar oleh Penulis

Ekor

Melihat baris “n” terakhir dari bingkai Data Anda.

df.ekor(5)
Mencari 5 baris terakhir dari df Anda.
Gambar oleh Penulis

Menggambarkan

Menampilkan ringkasan fitur numerik.

df.deskripsi()
Menampilkan ringkasan fitur numerik.
Gambar oleh Penulis

Hitungan Nilai

Melihat jenis kolom kategoris Anda.

df[“Column”].nilai_jumlah()
Melihat tipe data nilai ini.
Gambar oleh Penulis

Bagaimana cara memilih baris yang telah ditentukan sebelumnya?

Dengan menggunakan metode loc.

Sekarang Anda ingin melihat kelas Iris-virginica dan kelas Iris-virginica saja.

Selain itu, jika Anda ingin panjang sepal Anda lebih besar dari lima dan panjang kelopak lebih kecil dari lima, maka kode Anda akan seperti itu;

Gambar oleh Penulis

Bagaimana cara memilih beberapa kolom?

Dua Kolom Pertama

Sekarang “:” pertama berarti semua baris, dan 0:2 berarti mulai dari kolom pertama, berakhir dari kolom ketiga tetapi jangan pilih yang ketiga.

Gambar oleh Penulis

Pilih Kolom dengan Nama

Dengan menggunakan dua kurung.

Gambar oleh Penulis

Pilih Kolom dengan Indeksnya

Memilih kolom pertama dan ketiga dengan menggunakan metode indeks;

Gambar oleh Penulis

Bagaimana saya bisa mengurutkan nilai?

Gambar oleh Penulis oleh = Kolom yang ingin Anda urutkan

Jika Anda ingin urutan itu berbeda, maka Anda harus menambahkan argumen berikut:

Gambar oleh Penulis

Selengkapnya kunjungi disini

Bagaimana saya bisa melihat mean/standar deviasi/maks dari satu kolom per kategorinya?

Sekarang, jika Anda ingin menjadi programmer yang baik, Anda harus mulai membaca dokumen hari ini.

Berikut penjelasannya;

Sebuah grup dengan operasi melibatkan beberapa kombinasi pemisahan objek, menerapkan fungsi, dan menggabungkan hasil. Ini dapat digunakan untuk mengelompokkan sejumlah besar data dan menghitung operasi pada grup ini.

Anda dapat mencari argumen dari metode ini, kunjungi di sini dan mulai membaca dokumen dari perpustakaan ini.

Bagaimana saya bisa menjatuhkan Nilai NA?

Sekarang ada terlalu banyak pendekatan untuk melakukan itu.

Anda dapat mengisi rata-rata kolom ke Nilai NA jika dataset Anda kecil dan Anda tidak ingin kehilangan data Anda.

df.dropna()

Sekarang, saya tidak bisa memberikan penjelasan kehidupan nyata kepada Anda karena dataset saya tidak mengandung nilai NA, namun, seperti yang saya sebutkan sebelumnya, akan baik bagi Anda untuk membaca dokumen perpustakaan.

Di sini Anda dapat menemukan contoh lain di sini, dokumen resmi.

Kesimpulan

Saya mencoba untuk sesingkat mungkin.

Meskipun ada terlalu banyak metode lain yang mungkin telah membantu Anda sepanjang perjalanan pembelajaran mesin, saya pikir pengetahuan sebelumnya ini akan baik-baik saja untuk meluncurkan Model Pembelajaran Mesin pertama Anda.

Selain semua itu, terima kasih atas dukungan Anda terhadap artikel saya sebelumnya, reaksi Anda sangat memotivasi saya untuk terus menulis tutorial dan artikel.

Jika Anda ingin diperhatikan dalam artikel saya yang akan datang melalui email, di sini ;

Dapatkan email setiap kali Gencay I. menerbitkan.

Sebenarnya saya sudah menjelaskan kepada kalian sebelumnya tentang persiapan saya untuk E-Book, dalam hal ini, saya akan berencana untuk menjelaskan kepada kalian semua konsep secara rinci, kali ini tidak secara singkat, dan dengan penjelasan dan kumpulan data kehidupan nyata.

Pembelajaran mesin adalah penemuan terakhir yang dibutuhkan umat manusia.” Nick Bostrom

Terima kasih.

Python Prior Machine Learning Bagian 2 & Analisis Data awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Menuju AI

Author: Scott Anderson