Panduan Data Scientist untuk Prompt Engineering – Menuju AI

Mencapai Peringkat 33 (dari 186) di NASA Harvest Field Boundary… – Menuju AI

Author(s): Supreet Kaur

Awalnya diterbitkan di Menuju AI.

Foto oleh Unsplash.com

Peluncuran ChatGPT telah memicu minat yang signifikan terhadap AI generatif, dan orang menjadi lebih akrab dengan seluk beluk model bahasa besar.

Banyak orang, termasuk saya sendiri, menjadi terpesona untuk memahami cara kerja bagian dalam dari alat yang ampuh ini. Perlu dicatat bahwa rekayasa cepat memainkan peran penting dalam keberhasilan pelatihan model tersebut. Dengan hati-hati menyusun “permintaan” yang efektif, ilmuwan data dapat memastikan bahwa model dilatih pada data berkualitas tinggi yang secara akurat mencerminkan tugas yang mendasarinya.

Anjuran set instruksi yang diberikan kepada model untuk mendapatkan output tertentu. Beberapa contoh prompt antara lain:

1. Bertindak sebagai Data Scientist dan jelaskan Prompt Engineering.

2. Bertindak sebagai ahli gizi saya dan beri saya saran resep sarapan vegan.

3. Bayangkan Anda adalah seorang penulis lagu dan membuat lagu berdasarkan kehidupan ilmuwan data.

Prompt Engineering adalah teknik Pemrosesan Bahasa Alami (NLP) untuk membuat dan menyempurnakan prompt untuk mendapatkan respons yang akurat dari model. Sangat penting untuk menghabiskan waktu menyempurnakan petunjuk untuk penggunaan yang Anda perlukan. Jika tidak, hal itu dapat menyebabkan halusinasi model.

Cuplikan dari GPT saya

Empat manfaat rekayasa cepat

Akurasi yang ditingkatkan: Rekayasa cepat dapat meningkatkan akurasi model AI dengan memberi mereka informasi yang lebih spesifik dan relevan. Ini dapat mengarah pada hasil yang lebih efektif dan pengambilan keputusan yang lebih baik. Peningkatan efisiensi: Rekayasa cepat dapat meningkatkan efisiensi model AI dengan mengurangi waktu dan upaya yang diperlukan untuk melatihnya. Dapat disesuaikan: Ini dapat meningkatkan fleksibilitas model AI dengan memungkinkannya digunakan untuk berbagai tugas yang lebih luas. Meningkatkan kepuasan pengguna: Rekayasa cepat dapat meningkatkan kepuasan pengguna dengan model AI dengan menjadikannya lebih ramah pengguna dan intuitif.

Kasus penggunaan rekayasa cepat khusus industri

Perawatan kesehatan: Rekayasa cepat digunakan untuk meningkatkan keakuratan diagnosis medis, mengembangkan perawatan baru, dan mempersonalisasi perawatan kesehatan. Misalnya, rekayasa cepat dapat meringkas riwayat dan gejala medis pasien, mengidentifikasi potensi interaksi obat, dan membuat rencana perawatan yang dipersonalisasi.

Keuangan: Di bidang keuangan, teknik cepat digunakan untuk menciptakan asisten cerdas yang dapat memberikan saran investasi yang dipersonalisasi atau membantu pelanggan dalam perencanaan keuangan. Asisten ini dapat memberikan panduan yang lebih efektif dan relevan dengan menyesuaikan permintaan berdasarkan tujuan keuangan pelanggan dan toleransi risiko.

Pendidikan: Teknik yang cepat mempersonalisasi pembelajaran, memberikan umpan balik tentang tugas, dan menciptakan pengalaman belajar yang menarik. Misalnya, rekayasa cepat dapat menghasilkan rencana pembelajaran yang dipersonalisasi untuk setiap siswa, memberikan umpan balik tentang esai dan kode, serta membuat cerita dan permainan interaktif.

Kiat dan trik untuk menghasilkan petunjuk yang efektif

1. Pahami kasus penggunaan secara mendetail untuk menambahkan “kata kunci” saat membuat prompt.

Alih-alih prompt “Tulis blog tentang kehidupan seorang ilmuwan data”, Anda dapat menggunakan frase sebagai, “Bertindak seperti seorang ilmuwan data dan menulis blog tentang kehidupan seorang ilmuwan data yang mencakup berbagai aspek kehidupan mereka seperti perjalanan karir, apa yang diharapkan dalam pekerjaan dan tantangan.”

2. Uji dan sempurnakan prompt berdasarkan output.

Jika output yang diinginkan tidak diterima pada iterasi pertama, coba tambahkan lebih banyak kata kunci atau detail untuk mengubah respons.

3. Kurangi informasi yang tidak memiliki tujuan apa pun di prompt.

Misalnya, alih-alih mengatakan tulis deskripsi produk XYZ yang singkat, tepat, dan menarik, gunakan “Gunakan 3–5 kalimat untuk menulis deskripsi produk”.

Keterbatasan dan tantangan

Bias dalam pembuatan prompt: Rekayasa prompt dapat memperkenalkan bias ke dalam data pelatihan jika prompt tidak dirancang dengan hati-hati. Ini dapat menyebabkan model bias terhadap kelompok orang tertentu atau menghasilkan hasil yang tidak akurat atau menyesatkan.

Kesulitan dalam menghasilkan petunjuk yang efektif: Menghasilkan petunjuk yang efektif dapat menjadi tantangan, membutuhkan keahlian domain dan pemahaman yang mendalam tentang tugas yang mendasarinya. Petunjuk yang dirancang dengan buruk dapat menyebabkan keluaran model yang tidak akurat atau tidak relevan.

Fleksibilitas terbatas: Rekayasa cepat dapat membatasi fleksibilitas model bahasa, karena mereka dilatih untuk menghasilkan output berdasarkan prompt tertentu. Hal ini dapat membuat penyesuaian model dengan tugas atau skenario baru menjadi menantang.

Memakan waktu: Rekayasa yang cepat dapat memakan waktu, membutuhkan upaya manual yang signifikan untuk merancang dan menguji petunjuknya. Hal ini dapat membuat rekayasa cepat penskalaan ke kumpulan data yang lebih besar atau tugas yang lebih kompleks menjadi menantang.

Kurangnya generalisasi: Model bahasa yang dilatih menggunakan petunjuk mungkin tidak dapat digeneralisasi dengan baik ke data baru dan tidak terlihat. Ini dapat membatasi kegunaan model dalam aplikasi dunia nyata.

Masalah privasi data: Rekayasa cepat memerlukan akses ke sejumlah besar data pelatihan, yang mungkin berisi informasi sensitif tentang individu. Hal ini menimbulkan kekhawatiran tentang privasi data dan potensi penyalahgunaan informasi pribadi.

Pertimbangan etis: Rekayasa yang cepat menimbulkan kekhawatiran etis seputar penggunaan model bahasa yang bertanggung jawab, khususnya di bidang kesehatan, keuangan, dan pendidikan. Ada kebutuhan akan pedoman dan peraturan untuk memastikan bahwa model bahasa digunakan secara bertanggung jawab dan etis.

Dengan menyusun petunjuk yang efektif secara hati-hati, ilmuwan data dapat memastikan bahwa model tersebut dilatih pada data berkualitas tinggi yang secara akurat mencerminkan tugas yang mendasarinya. Hal ini, pada gilirannya, dapat menghasilkan keluaran model yang lebih akurat dan relevan, menghasilkan peningkatan kinerja pada berbagai tugas. Dengan demikian, rekayasa cepat telah muncul sebagai bidang penelitian penting dalam pemrosesan bahasa alami dan pembelajaran mesin.

Untuk lebih banyak konten seperti itu atau untuk memberikan umpan balik, Anda dapat mengikuti saya di LinkedIn

Terima kasih kepada tim di Symbl.ai untuk semua dukungan dan untuk meninjau artikel ini.

Diterbitkan melalui Menuju AI

Author: Scott Anderson