Cepat Ambil Konversi Teks ke Gambar dengan AI — menggunakan Stabil… – Menuju AI

Cepat Ambil Konversi Teks ke Gambar dengan AI — menggunakan Stabil… – Menuju AI

Pengarang: Ketan Bhavsar

Awalnya diterbitkan di Towards AI the World’s Leading AI and Technology News and Media Company. Jika Anda sedang membangun produk atau layanan terkait AI, kami mengundang Anda untuk mempertimbangkan untuk menjadi sponsor AI. Di Towards AI, kami membantu menskalakan AI dan startup teknologi. Biarkan kami membantu Anda melepaskan teknologi Anda kepada massa.

Konversi Teks ke Gambar dengan Cepat Dengan AI — Menggunakan Difusi Stabil

Sementara alat konversi telah ada selama bertahun-tahun, Difusi Stabil benar-benar memungkinkan siapa saja untuk membuat seni fotorealistik!

Courtesy: Difusi Stabil

Apa itu model konversi teks ke gambar?

Sederhananya, ini adalah model yang menghasilkan gambar yang cocok dengan deskripsi teks yang disediakan semirip mungkin. Itu berada di bawah domain AI generatif dan merupakan salah satu kasus penggunaan untuk pembelajaran mendalam.

AI generatif

Kecerdasan buatan, meskipun dalam tahap baru lahir, telah melalui perjalanan panjang untuk menembus cara kita berinteraksi, terlibat, dan berekspresi. AI generatif adalah salah satu aspek dari evolusi ini yang memungkinkan algoritme untuk membayangkan kata-kata dan suara menjadi gambar dan ekspresi. Ini menciptakan hasil yang tidak bias, yang umumnya dihasilkan dari pikiran dan pengalaman manusia.

AI generatif mengacu pada model kecerdasan buatan yang dapat menggunakan konten yang ada seperti teks, file audio, atau gambar untuk membuat konten baru yang dapat dipercaya.

Model AI generatif sebagian besar didasarkan pada teknik seperti jaringan permusuhan generatif (GANS), transformer, dan autoencoder variasi.

AI dalam seni

Meskipun saya tidak mengerti banyak tentang seni, saya benar-benar terpesona oleh gagasan tentang AI yang melakukannya untuk saya!

Baru-baru ini ada banyak desas-desus tentang seni yang dihasilkan AI yang memenangkan kompetisi internasional. Meskipun seni semacam itu tidak akan pernah melampaui warisan dan era berbagai seniman di seluruh dunia sepanjang sejarah, saya yakin itu pasti akan membuat seni lebih mudah diakses oleh massa dan mengukir ceruknya sendiri.

Karya AI Jason Allen, “Théâtre D’opéra Spatial,” menempati posisi pertama dalam kategori digital di Colorado State Fair. Gambar Courtesy: NYTimes & Jason Allen

Baca artikel selengkapnya di NYTimes.

Karya seni oleh Mr. Allen ini dibuat dengan Midjourney, program kecerdasan buatan lain yang mengubah teks menjadi grafik hiper-realistis.

Apa itu Difusi Stabil, dan bagaimana cara kerjanya?

Konverter teks-ke-gambar telah ada cukup lama sekarang, tetapi alat yang dirilis tahun ini (2022) — seperti DALL-E 2, Imagen, Midjourney, dan Difusi Stabil — memungkinkan hampir semua orang membuat karya fotorealistik hanya dengan mengetikkan beberapa teks.

Meskipun ada beberapa program di luar sana yang mendukung konversi teks ke gambar, dalam artikel ini, kami mengeksplorasi Difusi Stabil sebagai salah satu modelnya. Tidak ada alasan khusus untuk memilih seperti itu — tetapi hanya karena saya merasa itu sederhana untuk percobaan pertama!

Bangun karya seni Anda sendiri dengan memberikan petunjuk di ruang demonstrasi publik untuk model Difusi Stabil.

Bagaimana cara kerjanya? Dari sudut pandang pengguna, itu cukup mudah. Anda mengetik imajinasi Anda dengan kata-kata, dan modelnya akan menghasilkan karya seni yang menarik. Ini menggunakan proses kompleks “difusi” untuk mengubah teks menjadi gambar.

Dalam kasus konversi teks ke gambar, model mencoba mempelajari pola dasar input dan kemudian menggunakan info tersebut untuk menghasilkan gambar yang pas. Mungkin tidak selalu menghasilkan gambar baru, melainkan mencoba mencapai hasil terdekat dengan mencampur dan mencocokkan gambar yang sudah ada.

Kemungkinan tak terbatas

Saya mencoba memberikan beberapa petunjuk pada model Difusi Stabil, dan inilah yang membuat saya tercengang —

“Kucing memakai kacamata hitam di bar.”

Dibuat di: Ruang Publik Difusi Stabil

“Cakrawala warna-warni di Samudera Hindia. Sebuah kapal berlayar di samping kawanan lumba-lumba.”

Dibuat di: Ruang Publik Difusi Stabil

“Wortel di sabuk karate.”

Dibuat di: Ruang Publik Difusi Stabil

PS: Seni hanya menjadi lebih baik dengan ekspresi imajinasi Anda dalam kata-kata. Jadi, menulis lebih baik! 😁

Beberapa gambar yang dibuat pengguna dari blog Difusi Stabil —



Atas perkenan: https://stability.ai/blog/stable-diffusion-public-release

Tantangan — Pemblokir Arus Utama

Kebanyakan model dilatih oleh web scraping gambar pada umumnya dan karena itu tidak menjalani pemeriksaan. Sampai hari ini, saat menulis artikel ini, hal ini dapat menyebabkan potensi penyalahgunaan, hasil yang tidak terduga, dan masalah etika lainnya dengan meluasnya penggunaan teknologi ini.

Meskipun kita tidak jauh dari tahap di mana AI menjadi mampu melakukan sebagian besar pekerjaan manusia, tantangan pemodelan etika menjadi ‘intinya tetap menjadi teka-teki yang belum terpecahkan.

Kesimpulan

AI generatif adalah salah satu domain yang dengan cepat naik ke arus utama saat kita berbicara. Dengan kasus penggunaannya yang terus meningkat seperti konversi teks ke gambar, konversi gambar ke gambar, peningkatan resolusi gambar, penuaan wajah, foto menjadi emoji, sintesis audio, analisis sentimen, dan evaluasi tren, ini merupakan keuntungan bagi kami.

Kemajuan cenderung meningkat, dan teknik desain generatif cenderung memberdayakan mesin untuk melakukan lebih dari sekadar pekerjaan manual dan melakukan tugas-tugas kreatif.

Membungkusnya

Bagikan di komentar pendapat Anda tentang model seni generatif yang sangat keren ini, masa depannya, dan bagaimana Anda ingin menggunakannya lebih lanjut.

Juga bagikan dengan saya seni menarik yang Anda hasilkan dengan Difusi Stabil.

— kirim beberapa tepuk tangan jika ringkasan cepat ini membantu Anda dengan cara — bagikan artikel ini dengan orang-orang yang ingin tahu yang ingin menjelajahi — tekan ikuti untuk menyetel lebih banyak hal yang disederhanakan seputar cloud, teknologi, dan sains

Terhubung dengan saya di LinkedIn.

Quick Take on Text to Image Conversion with AI — using Stable Diffusion awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.

Diterbitkan melalui Menuju AI

Author: Scott Anderson