
Penulis: Menuju Tim Editorial AI
Awalnya diterbitkan di Towards AI the World’s Leading AI and Technology News and Media Company. Jika Anda sedang membangun produk atau layanan terkait AI, kami mengundang Anda untuk mempertimbangkan untuk menjadi sponsor AI. Di Towards AI, kami membantu menskalakan AI dan startup teknologi. Biarkan kami membantu Anda melepaskan teknologi Anda kepada massa.
Apa yang terjadi minggu ini di AI
Difusi stabil menarik perhatian kami lagi, tetapi lebih tepatnya seberapa besar “inisiatif difusi stabil” memengaruhi penelitian baru dan memajukan bidang ini. Sangat keren memiliki model open-source yang begitu kuat. Sebagian besar teman kami di domain pembuatan gambar saat ini sedang bermain dan menerapkan berbagai versi siang dan malam. Salah satu yang menurut kami sangat menarik dan menjanjikan adalah makalah baru berjudul “Sebuah Gambar Bernilai Satu Kata”.
“An Image is Worth One Word” memungkinkan Anda untuk mempersonalisasi hasil model teks-ke-gambar yang telah dilatih sebelumnya seperti Difusi Stabil menggunakan gambar objek Anda sendiri dengan waktu pelatihan yang sangat sedikit (~2 jam). Ini mempelajari konsep dari 3-5 gambar dan merumuskannya menjadi apa yang mereka sebut sebagai “kata semu” yang kemudian dapat Anda gunakan di generasi cepat Anda. Ini sangat keren dan memiliki potensi luar biasa untuk produk pengubah permainan yang luar biasa, dan ini hanya satu penelitian baru yang dibawa berkat difusi stabil dari lebih banyak lagi, dan bahkan lebih banyak lagi yang akan datang. Kami hidup di hari-hari yang menyenangkan untuk industri pembuatan gambar, dan kami akan mengikutinya dengan cermat dengan tim Menuju AI untuk Anda!
Berita Terhangat
DALL·E: Memperkenalkan Lukisan Luar
OpenAI baru saja memperkenalkan outpainting ke DALLE! Outpainting dapat memperluas gambar asli, membuat gambar skala besar dalam rasio aspek apa pun (lihat gambar sampul dari iterasi buletin ini). Ini memperhitungkan elemen visual gambar yang ada untuk mempertahankan konteks gambar asli dan dapat dikondisikan dengan teks untuk menambahkan elemen tertentu. 22 Influencer AI teratas untuk diikuti di Twitter pada tahun 2023
Kami tidak yakin bagaimana caranya tetapi Co-founder dan Kepala Komunitas kami, Louis Bouchard, ditampilkan dalam artikel “22 Influencer AI Teratas untuk diikuti pada tahun 2023” di Bytescout! Kami mengenal sebagian besar orang dalam daftar ini dan kami sangat bersyukur dan gembira karena Louis adalah bagian darinya. Lihat dan ikuti orang-orang luar biasa lainnya di sana! Anda semua pernah mendengar dan mencoba Difusi Stabil, tapi apa itu?
Apa kesamaan dari semua model gambar super canggih seperti DALLE, Imagen, atau Midjourney? Selain biaya komputasi yang tinggi, waktu pelatihan yang besar, dan hype bersama, semuanya didasarkan pada mekanisme yang sama: difusi. Model difusi baru-baru ini mencapai hasil canggih untuk sebagian besar tugas gambar, termasuk teks-ke-gambar dengan DALLE tetapi banyak tugas terkait pembuatan gambar lainnya juga, seperti pengecatan gambar, transfer gaya, atau resolusi super gambar. Tapi apa itu difusi dan bagaimana cara kerjanya? Pelajari lebih lanjut di artikel.
Makalah paling menarik minggu ini
Pembuatan Gambar Adaptif-Realistik dari Stroke dan Sketsa dengan Model Difusi
“Kerangka kerja terpadu yang mendukung kontrol tiga dimensi atas sintesis gambar dari sketsa dan goresan berdasarkan model difusi [with which users can] memutuskan tingkat kesetiaan untuk tidak hanya goresan input dan sketsa tetapi juga tingkat realisme. Prediksi Giliran untuk Pidato Percakapan Alami
Sementara sistem asisten suara streaming telah digunakan di banyak aplikasi, ini hanya kuat untuk diskusi satu arah dan pertanyaan/jawaban dasar interaksi yang tidak wajar. Seperti yang Anda ketahui, ini bekerja sangat buruk jika Anda berhenti sejenak untuk berpikir atau secara tidak sengaja mengulangi kata-kata. Mereka menghadirkan prediktor turn-taking yang dibangun di atas pengenal ucapan ujung-ke-ujung (E2E) untuk membantu diskusi yang lancar, “nyata”, dan “nyata”. MULAN: PENYEMBUHAN BERSAMA AUDIO MUSIK DAN BAHASA ALAMI
MULAN: “upaya pertama dari model akustik generasi baru yang menghubungkan audio musik secara langsung dengan deskripsi musik bahasa alami yang tidak dibatasi.” “Pendengar manusia lebih memilih perkiraan sumber bass dan drum yang telah diproses oleh MSG.”
Nikmati makalah dan ringkasan berita ini? Dapatkan rekap harian di kotak masuk Anda!
Mempersiapkan wawancara dalam Ilmu Data atau Pembelajaran Mesin? Checkout Menuju platform persiapan wawancara AI Confetti AI:
Bagian Komunitas Belajar AI Bersama!
Meme minggu ini!
Terlalu kuat! 😂 Meme dibagikan oleh dimkiriakos#2286.
Postingan Komunitas unggulan dari Discord
Salah satu anggota Learn AI Together, Ravioli#7085, telah menerbitkan penelitian dan pracetak independen pertama mereka! Selamat Arav dan kami bersemangat untuk melihat publikasi berikutnya (saya memiliki wawasan dan beberapa lagi akan segera hadir!) Baca publikasi Arav.
Jika Anda sudah memiliki beberapa publikasi atau yang akan datang, silakan bagikan dengan kami di server!
Jajak pendapat AI minggu ini!
Bergabunglah dengan diskusi di Discord.
Bagian yang dikuratori TAI
Artikel minggu ini
Hubungan Matematis antara Kompleksitas Model dan Dilema Bias-Varians: Sebagian besar penggemar ilmu data akan setuju bahwa “Dilema Bias-Varians” menderita kelumpuhan analisis karena ada banyak literatur tentang gagasan Bias-Varians, dekomposisi, derivasi, dan hubungannya dengan kompleksitas model. Penulis menunjukkan mengapa, terlepas dari upaya terbaik kami, model sederhana menunjukkan bias yang signifikan sementara model kompleks menunjukkan bias minimal.
Jika Anda tertarik untuk menulis untuk kami di Towards AI, silakan mendaftar di sini dan kami akan mempublikasikan blog Anda ke jaringan kami jika memenuhi kebijakan dan standar editorial kami. https://contribute.towardsai.net/
Pandangan Etis Lauren tentang masa depan LLM
Saya ingin menulis tentang artikel luar biasa dari MIT Technology Review yang menyoroti banyak perspektif etis dari model bahasa besar dan masa depan kita bersama mereka. Dengan mengajukan pertanyaan, Apa yang GPT-3 “Tahu” Tentang Saya?, penulis Melissa Heikkilä membawa lensa pribadi ke fenomena besar. Dimulai dengan informasinya sendiri dan berkembang untuk mencakup orang lain, dia memeriksa disonansi yang mencolok antara respons yang akurat dan tidak akurat (dijuluki “halusinasi”) yang diberikan oleh LLM.
Ada kebutuhan untuk menjelajahi masa depan di mana informasi ini ada di mana-mana, karena semua model yang kita miliki tidak akan hilang dalam waktu dekat dan masih banyak lagi yang akan datang. Peningkatan ukuran dan kemampuan secara alami datang dengan peningkatan kerentanan. Meskipun kami memiliki konsep dan cara yang sangat berbeda dalam menegakkan standar privasi (seperti cerita besar tentang Meta ini), mengurangi risiko akan mengharuskan kami terus berinovasi menuju perlindungan privasi yang etis. Banyak yang mendukung gagasan bahwa semua informasi publik adalah permainan yang adil tidak lagi akan memotongnya untuk mendekati masalah privasi skala besar.
Saya senang melihat kemana masa depan perlindungan ini membawa kita, dan bagaimana kita memilih arah untuk membuat kemajuan. Perbedaan pribadi, regional, atau budaya memengaruhi cara kita memahami seperti apa privasi itu dan bagaimana privasi itu harus dilindungi. Saya mendorong Anda untuk memeriksa sendiri seperti apa itu!
Tawaran pekerjaan
Insinyur ML Senior @ Keamanan Aman (Jarak Jauh)
Research Scientist — Pengenalan ucapan @ Abridge (Jarak Jauh)
Ilmuwan Visi Komputer @ Percipient AI (Santa Clara, CA)
Ilmuwan Riset — Pembelajaran Mesin @ DeepMind (London, Inggris Raya)
Ilmuwan Data Senior @ EvolutionIQ (Jarak Jauh)
Senior ML Engineer — Pencarian Semantik @ Algolia (Hybrid remote)
Tertarik untuk berbagi peluang kerja di sini? Kontak [email protected] atau posting peluang di saluran #hiring kami di discord!
Jika Anda sedang mempersiapkan wawancara pembelajaran mesin berikutnya, jangan ragu untuk melihat platform persiapan wawancara terkemuka kami, confetti!
Buletin AI ini adalah semua yang Anda butuhkan # 11 awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.
Diterbitkan melalui Menuju AI