
Penulis: Menuju Tim Editorial AI
Awalnya diterbitkan di Towards AI the World’s Leading AI and Technology News and Media Company. Jika Anda sedang membangun produk atau layanan terkait AI, kami mengundang Anda untuk mempertimbangkan untuk menjadi sponsor AI. Di Towards AI, kami membantu menskalakan AI dan startup teknologi. Biarkan kami membantu Anda melepaskan teknologi Anda kepada massa.
Apa yang terjadi minggu ini di AI
Minggu ini, perhatian saya tertuju pada Emad dan pekerjaan luar biasa yang dia dan timnya (Stability.ai) lakukan. Minggu ini, Emad mengumumkan OpenCLIP, versi CLIP open-source yang mengalahkan hasil CLIP mutakhir, meningkatkan pasangan penyandian teks-gambar, yang memiliki dampak dramatis pada penelitian saat ini seperti open-source yang telah dilatih sebelumnya. model akan digunakan oleh ribuan peneliti untuk membuat aplikasi dan model baru yang menakjubkan yang melibatkan gambar dan teks.
Apa sebenarnya OpenCLIP itu? OpenCLIP adalah implementasi open-source dari OpenAI’s CLIP (Contrastive Language-Image Pre-training). Dan apa yang mereka bawa sebenarnya? Mengapa ini sangat keren? Ini keren karena, sebagai difusi yang stabil, tujuan mereka adalah untuk membawa CLIP kepada Anda, peneliti biasa (dalam hal sumber daya komputasi, bukan dalam hal keterampilan, Anda pasti lebih baik daripada peneliti biasa jika Anda membaca ini! ). Ini berarti bahwa mereka ingin mengaktifkan pelatihan/memfasilitasi studi model dengan pengawasan teks gambar yang kontras. Seperti yang mereka sebutkan, “titik awal kami adalah implementasi CLIP yang cocok dengan akurasi model CLIP asli ketika dilatih pada dataset yang sama.” Ini berarti mereka membawa banyak model pra-pelatihan SOTA baru yang dapat Anda terapkan berkat implementasi yang lebih efisien dan kode sumber terbuka (lihat di bawah). Lihat repositori mereka untuk mempelajari lebih lanjut dan menerapkan model mereka!
Berita Terpanas
Diffusion Bee, Aplikasi GUI Difusi Stabil untuk M1 Mac!
“Diffusion Bee adalah cara termudah untuk menjalankan Stable Diffusion secara lokal di M1 Mac Anda. Dilengkapi dengan penginstal sekali klik. Tidak ada ketergantungan atau pengetahuan teknis yang dibutuhkan.” Peneliti MIT telah membuat DALL-E lebih kreatif!
Seperti yang disoroti artikel tersebut, para peneliti mengembangkan metode baru yang menggunakan banyak model untuk membuat gambar yang lebih kompleks dengan pemahaman yang lebih baik. Metode yang disebut Composable-Diffusion, mencapai hasil yang lebih baik dengan menghasilkan gambar menggunakan serangkaian model difusi, dengan masing-masing bertanggung jawab untuk memodelkan komponen tertentu darinya. Saya dinominasikan di 2022 Noonies oleh Hackernoon!
Saya akan senang jika Anda dapat mendukung saya di sana dan memilih pekerjaan saya jika Anda menyukainya! (baik untuk buletin teknologi YouTube dan ilmu data). Terima kasih sebelumnya untuk komunitas yang luar biasa ini! 😊🙏
YT: https://www.noonies.tech/2022/emerging-tech/2022-top-tech-youtuber
Buletin: https://www.noonies.tech/2022/emerging-tech/2022-best-data-science-newsletter
Masalah ini disampaikan kepada Anda berkat Delta Academy:
Makalah paling menarik minggu ini
im2nerf: Gambar ke Neural Radiance Field di Alam Liar
Kerangka kerja pembelajaran yang memprediksi representasi objek saraf berkelanjutan yang diberikan gambar input tunggal di alam liar, diawasi hanya oleh output segmentasi dari metode pengenalan yang tersedia. Tuning Prompt Waktu Uji untuk Generalisasi Zero-Shot dalam Model Vision-Language
Test-Time Prompt Tuning (TPT): Metode yang dapat mempelajari perintah adaptif dengan cepat dengan satu sampel uji. StoryDALL-E: Mengadaptasi Transformer Text-to-Image Pralatih untuk Kelanjutan Cerita
“Kami pertama-tama mengusulkan tugas kelanjutan cerita, di mana cerita visual yang dihasilkan dikondisikan pada gambar sumber, memungkinkan generalisasi yang lebih baik untuk narasi dengan karakter baru. […] Pekerjaan kami menunjukkan bahwa model sintesis teks-ke-gambar yang telah dilatih sebelumnya dapat diadaptasi untuk tugas-tugas kompleks dan sumber daya rendah seperti kelanjutan cerita.”
Nikmati makalah dan ringkasan berita ini? Dapatkan rekap harian di kotak masuk Anda!
Bagian Komunitas Belajar AI Bersama!
Meme minggu ini!
Oh tidak…
EDA adalah singkatan dari Analisis Data Eksplorasi dan merupakan proses menyelidiki data yang akan Anda gunakan dalam model ML sebelum memikirkan model mana yang akan diterapkan.
Meme dibagikan oleh friedliver#0614.
Postingan komunitas unggulan dari Discord
Proyek keren dari deep2universe#6939 dari komunitas Learn AI. Algoritme akan berjalan di semua video YouTube dan melakukan deteksi pose dan gerakan pada orang-orang di video. Cukup keren! Seperti yang dia sebutkan, penulis, sayangnya, harus menghentikan pengembangan ekstensi, tetapi kode sumber terbuka untuk digunakan lebih lanjut. Kami sangat menganjurkan siapa pun yang ingin menangani proyek yang menarik untuk menjangkau deep2universe di discord untuk mengambil pekerjaannya. Ini adalah proyek fantastis bagi orang-orang yang tertarik dengan visi komputer, terutama deteksi gerakan atau pose.
Tonton selengkapnya di video demo:
https://medium.com/media/d4c93b56ed24598483d552e0f16c1f58/href
Unduh ekstensi Chrome.
Lihat kodenya:
GitHub – deep2universe/YouTube-Motion-Tracking: Ekstensi AI YouTube™ untuk pelacakan gerak
Jajak pendapat AI minggu ini!
Apa pendapat Anda tentang bekerja di akhir pekan, hari kerja, atau keduanya? Bergabunglah dengan diskusi di Discord.
Bagian yang dikuratori TAI
Artikel minggu ini
Perbedaan Antara Normalisasi dan Standardisasi oleh Chetan Ambi.
Salah satu proses penting dalam alur pembelajaran mesin adalah penskalaan fitur. Normalisasi dan standardisasi adalah dua metode yang umum digunakan untuk penskalaan fitur. Tapi apa perbedaan di antara mereka dan kapan menggunakannya? Ini adalah pertanyaan yang sangat umum di antara orang-orang yang baru saja memulai perjalanan ilmu data mereka. Penulis dengan indah menjelaskan perbedaannya menggunakan rumus, visualisasi, dan kode.
Artikel wajib kami baca
Tingkatkan Model Klasifikasi Anda Dengan Penyetelan Ambang Batas oleh Edoardo Bianchi
Data Tidak Seimbang — Penawaran Waktu Nyata oleh Snehal Nair
Jika Anda tertarik untuk menerbitkan dengan Towards AI, periksa pedoman kami dan daftar. Kami akan mempublikasikan karya Anda ke jaringan kami jika memenuhi kebijakan dan standar editorial kami.
Sikap Etis Lauren untuk meningkatkan kreativitas DALLE
Saya pikir sangat luar biasa bahwa model ini mampu mematuhi perintah bahasa alami, terima kasih kepada peneliti MIT! Namun, saya tidak begitu setuju dengan klaim umum bahwa kemampuan ini meningkatkan kreativitas model. Peningkatan ini tampaknya lebih terfokus pada akurasi, yang kreativitas sebagai sebuah konsep tidak selalu berkorelasi dengannya. Seni seringkali membutuhkan pelanggaran aturan atau bekerja dengan kecelakaan, dan “kesalahan” ini adalah bagian dari proses kreatif dan sering kali membuat seni menjadi luar biasa. Meningkatkan kemampuan model untuk mewarnai garis tidak mengikuti prinsip ini. Demikian pula, peningkatan kompleksitas tidak selalu berkorelasi dengan peningkatan kreativitas — hal-hal yang sangat sederhana bisa menjadi sangat kreatif.
Argumen tandingan dari pendirian pertama saya mungkin bahwa melatih kemampuan dalam batasan bahasa alami sebenarnya lebih merupakan latihan kreatif daripada diizinkan keluar dari skrip. Namun, saya akan menegaskan kembali bahwa melanggar parameter bisa lebih kreatif daripada bekerja di dalamnya. Bagian dari apa yang membuat gelombang awal kreasi DALLE begitu berdampak adalah kurangnya perhatian terhadap praduga berdasarkan bahasa (selain dari apa yang dilatihnya, tentu saja!). Kami mungkin kehilangan sebagian dari kesan kreatif tersebut dengan mengoptimalkan akurasi dengan cara ini. Arah mana pun yang kami pilih akan terus membentuk cara kami berupaya menumbuhkan kreativitas dan masa depan alat seni digital AI!
Tawaran pekerjaan
Tertarik untuk berbagi peluang kerja di sini? Kontak [email protected] atau posting peluang di saluran #hiring kami di discord!
Buletin AI ini adalah semua yang Anda butuhkan #13 awalnya diterbitkan di Towards AI on Medium, di mana orang-orang melanjutkan percakapan dengan menyoroti dan menanggapi cerita ini.
Diterbitkan melalui Menuju AI