Model AI Baru Nvidia dapat Mengonversi Gambar diam menjadi Grafik 3D

Teknologi Nvidia dapat membantu melatih robot dan mobil self-driving, atau membuat pengaturan 3D untuk game, dan animasi dengan lebih mudah. Nvidia telah melakukan upaya lain untuk menambahkan kedalaman ke dangkal Postingan Model AI Baru Nvidia dapat Mengonversi Gambar diam ke Grafik 3D muncul pertama kali di .

Kantorpemuda Teknologi Nvidia dapat membantu melatih robot dan mobil self-driving, atau membuat pengaturan 3D untuk game, dan animasi dengan lebih mudah. Nvidia telah melakukan upaya lain untuk menambah kedalaman pada grafik yang dangkal. Setelah mengonversi gambar 2D menjadi adegan, model, dan video 3D , perusahaan telah mengalihkan fokusnya ke pengeditan. Raksasa GPU hari ini meluncurkan metode AI baru yang mengubah foto diam menjadi objek 3D yang dapat dimodifikasi oleh pembuat konten dengan mudah. Nvidia peneliti telah mengembangkan pipa rendering terbalik baru, Nvidia 3D MoMa yang memungkinkan pengguna untuk merekonstruksi serangkaian foto diam menjadi model komputer 3D dari suatu objek, atau bahkan sebuah pemandangan. Manfaat utama dari alur kerja ini, dibandingkan dengan metode fotogrametri yang lebih tradisional, adalah kemampuannya untuk menghasilkan model 3D yang bersih yang mampu diimpor dan diedit langsung oleh game 3D dan mesin visual. Menurut laporan, program fotogrametri lainnya akan mengubah gambar 2D menjadi model 3D, teknologi 3D MoMa Nvidia mengambil langkah lebih jauh dengan menghasilkan mesh, material, dan informasi pencahayaan dari subjek dan mengeluarkannya dalam format yang kompatibel dengan mesin grafis 3D yang ada dan alat pemodelan. Dan itu semua dilakukan dalam jangka waktu yang relatif singkat, dengan Nvidia mengatakan 3D MoMa dapat menghasilkan model mesh segitiga dalam waktu satu jam menggunakan GPU Nvidia Tensor Core tunggal. David Luebke, Wakil Presiden penelitian grafis Nvidia, menjelaskan teknik tersebut dengan India Today sebagai “cawan suci yang menyatukan visi komputer dan grafis komputer.” “Dengan merumuskan setiap bagian dari masalah rendering terbalik sebagai komponen terdiferensiasi yang dipercepat GPU, pipa rendering NVIDIA 3D MoMa menggunakan mesin AI modern dan tenaga komputasi mentah GPU NVIDIA untuk menghasilkan objek 3D dengan cepat yang dapat diimpor, diedit, dan diperluas oleh pembuat konten tanpa batasan pada alat yang ada,” kata Lubeke. Dengan ini, Nvidia mengatakan bahwa teknologinya adalah “salah satu model pertama dari jenisnya yang menggabungkan pelatihan jaringan saraf ultra-cepat dan rendering cepat. ” Seperti yang disebutkan dalam blognya, Instant NeRF dapat mempelajari adegan 3D resolusi tinggi dalam hitungan detik, dan “dapat merender gambar adegan itu dalam beberapa milidetik.” Ini disebut-sebut sebagai “percepatan lebih dari 1.000x” daripada proses NeRF biasa yang terlihat hingga saat ini. Apa itu NeRF? Menurut Nvidia, NeRFs menggunakan jaringan saraf untuk mewakili dan membuat adegan 3D realistis berdasarkan koleksi masukan gambar 2D. Mengumpulkan data untuk memberi makan NeRF sedikit seperti menjadi fotografer karpet merah yang mencoba menangkap pakaian selebriti dari setiap sudut — jaringan saraf memerlukan beberapa lusin gambar yang diambil dari berbagai posisi di sekitar adegan, serta posisi kamera masing-masing tembakan itu. Dalam adegan yang menyertakan orang atau elemen bergerak lainnya, semakin cepat tembakan ditangkap, semakin baik. Jika ada terlalu banyak gerakan selama proses pengambilan gambar 2D, pemandangan 3D yang dihasilkan AI akan buram. Dari sana, NeRF pada dasarnya mengisi kekosongan, melatih jaringan saraf kecil untuk merekonstruksi pemandangan dengan memprediksi warna cahaya yang memancar ke segala arah, dari titik mana pun dalam ruang 3D. Teknik ini bahkan dapat mengatasi oklusi — ketika objek yang terlihat di beberapa gambar terhalang oleh penghalang seperti pilar di gambar lain. Teknologi ini dapat digunakan untuk melatih robot dan mobil yang dapat mengemudi sendiri untuk memahami ukuran dan bentuk objek dunia nyata dengan menangkap gambar 2D atau rekaman video dari objek tersebut. Ini juga dapat digunakan dalam arsitektur dan hiburan untuk dengan cepat menghasilkan representasi digital dari lingkungan nyata yang dapat dimodifikasi dan dibangun oleh pencipta. Di luar NeRF, peneliti NVIDIA mengeksplorasi bagaimana teknik pengkodean input ini dapat digunakan untuk mempercepat berbagai tantangan AI termasuk pembelajaran penguatan, terjemahan bahasa, dan algoritme pembelajaran mendalam tujuan umum. Lebih Banyak Cerita Trending Bitcoin Menambahkan 13rb 'Wholecoiners' Minggu Lalu! Investor Cerdas Membeli Penurunan Teknik Computer Vision Baru dapat Memulihkan Info 3D dari Gambar 2D Ikhtisar Pembelajaran Penguatan MendalamMengapa AI Simbolik Sangat Penting untuk Operasi Bisnis?Manusia Dalam Pembelajaran Mesin Loop Dapat Menyelamatkan Anda dari Perangkap DataJHipster Dapat Memberikan Keunggulan pada Full-Stac Anda k Proyek Java10 NFT Teratas Saham untuk Dibeli dan Ditahan Selamanya Postingan Model AI Baru Nvidia dapat Mengonversi Gambar diam menjadi Grafik 3D muncul pertama kali di .