Setelah ledakan ChatGPT, model AI menjadi hot spot yang dikejar oleh banyak perusahaan teknologi. Dari percakapan obrolan, hingga pembuatan gambar, hingga kantor desktop, tampaknya AI memiliki kekuatan supernatural untuk mengubah segalanya dalam semalam.
Kegemaran tersebut menyebar ke industri otomotif, dan para praktisi mulai berpikir: Apakah layak membiarkan GPT membuat mobil?
Beberapa perusahaan mobil mengumumkan akan menerapkan teknologi model skala besar, sementara yang lain mengatakan akan mengakses model besar pihak ketiga, dan beberapa perusahaan mobil bergegas merilis sistem penggerak otomatis dengan kata GPT.
Beberapa praktisi memberi tahu Shentu bahwa kokpit pintar dan pengemudian otomatis mungkin merupakan skenario aplikasi pertama dari model besar. Diantaranya, autonomous driving adalah yang paling dinantikan.
Mengemudi otonom adalah trek yang sangat sulit. Selain raksasa teknologi seperti Google dan Baidu, sejumlah besar wirausahawan berbakat telah mengabdikan diri untuk itu dan menghabiskan miliaran dolar, tetapi sejauh ini mereka belum mencapai hasil yang memuaskan.
Model besar AI memasuki penggerak otomatis, apakah kali ini akan berbeda?
Berapa hubungan antara GPT dan mobil?
GPT tidak memiliki hubungan langsung dengan mobil di permukaan, namun sebenarnya memiliki hubungan yang dalam. Cerita harus dimulai enam tahun lalu.
Pada Juni 2017, Musk, bos Tesla, memburu seorang peneliti Slovakia dari OpenAI. Pria itu adalah Andrej Karpathy, yang kemudian menjadi direktur AI Tesla.
Saat itu, Musk menunjukkan minat yang besar pada kecerdasan buatan, dan dia juga salah satu pendiri OpenAI. Tak lama setelah merekrut Andrej Karpathy, Musk keluar dari dewan direksi OpenAI. Dia yakin Tesla dan OpenAI sedang meneliti AI, dan mungkin ada konflik kepentingan di masa depan.
Belakangan, Andrej Karpathy menulis ulang algoritme autopilot di Tesla dan mengembangkan teknologi persepsi visual murni BEV, yang membawa autopilot Tesla ke tahap baru. Dan mantan pemiliknya, OpenAI, mempertaruhkan semua chip pada kecerdasan buatan umum, dan akhirnya mengembangkan GPT.
Dari perspektif produk, GPT OpenAI dan BEV Tesla adalah spesies yang sama sekali berbeda. Namun dari segi teknologi yang mendasarinya, semuanya mengandalkan teknologi kecerdasan buatan, terutama penerapan model Google Transformer.
Transformer adalah arsitektur jaringan saraf pembelajaran mendalam yang diusulkan oleh 8 ilmuwan AI Google pada tahun 2017. Ini adalah penemuan yang sangat penting dalam industri kecerdasan buatan Huruf "T" di ChatGPT yang populer saat ini mengacu pada model Transformer.
Berbeda dari jaringan saraf RNN dan CNN tradisional, Transformer menggunakan mekanisme perhatian diri untuk menggali koneksi dan korelasi berbagai elemen dalam urutan, dan memiliki kemampuan yang baik untuk memproses data deret waktu. Hal ini memungkinkan untuk menunjukkan kinerja yang luar biasa dalam tugas-tugas seperti terjemahan mesin, peringkasan teks, dan sistem penjawab pertanyaan.
Oleh karena itu, Transformer pertama kali digunakan dalam bidang NLP (advanced natural language processing) untuk memahami teks dan bahasa manusia.
Pra-pelatihan pada model Transformer, setelah penyempurnaan dan iterasi terus-menerus, OpenAI telah meluncurkan model pelatihan bahasa besar seperti GPT-1, GPT-2, GPT-3, dan GPT-4. ChatGPT adalah robot dialog yang dikembangkan oleh OpenAI setelah menyempurnakan model GPT-3. Karena dapat berinteraksi dengan cara percakapan, orang biasa mudah digunakan, dan lebih "pintar" daripada chatbot di masa lalu, sehingga bersinar.
Pada dasarnya, model GPT ChatGPT, model LaMDA Google, dan model Wenxin Baidu semuanya memiliki asal yang sama.
Menggunakan model Transformer untuk bahasa alami melahirkan aplikasi obrolan seperti ChatGPT, menggunakannya dalam visi komputer juga telah mencapai hasil yang luar biasa Pelopor dalam hal ini adalah Tesla.
Andrej Karpathy bertanggung jawab untuk memimpin tim visi komputer untuk mengemudi secara otonom selama masa jabatannya sebagai direktur AI Tesla.Dengan menggabungkan model Transformer, Tesla berhasil mengembangkan teknologi BEV.
Nama lengkap BEV adalah Bird's Eye View, yaitu pemandangan mata burung. Itu dapat mengubah gambar 2D yang diambil oleh kamera menjadi gambar 3D dengan penyambungan, dan secara seragam mengubahnya menjadi sudut pandang untuk diproses, membentuk "perspektif Tuhan". Alasannya, mengemudi dilakukan dalam ruang tiga dimensi, dan yang dilihat orang adalah dunia tiga dimensi, bukan gambar 2D.
Solusi persepsi baru ini akan didemonstrasikan oleh Andrej Karpathy pada Tesla AI DAY pada Agustus 2021. Karena alasan ini, Tesla tidak ragu untuk menulis ulang algoritme autopilot dan merekonstruksi infrastruktur untuk melatih jaringan saraf yang dalam.
Ini adalah pertama kalinya teknologi model besar diterapkan pada industri penggerak otonom.
Menengok ke belakang hari ini, meskipun GPT saat ini terutama digunakan di bidang pemrosesan bahasa alami, kami tidak dapat membiarkan GPT mengendarai mobil, tetapi teknologi model besar AI di belakangnya, terutama arsitektur Transformer, sebenarnya telah mengemudi secara otonom. lapangan diterapkan.
Dari pemrosesan bahasa alami hingga visi komputer, kedua bidang tersebut telah menyatukan struktur pemodelan berdasarkan arsitektur Transformer, membuat pemodelan bersama menjadi lebih mudah.
Dan ketika pemahaman tentang AI semakin dalam, perusahaan mobil menjadi semakin mirip dengan perusahaan kecerdasan buatan. Selain Tesla, Li Auto mengumumkan visi perusahaannya awal tahun ini, mengklaim akan menjadi perusahaan kecerdasan buatan pada tahun 2030. Ini akan meluncurkan sistem mengemudi bantuan navigasi perkotaan NOA tahun ini, dan dukungan teknisnya adalah persepsi BEV dan model Transformer.
Tampaknya tidak ada perbedaan antara membiarkan AI berbicara dengan orang dan membiarkan AI mengendarai mobil, kecuali bahwa skenario pendaratan keduanya berbeda. Manusia selalu penuh imajinasi ketika harus menerapkan teknologi yang mendasari produk tertentu.
GPT mengajarkan hal-hal tersebut tentang mengemudi otomatis
Sejak awal tahun ini, kemampuan dahsyat yang ditunjukkan oleh GPT telah mengejutkan dunia luar. Kecerdasan buatan umum bukan lagi kastil di udara. Orang-orang di industri mengemudi otonom mulai berpikir bahwa mungkin penerapan AI generatif pada model bahasa dapat dimigrasikan ke mengemudi otonom.
Pada dasarnya, model bahasa adalah model matematis dari bahasa manusia. Komputer masih belum memahami bahasa alami, tetapi mengubah masalah bahasa menjadi masalah matematika melalui pemodelan matematika. Bahasa alami dipahami secara tidak langsung dengan memprediksi kemungkinan kata berikutnya muncul melalui sejarah teks tertentu.
Beralih ke adegan mengemudi, mengingat lingkungan lalu lintas saat ini, peta navigasi, dan riwayat perilaku mengemudi pengemudi, dapatkah model besar memprediksi tindakan mengemudi berikutnya?
Yu Kai, pendiri Horizon, mengatakan pada Forum 100 Kendaraan Listrik yang diadakan pada bulan April tahun ini bahwa ChatGPT banyak menginspirasinya, "Kami akan terus menggunakan data besar, data lebih besar, model lebih besar, dan pembelajaran tanpa pengawasan. Manusia mencoba untuk mengemudi, sama seperti Anda belajar dari sejumlah besar teks natural tanpa pengawasan dan tanpa label." Dia berpendapat bahwa urutan kontrol mengemudi setiap pengemudi seperti teks bahasa alami kita. Selanjutnya, dia ingin membuat model bahasa besar yang kembali ke mengemudi otonom.
Secara teori, ide ini layak. AI sudah memiliki kemampuan untuk belajar. Menurut model bahasa adaptif, mesin akan terus mengoptimalkan secara iteratif sesuai dengan umpan balik pengguna, mempelajari kebiasaan pengguna, dan kemudian menyempurnakan model. ChatGPT saat ini menggunakan teknologi ini. Kemudian, tidak sulit bagi mesin untuk mempelajari kebiasaan berkendara pengemudi.
Mode bayangan Tesla adalah memberi makan data mengemudi pengemudi nyata ke pembelajaran mesin. Tujuan pelatihan algoritma dicapai dengan membandingkan perilaku pengemudi manusia.
Setelah GPT memulai babak baru ledakan AI, dampak kognitif pada industri adalah dengan meningkatkan skala parameter model, jumlah data meningkat secara eksponensial, yang disebut model besar.Setelah mencapai titik kritis tertentu , Model tiba-tiba bisa menjadi pintar.
Sebelumnya, data yang dibutuhkan oleh model selama fase pelatihan diberi label secara manual. Mengambil mengemudi otonom sebagai contoh, pemberi label data menggunakan sejumlah besar gambar untuk memberi label dan memberi tahu mesin apa itu kucing, apa itu anjing, dan berapa banyak jenis kucing dan anjing yang ada. Anotator itu seperti guru mesin, mengajarkannya untuk memahami dunia berulang kali.
Masalahnya, apa yang guru tidak ajarkan, mesin tetap tidak bisa. Contoh tipikal adalah Tesla sering mengalami kecelakaan autopilot, dan kendaraan tersebut menabrak truk besar yang terbalik karena mesin tidak dapat mengenalinya.
He Yuhua, mitra pendiri Hegao Capital, memberikan contoh seperti itu kepada Shentu: Guangzhou sering mengalami musim hujan, dan di beberapa adegan dengan cahaya redup, akan ada banyak serangga terbang di udara. Saat sebuah mobil lewat, lampunya menyala, dan mungkin ada ribuan serangga terbang yang menabrak bagian depan mobil. Dalam hal ini, sistem persepsi mengemudi otonom mobil mungkin salah mengartikannya sebagai dinding.
Sistem penggerak otomatis tidak dapat menghabiskan semua kasus sudut (skenario ekstrem), yang merupakan kesulitan utama dalam pengembangannya.
Apa yang diambil ChatGPT adalah data yang tidak ditandai dari seluruh jaringan. Dalam pembelajaran yang diawasi sendiri, data itu sendiri digunakan sebagai sinyal pengawasan, daripada mengandalkan label yang diberi label oleh manusia. Suatu hari orang menemukan bahwa dalam proses mencerna data ini, model besar tiba-tiba memiliki kemampuan untuk menyimpulkan kasus lain dari satu contoh.
Jadi, jika model mengemudi otonom yang besar juga dapat mempelajari perilaku mengemudi manusia tanpa pengawasan, tanpa perlu "guru" untuk mengajarkannya, apakah itu berarti sistem tersebut tiba-tiba berubah menjadi "pengemudi lama"?
GPT "mengemudi", tidak dapat diandalkan
Mimpi itu indah, dan jalan untuk mewujudkannya selalu sangat tipis.
Agar model AI yang mirip dengan ChatGPT mengerahkan kekuatannya di bidang mengemudi otonom, setidaknya masalah berikut perlu diselesaikan saat ini.
Yang pertama adalah sumber data.
Sumber data ChatGPT sangat kaya, termasuk Wikipedia, buku, artikel berita, jurnal ilmiah, dll., Yang setara dengan data publik seluruh jaringan sebagai makanannya.
Mengemudi otonom berbeda. Data mengemudi pengemudi dan data mengemudi kendaraan tidak diungkapkan, dan banyak di antaranya melibatkan privasi. Produsen mobil dan perusahaan self-driving beroperasi secara independen, dan datanya tertutup dan tidak diedarkan, sehingga sulit untuk mendapatkan data. Tanpa data, mengemudi secara otonom adalah air tanpa sumber.
He Zhiqiang, presiden Lenovo Venture Capital, mengatakan kepada Shentu bahwa inti dari mengemudi otonom adalah memiliki data, dan data sangat penting untuk model pelatihan. OEM seperti BYD memiliki data, tetapi algoritme mereka masih perlu disempurnakan Pabrikan mobil baru seperti "Wei Xiaoli" bagus dalam algoritme, tetapi penjualan mobil mereka tidak cukup. Perusahaan dengan data dan algoritme dapat memanfaatkan sepenuhnya model besar.
Yang kedua adalah bahwa metode penerapan komputasi sistem terbatas.
Yu Kai percaya bahwa OpenAI dan ChatGPT melakukan komputasi di cloud, yang memiliki suplai energi yang cukup, suplai daya, dan sistem yang sangat baik, tetapi jika mobil mengandalkan baterai dan pembuangan panas mobil, maka ini Tantangannya besar , artinya pengendaraan otomatis tidak bisa menggunakan model sebesar itu dan perhitungan sebesar itu.
Konsumsi daya komputasi oleh model besar telah menyebabkan produsen cloud computing menjadi pemain pertama yang menikmati dividen dalam gelombang ledakan AI ini. Pengembangan komputasi awan perusahaan besar juga membuka jalan bagi model besar. Tapi di ujung mobil, ini akan menjadi kontradiksi.
Masalah yang lebih besar adalah keandalan model besar belum diverifikasi.
Orang yang pernah menggunakan ChatGPT tahu bahwa ChatGPT terkadang berbicara omong kosong, terkadang benar dan terkadang salah. Ini dikenal di industri sebagai kecenderungan halusinasi, kecenderungan untuk menghasilkan konten tidak nyata yang tidak memiliki sumber sama sekali. Model-model besar mengada-ada tanpa mempedulikan kebenaran dan keakuratannya.
Mengobrol bisa jadi omong kosong, tetapi mengemudi otomatis tidak bisa. Hasil dari output yang salah bisa berakibat fatal.
"ChatGPT telah membuat kemajuan besar, tetapi mengemudi otomatis belum datang, karena mengemudi otomatis, terutama mengemudi tanpa awak, mungkin memiliki tingkat toleransi kesalahan nol, yang merupakan masalah kehidupan manusia," kata Yu Kai.
Long Zhiyong, yang pernah menjabat sebagai COO sebuah perusahaan rintisan AI di Silicon Valley, percaya bahwa hal yang tidak dapat dikendalikan, tidak dapat diprediksi, dan tidak dapat diandalkan adalah ancaman terbesar bagi komersialisasi model besar. Manifestasi khasnya adalah model besar cenderung berhalusinasi.
Sekarang, tidak realistis bagi sistem penggerak otomatis untuk belajar memilih dan membedakan, dan menghasilkan solusi optimal secara stabil.
Orang dalam perusahaan kecerdasan buatan mengatakan kepada Shentu: "Memang ada banyak terobosan dalam persepsi visual di tingkat algoritme. Tapi adegan mobil terlalu menuntut. Saya pribadi tidak berpikir akan ada terobosan besar dalam jangka pendek. . Kamu bisa memperhatikan gerakan spesial Sla."
Namun, baru-baru ini ada kecenderungan di kalangan teknologi bahwa perusahaan besar dan kecil ingin melihat hot spot GPT. Beberapa pabrikan mobil telah mengumumkan akan menerapkan teknologi mirip GPT, dan segudang konsep keren membuat orang bingung.
Misalnya, perusahaan penggerak otonom di bawah perusahaan mobil tradisional telah merilis model generatif besar untuk penggerak otonom, yang disebut "yang pertama di industri" yang menggunakan model ini untuk melatih mengemudi otonom.
Seorang investor yang telah lama memperhatikan jalur mobil pintar bertanya kepada pemimpin industri apa pendapatnya tentang model tersebut, dan pihak lain menjawab dengan empat kata: "Omong kosong TM."
"Itu hanya tindakan PR." Investor mengomentari Shentu.
Mengemudi otonom, apakah akan digulingkan dan dimulai kembali?
Didorong oleh Tesla, ditambah dengan gelombang AI yang muncul tahun ini, industri penggerak otonom secara bertahap mendekati arah model besar, daya komputasi besar, dan data besar.
Dampak model besar pada mengemudi otonom belum cukup drastis, tetapi orang dengan indra penciuman yang tajam telah menunjukkan ambivalensi.
Sama seperti ketika Tesla menggunakan Transformer untuk mengonversi data multi-kamera dari ruang gambar ke ruang BEV, Tesla tidak ragu untuk menggulingkan arsitektur asli dan menulis ulang algoritme. Penerapan model besar sekarang juga dapat berarti bahwa algoritme mengemudi otomatis asli akan digulingkan dan dimulai kembali.
He Zhiqiang percaya bahwa model besar akan berdampak besar pada pengemudian otonom. Di masa lalu, banyak model kecil digunakan untuk mengemudi secara otonom, tetapi sekarang telah menjadi model besar, dan mungkin perlu dilakukan lagi. Industri mengemudi otonom akan dirombak.
Zhao Dongxiang, direktur mengemudi otonom di perusahaan chip AI, mengatakan kepada Shentu bahwa perubahan ujung ke ujung secara keseluruhan sama saja dengan melakukannya lagi.
Mengocok adalah peluang bagi pendatang baru dan ancaman bagi para pemimpin. Kisah menyalip di tikungan sering terjadi di masa perubahan teknologi yang cepat. Di era teknologi yang cepat, semakin banyak investasi di jalur lama, semakin besar biaya hangus, dan semakin sulit untuk berbalik arah. Untuk OEM atau perusahaan penggerak otonom, untuk merangkul teknologi baru, tidak hanya efeknya tetapi juga biayanya harus dipertimbangkan.
Zhao Dongxiang berkata bahwa sejauh menyangkut tahap saat ini, tidak ada artinya mengubah rute teknis mengemudi otomatis. "Sekarang kemampuan teknis industri tidak buruk. Setiap orang telah menghabiskan begitu banyak uang untuk waktu yang lama. Jika tidak ada yang substansial perbaikan, tidak ada motivasi untuk berubah."
Pada AI DAY akhir tahun lalu, Tesla meningkatkan BEV menjadi jaringan hunian (occupancy network), dan kemampuan generalisasi semakin ditingkatkan. Dengan menempati jaringan, sistem persepsi autopilot Tesla dapat menilai apakah ia perlu menghindarinya tanpa mengetahui objek apa yang dilihatnya, sehingga menyelesaikan lebih banyak masalah ekor panjang.
Apa pun jenis rute teknisnya, sekarang sedang mengalami perubahan dan iterasi yang cepat. Model kecil di masa lalu mungkin akan digantikan oleh model besar, dan model besar saat ini mungkin juga akan digantikan oleh beberapa spesies baru di masa mendatang.
Namun bagaimanapun juga, praktik menggosok hot spot dan membuat tipu muslihat tidak kondusif bagi kemajuan teknologi. "Merupakan kebiasaan buruk untuk mengikuti panas, dan berguna untuk membuat produk dengan cara yang membumi," kata Zhao Dongxiang.
"Bom raja" yang sebenarnya dari mengemudi otonom masih jauh dari datang. Yang perlu kita lakukan adalah tetap kagum pada setiap putaran perubahan teknologi. GPT mitos tidak dapat membuat mobil impian Anda, tetapi setidaknya, perubahan telah terjadi.
Lihat Asli
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
GPT mitos tidak dapat membangun mobil impian Anda
Setelah ledakan ChatGPT, model AI menjadi hot spot yang dikejar oleh banyak perusahaan teknologi. Dari percakapan obrolan, hingga pembuatan gambar, hingga kantor desktop, tampaknya AI memiliki kekuatan supernatural untuk mengubah segalanya dalam semalam.
Kegemaran tersebut menyebar ke industri otomotif, dan para praktisi mulai berpikir: Apakah layak membiarkan GPT membuat mobil?
Beberapa perusahaan mobil mengumumkan akan menerapkan teknologi model skala besar, sementara yang lain mengatakan akan mengakses model besar pihak ketiga, dan beberapa perusahaan mobil bergegas merilis sistem penggerak otomatis dengan kata GPT.
Beberapa praktisi memberi tahu Shentu bahwa kokpit pintar dan pengemudian otomatis mungkin merupakan skenario aplikasi pertama dari model besar. Diantaranya, autonomous driving adalah yang paling dinantikan.
Mengemudi otonom adalah trek yang sangat sulit. Selain raksasa teknologi seperti Google dan Baidu, sejumlah besar wirausahawan berbakat telah mengabdikan diri untuk itu dan menghabiskan miliaran dolar, tetapi sejauh ini mereka belum mencapai hasil yang memuaskan.
Model besar AI memasuki penggerak otomatis, apakah kali ini akan berbeda?
Berapa hubungan antara GPT dan mobil?
GPT tidak memiliki hubungan langsung dengan mobil di permukaan, namun sebenarnya memiliki hubungan yang dalam. Cerita harus dimulai enam tahun lalu.
Pada Juni 2017, Musk, bos Tesla, memburu seorang peneliti Slovakia dari OpenAI. Pria itu adalah Andrej Karpathy, yang kemudian menjadi direktur AI Tesla.
Saat itu, Musk menunjukkan minat yang besar pada kecerdasan buatan, dan dia juga salah satu pendiri OpenAI. Tak lama setelah merekrut Andrej Karpathy, Musk keluar dari dewan direksi OpenAI. Dia yakin Tesla dan OpenAI sedang meneliti AI, dan mungkin ada konflik kepentingan di masa depan.
Belakangan, Andrej Karpathy menulis ulang algoritme autopilot di Tesla dan mengembangkan teknologi persepsi visual murni BEV, yang membawa autopilot Tesla ke tahap baru. Dan mantan pemiliknya, OpenAI, mempertaruhkan semua chip pada kecerdasan buatan umum, dan akhirnya mengembangkan GPT.
Dari perspektif produk, GPT OpenAI dan BEV Tesla adalah spesies yang sama sekali berbeda. Namun dari segi teknologi yang mendasarinya, semuanya mengandalkan teknologi kecerdasan buatan, terutama penerapan model Google Transformer.
Transformer adalah arsitektur jaringan saraf pembelajaran mendalam yang diusulkan oleh 8 ilmuwan AI Google pada tahun 2017. Ini adalah penemuan yang sangat penting dalam industri kecerdasan buatan Huruf "T" di ChatGPT yang populer saat ini mengacu pada model Transformer.
Berbeda dari jaringan saraf RNN dan CNN tradisional, Transformer menggunakan mekanisme perhatian diri untuk menggali koneksi dan korelasi berbagai elemen dalam urutan, dan memiliki kemampuan yang baik untuk memproses data deret waktu. Hal ini memungkinkan untuk menunjukkan kinerja yang luar biasa dalam tugas-tugas seperti terjemahan mesin, peringkasan teks, dan sistem penjawab pertanyaan.
Oleh karena itu, Transformer pertama kali digunakan dalam bidang NLP (advanced natural language processing) untuk memahami teks dan bahasa manusia.
Pra-pelatihan pada model Transformer, setelah penyempurnaan dan iterasi terus-menerus, OpenAI telah meluncurkan model pelatihan bahasa besar seperti GPT-1, GPT-2, GPT-3, dan GPT-4. ChatGPT adalah robot dialog yang dikembangkan oleh OpenAI setelah menyempurnakan model GPT-3. Karena dapat berinteraksi dengan cara percakapan, orang biasa mudah digunakan, dan lebih "pintar" daripada chatbot di masa lalu, sehingga bersinar.
Pada dasarnya, model GPT ChatGPT, model LaMDA Google, dan model Wenxin Baidu semuanya memiliki asal yang sama.
Menggunakan model Transformer untuk bahasa alami melahirkan aplikasi obrolan seperti ChatGPT, menggunakannya dalam visi komputer juga telah mencapai hasil yang luar biasa Pelopor dalam hal ini adalah Tesla.
Andrej Karpathy bertanggung jawab untuk memimpin tim visi komputer untuk mengemudi secara otonom selama masa jabatannya sebagai direktur AI Tesla.Dengan menggabungkan model Transformer, Tesla berhasil mengembangkan teknologi BEV.
Nama lengkap BEV adalah Bird's Eye View, yaitu pemandangan mata burung. Itu dapat mengubah gambar 2D yang diambil oleh kamera menjadi gambar 3D dengan penyambungan, dan secara seragam mengubahnya menjadi sudut pandang untuk diproses, membentuk "perspektif Tuhan". Alasannya, mengemudi dilakukan dalam ruang tiga dimensi, dan yang dilihat orang adalah dunia tiga dimensi, bukan gambar 2D.
Solusi persepsi baru ini akan didemonstrasikan oleh Andrej Karpathy pada Tesla AI DAY pada Agustus 2021. Karena alasan ini, Tesla tidak ragu untuk menulis ulang algoritme autopilot dan merekonstruksi infrastruktur untuk melatih jaringan saraf yang dalam.
Ini adalah pertama kalinya teknologi model besar diterapkan pada industri penggerak otonom.
Menengok ke belakang hari ini, meskipun GPT saat ini terutama digunakan di bidang pemrosesan bahasa alami, kami tidak dapat membiarkan GPT mengendarai mobil, tetapi teknologi model besar AI di belakangnya, terutama arsitektur Transformer, sebenarnya telah mengemudi secara otonom. lapangan diterapkan.
Dari pemrosesan bahasa alami hingga visi komputer, kedua bidang tersebut telah menyatukan struktur pemodelan berdasarkan arsitektur Transformer, membuat pemodelan bersama menjadi lebih mudah.
Dan ketika pemahaman tentang AI semakin dalam, perusahaan mobil menjadi semakin mirip dengan perusahaan kecerdasan buatan. Selain Tesla, Li Auto mengumumkan visi perusahaannya awal tahun ini, mengklaim akan menjadi perusahaan kecerdasan buatan pada tahun 2030. Ini akan meluncurkan sistem mengemudi bantuan navigasi perkotaan NOA tahun ini, dan dukungan teknisnya adalah persepsi BEV dan model Transformer.
Tampaknya tidak ada perbedaan antara membiarkan AI berbicara dengan orang dan membiarkan AI mengendarai mobil, kecuali bahwa skenario pendaratan keduanya berbeda. Manusia selalu penuh imajinasi ketika harus menerapkan teknologi yang mendasari produk tertentu.
GPT mengajarkan hal-hal tersebut tentang mengemudi otomatis
Sejak awal tahun ini, kemampuan dahsyat yang ditunjukkan oleh GPT telah mengejutkan dunia luar. Kecerdasan buatan umum bukan lagi kastil di udara. Orang-orang di industri mengemudi otonom mulai berpikir bahwa mungkin penerapan AI generatif pada model bahasa dapat dimigrasikan ke mengemudi otonom.
Pada dasarnya, model bahasa adalah model matematis dari bahasa manusia. Komputer masih belum memahami bahasa alami, tetapi mengubah masalah bahasa menjadi masalah matematika melalui pemodelan matematika. Bahasa alami dipahami secara tidak langsung dengan memprediksi kemungkinan kata berikutnya muncul melalui sejarah teks tertentu.
Beralih ke adegan mengemudi, mengingat lingkungan lalu lintas saat ini, peta navigasi, dan riwayat perilaku mengemudi pengemudi, dapatkah model besar memprediksi tindakan mengemudi berikutnya?
Yu Kai, pendiri Horizon, mengatakan pada Forum 100 Kendaraan Listrik yang diadakan pada bulan April tahun ini bahwa ChatGPT banyak menginspirasinya, "Kami akan terus menggunakan data besar, data lebih besar, model lebih besar, dan pembelajaran tanpa pengawasan. Manusia mencoba untuk mengemudi, sama seperti Anda belajar dari sejumlah besar teks natural tanpa pengawasan dan tanpa label." Dia berpendapat bahwa urutan kontrol mengemudi setiap pengemudi seperti teks bahasa alami kita. Selanjutnya, dia ingin membuat model bahasa besar yang kembali ke mengemudi otonom.
Secara teori, ide ini layak. AI sudah memiliki kemampuan untuk belajar. Menurut model bahasa adaptif, mesin akan terus mengoptimalkan secara iteratif sesuai dengan umpan balik pengguna, mempelajari kebiasaan pengguna, dan kemudian menyempurnakan model. ChatGPT saat ini menggunakan teknologi ini. Kemudian, tidak sulit bagi mesin untuk mempelajari kebiasaan berkendara pengemudi.
Mode bayangan Tesla adalah memberi makan data mengemudi pengemudi nyata ke pembelajaran mesin. Tujuan pelatihan algoritma dicapai dengan membandingkan perilaku pengemudi manusia.
Setelah GPT memulai babak baru ledakan AI, dampak kognitif pada industri adalah dengan meningkatkan skala parameter model, jumlah data meningkat secara eksponensial, yang disebut model besar.Setelah mencapai titik kritis tertentu , Model tiba-tiba bisa menjadi pintar.
Sebelumnya, data yang dibutuhkan oleh model selama fase pelatihan diberi label secara manual. Mengambil mengemudi otonom sebagai contoh, pemberi label data menggunakan sejumlah besar gambar untuk memberi label dan memberi tahu mesin apa itu kucing, apa itu anjing, dan berapa banyak jenis kucing dan anjing yang ada. Anotator itu seperti guru mesin, mengajarkannya untuk memahami dunia berulang kali.
Masalahnya, apa yang guru tidak ajarkan, mesin tetap tidak bisa. Contoh tipikal adalah Tesla sering mengalami kecelakaan autopilot, dan kendaraan tersebut menabrak truk besar yang terbalik karena mesin tidak dapat mengenalinya.
He Yuhua, mitra pendiri Hegao Capital, memberikan contoh seperti itu kepada Shentu: Guangzhou sering mengalami musim hujan, dan di beberapa adegan dengan cahaya redup, akan ada banyak serangga terbang di udara. Saat sebuah mobil lewat, lampunya menyala, dan mungkin ada ribuan serangga terbang yang menabrak bagian depan mobil. Dalam hal ini, sistem persepsi mengemudi otonom mobil mungkin salah mengartikannya sebagai dinding.
Sistem penggerak otomatis tidak dapat menghabiskan semua kasus sudut (skenario ekstrem), yang merupakan kesulitan utama dalam pengembangannya.
Apa yang diambil ChatGPT adalah data yang tidak ditandai dari seluruh jaringan. Dalam pembelajaran yang diawasi sendiri, data itu sendiri digunakan sebagai sinyal pengawasan, daripada mengandalkan label yang diberi label oleh manusia. Suatu hari orang menemukan bahwa dalam proses mencerna data ini, model besar tiba-tiba memiliki kemampuan untuk menyimpulkan kasus lain dari satu contoh.
Jadi, jika model mengemudi otonom yang besar juga dapat mempelajari perilaku mengemudi manusia tanpa pengawasan, tanpa perlu "guru" untuk mengajarkannya, apakah itu berarti sistem tersebut tiba-tiba berubah menjadi "pengemudi lama"?
GPT "mengemudi", tidak dapat diandalkan
Mimpi itu indah, dan jalan untuk mewujudkannya selalu sangat tipis.
Agar model AI yang mirip dengan ChatGPT mengerahkan kekuatannya di bidang mengemudi otonom, setidaknya masalah berikut perlu diselesaikan saat ini.
Yang pertama adalah sumber data.
Sumber data ChatGPT sangat kaya, termasuk Wikipedia, buku, artikel berita, jurnal ilmiah, dll., Yang setara dengan data publik seluruh jaringan sebagai makanannya.
Mengemudi otonom berbeda. Data mengemudi pengemudi dan data mengemudi kendaraan tidak diungkapkan, dan banyak di antaranya melibatkan privasi. Produsen mobil dan perusahaan self-driving beroperasi secara independen, dan datanya tertutup dan tidak diedarkan, sehingga sulit untuk mendapatkan data. Tanpa data, mengemudi secara otonom adalah air tanpa sumber.
He Zhiqiang, presiden Lenovo Venture Capital, mengatakan kepada Shentu bahwa inti dari mengemudi otonom adalah memiliki data, dan data sangat penting untuk model pelatihan. OEM seperti BYD memiliki data, tetapi algoritme mereka masih perlu disempurnakan Pabrikan mobil baru seperti "Wei Xiaoli" bagus dalam algoritme, tetapi penjualan mobil mereka tidak cukup. Perusahaan dengan data dan algoritme dapat memanfaatkan sepenuhnya model besar.
Yang kedua adalah bahwa metode penerapan komputasi sistem terbatas.
Yu Kai percaya bahwa OpenAI dan ChatGPT melakukan komputasi di cloud, yang memiliki suplai energi yang cukup, suplai daya, dan sistem yang sangat baik, tetapi jika mobil mengandalkan baterai dan pembuangan panas mobil, maka ini Tantangannya besar , artinya pengendaraan otomatis tidak bisa menggunakan model sebesar itu dan perhitungan sebesar itu.
Konsumsi daya komputasi oleh model besar telah menyebabkan produsen cloud computing menjadi pemain pertama yang menikmati dividen dalam gelombang ledakan AI ini. Pengembangan komputasi awan perusahaan besar juga membuka jalan bagi model besar. Tapi di ujung mobil, ini akan menjadi kontradiksi.
Masalah yang lebih besar adalah keandalan model besar belum diverifikasi.
Orang yang pernah menggunakan ChatGPT tahu bahwa ChatGPT terkadang berbicara omong kosong, terkadang benar dan terkadang salah. Ini dikenal di industri sebagai kecenderungan halusinasi, kecenderungan untuk menghasilkan konten tidak nyata yang tidak memiliki sumber sama sekali. Model-model besar mengada-ada tanpa mempedulikan kebenaran dan keakuratannya.
Mengobrol bisa jadi omong kosong, tetapi mengemudi otomatis tidak bisa. Hasil dari output yang salah bisa berakibat fatal.
"ChatGPT telah membuat kemajuan besar, tetapi mengemudi otomatis belum datang, karena mengemudi otomatis, terutama mengemudi tanpa awak, mungkin memiliki tingkat toleransi kesalahan nol, yang merupakan masalah kehidupan manusia," kata Yu Kai.
Long Zhiyong, yang pernah menjabat sebagai COO sebuah perusahaan rintisan AI di Silicon Valley, percaya bahwa hal yang tidak dapat dikendalikan, tidak dapat diprediksi, dan tidak dapat diandalkan adalah ancaman terbesar bagi komersialisasi model besar. Manifestasi khasnya adalah model besar cenderung berhalusinasi.
Sekarang, tidak realistis bagi sistem penggerak otomatis untuk belajar memilih dan membedakan, dan menghasilkan solusi optimal secara stabil.
Orang dalam perusahaan kecerdasan buatan mengatakan kepada Shentu: "Memang ada banyak terobosan dalam persepsi visual di tingkat algoritme. Tapi adegan mobil terlalu menuntut. Saya pribadi tidak berpikir akan ada terobosan besar dalam jangka pendek. . Kamu bisa memperhatikan gerakan spesial Sla."
Namun, baru-baru ini ada kecenderungan di kalangan teknologi bahwa perusahaan besar dan kecil ingin melihat hot spot GPT. Beberapa pabrikan mobil telah mengumumkan akan menerapkan teknologi mirip GPT, dan segudang konsep keren membuat orang bingung.
Misalnya, perusahaan penggerak otonom di bawah perusahaan mobil tradisional telah merilis model generatif besar untuk penggerak otonom, yang disebut "yang pertama di industri" yang menggunakan model ini untuk melatih mengemudi otonom.
Seorang investor yang telah lama memperhatikan jalur mobil pintar bertanya kepada pemimpin industri apa pendapatnya tentang model tersebut, dan pihak lain menjawab dengan empat kata: "Omong kosong TM."
"Itu hanya tindakan PR." Investor mengomentari Shentu.
Mengemudi otonom, apakah akan digulingkan dan dimulai kembali?
Didorong oleh Tesla, ditambah dengan gelombang AI yang muncul tahun ini, industri penggerak otonom secara bertahap mendekati arah model besar, daya komputasi besar, dan data besar.
Dampak model besar pada mengemudi otonom belum cukup drastis, tetapi orang dengan indra penciuman yang tajam telah menunjukkan ambivalensi.
Sama seperti ketika Tesla menggunakan Transformer untuk mengonversi data multi-kamera dari ruang gambar ke ruang BEV, Tesla tidak ragu untuk menggulingkan arsitektur asli dan menulis ulang algoritme. Penerapan model besar sekarang juga dapat berarti bahwa algoritme mengemudi otomatis asli akan digulingkan dan dimulai kembali.
He Zhiqiang percaya bahwa model besar akan berdampak besar pada pengemudian otonom. Di masa lalu, banyak model kecil digunakan untuk mengemudi secara otonom, tetapi sekarang telah menjadi model besar, dan mungkin perlu dilakukan lagi. Industri mengemudi otonom akan dirombak.
Zhao Dongxiang, direktur mengemudi otonom di perusahaan chip AI, mengatakan kepada Shentu bahwa perubahan ujung ke ujung secara keseluruhan sama saja dengan melakukannya lagi.
Mengocok adalah peluang bagi pendatang baru dan ancaman bagi para pemimpin. Kisah menyalip di tikungan sering terjadi di masa perubahan teknologi yang cepat. Di era teknologi yang cepat, semakin banyak investasi di jalur lama, semakin besar biaya hangus, dan semakin sulit untuk berbalik arah. Untuk OEM atau perusahaan penggerak otonom, untuk merangkul teknologi baru, tidak hanya efeknya tetapi juga biayanya harus dipertimbangkan.
Zhao Dongxiang berkata bahwa sejauh menyangkut tahap saat ini, tidak ada artinya mengubah rute teknis mengemudi otomatis. "Sekarang kemampuan teknis industri tidak buruk. Setiap orang telah menghabiskan begitu banyak uang untuk waktu yang lama. Jika tidak ada yang substansial perbaikan, tidak ada motivasi untuk berubah."
Pada AI DAY akhir tahun lalu, Tesla meningkatkan BEV menjadi jaringan hunian (occupancy network), dan kemampuan generalisasi semakin ditingkatkan. Dengan menempati jaringan, sistem persepsi autopilot Tesla dapat menilai apakah ia perlu menghindarinya tanpa mengetahui objek apa yang dilihatnya, sehingga menyelesaikan lebih banyak masalah ekor panjang.
Apa pun jenis rute teknisnya, sekarang sedang mengalami perubahan dan iterasi yang cepat. Model kecil di masa lalu mungkin akan digantikan oleh model besar, dan model besar saat ini mungkin juga akan digantikan oleh beberapa spesies baru di masa mendatang.
Namun bagaimanapun juga, praktik menggosok hot spot dan membuat tipu muslihat tidak kondusif bagi kemajuan teknologi. "Merupakan kebiasaan buruk untuk mengikuti panas, dan berguna untuk membuat produk dengan cara yang membumi," kata Zhao Dongxiang.
"Bom raja" yang sebenarnya dari mengemudi otonom masih jauh dari datang. Yang perlu kita lakukan adalah tetap kagum pada setiap putaran perubahan teknologi. GPT mitos tidak dapat membuat mobil impian Anda, tetapi setidaknya, perubahan telah terjadi.