Debu kini telah menempel di Google I/O 2024 keynote dan tidak diragukan lagi apa tema besarnya – Google Gemini dan alat AI baru sepenuhnya mendominasi pengumuman tersebut, memberikan kita gambaran sekilas tentang arah kehidupan digital kita. CEO Sundar Pichai benar ketika menggambarkan acara tersebut sebagai versi The Eras Tour – khususnya, “Era Gemini” – di posisi paling atas.
Berbeda dengan tahun-tahun sebelumnya, keseluruhan keynote membahas tentang Gemini dan AI; nyatanya, Google kata yang terakhir sebanyak 121 kali. Dari peluncuran asisten AI futuristik yang disebut “Project Astra” yang dapat dijalankan di ponsel – dan mungkin kacamata pintar, suatu hari nanti – hingga Gemini yang dimasukkan ke dalam hampir setiap layanan atau produk yang ditawarkan perusahaan, kecerdasan buatan jelas merupakan tema yang dominan.
Pembicaraan berdurasi dua jam tersebut sudah cukup untuk meluluhkan pikiran semua orang kecuali para penggemar LLM yang paling bersemangat, jadi kami telah menguraikan 7 hal terpenting yang diumumkan Google selama keynote utamanya I/O 2024 – dan menyertakan berita terbaru tentang kapan kita sebenarnya mungkin melihat alat-alat baru ini…
1. Google menghentikan Project Astra – sebuah “agen AI” untuk kehidupan sehari-hari
Jadi ternyata Google memang punya jawabannya GPT-4o OpenAI Dan Microsoft‘s CoPilot. Proyek Astrayang dijuluki sebagai “agen AI” untuk kehidupan sehari-hari, pada dasarnya adalah Lensa Google menggunakan steroid dan terlihat sangat mengesankan, mampu memahami, bernalar, dan merespons video dan audio langsung.
Didemokan di ponsel Pixel dalam rekaman video, pengguna terlihat berjalan di sekitar kantor, memberikan siaran langsung dari kamera belakang dan langsung mengajukan pertanyaan kepada Astra. Gemini melihat dan memahami visual sambil menjawab pertanyaan.
Ini mencerminkan multi-modal dan konteks panjang di backend Gemini, yang bekerja dalam sekejap untuk mengidentifikasi dan memberikan respons dengan cepat. Dalam demonstrasi tersebut, ia mengetahui bagian tertentu dari seorang pembicara dan bahkan dapat mengidentifikasi lingkungan di London. Ini juga generatif karena dengan cepat menciptakan nama band untuk anak anjing lucu di samping boneka binatang (lihat video di atas).
Ini tidak akan segera diluncurkan, tetapi pengembang dan pers seperti kami di TechRadar akan mencobanya di I/O 2024. Dan meskipun Google tidak mengklarifikasi, ada teaser kacamata untuk Astra, yang mungkin berarti Google Glass bisa kembali lagi.
Namun, bahkan sebagai demo selama Google I/O, ini sangat mengesankan dan berpotensi sangat menarik. Ini dapat meningkatkan kekuatan ponsel cerdas dan asisten yang saat ini kami miliki dari Google dan bahkan apel. Selain itu, hal ini juga menunjukkan ambisi AI Google yang sebenarnya, sebuah alat yang bisa sangat membantu dan tidak merepotkan sama sekali untuk digunakan.
- Kapan peluncurannya? Tidak diketahui saat ini – Google menggambarkannya sebagai “visi kami untuk masa depan asisten AI”
2. Google Foto mendapat peningkatan AI yang bermanfaat dari Gemini
Pernah ingin dengan cepat menemukan foto tertentu yang Anda ambil pada suatu saat di masa lalu? Mungkin itu surat dari orang yang dicintai, foto awal seekor anjing saat masih kecil, atau bahkan plat nomor Anda. Nah, Google mewujudkan keinginan itu dengan pembaruan besar Foto Google yang menggabungkannya dengan Gemini. Ini memberinya akses ke perpustakaan Anda, memungkinkannya mencarinya, dan dengan mudah memberikan hasil yang Anda cari.
Dalam demo di atas panggung, Sundar Pichai mengungkapkan bahwa Anda dapat meminta pelat nomor Anda, dan Foto akan mengirimkan gambar yang menunjukkan pelat tersebut dan angka/karakter yang membentuk pelat Anda. Demikian pula, Anda dapat meminta foto saat anak Anda belajar berenang dan hal-hal lain yang lebih spesifik. Ini akan membuat perpustakaan foto yang paling tidak terorganisir sekalipun menjadi lebih mudah untuk dicari.
Google menjuluki fitur ini “Tanya Foto” dan akan meluncurkannya ke semua pengguna dalam “minggu-minggu mendatang”. Dan itu hampir pasti akan berguna, dan membuat orang-orang yang tidak menggunakannya Foto Google sedikit cemburu.
3. Pekerjaan rumah anak Anda jadi lebih mudah berkat NotebookLM
Semua orang tua pasti tahu betapa mengerikannya mencoba membantu anak mengerjakan pekerjaan rumah; jika Anda pernah mengetahui hal ini di masa lalu, tidak mungkin pengetahuan tersebut masih tersembunyi di otak Anda 20 tahun kemudian. Namun Google mungkin telah membuat tugas tersebut jauh lebih mudah, berkat peningkatan pada aplikasi pencatatan NotebookLM-nya.
NotebookLM kini memiliki akses ke Gemini 1.5 Pro, dan berdasarkan demo yang diberikan pada I/O 2024, NotebookLM kini akan menjadi pengajar yang lebih baik dari sebelumnya. Demo tersebut menunjukkan Josh Woodward dari Google sedang memuat buku catatan yang berisi catatan tentang topik pembelajaran – dalam hal ini, sains. Dengan menekan satu tombol, dia dapat membuat panduan pembelajaran terperinci, dengan keluaran lebih lanjut termasuk kuis dan FAQ, semuanya diambil dari materi sumber.
Mengesankan – tetapi akan menjadi jauh lebih baik. Sebuah fitur baru – yang masih berupa prototipe untuk saat ini – mampu menampilkan semua konten sebagai audio, yang pada dasarnya menciptakan diskusi bergaya podcast. Terlebih lagi, audio tersebut menampilkan lebih dari satu pembicara, mengobrol tentang topik tersebut secara alami dengan cara yang pasti akan lebih membantu daripada orang tua yang frustrasi yang mencoba berperan sebagai guru.
Woodward bahkan dapat menyela dan mengajukan pertanyaan, dalam hal ini “beri kami contoh bola basket” – yang kemudian AI mengubah taktik dan menghasilkan metafora cerdas untuk topik tersebut, namun dalam konteks yang dapat diakses. Para orang tua di tim TechRadar sangat ingin mencoba yang satu ini.
- Kapan peluncurannya? Tidak diketahui saat ini
4. Anda akan segera dapat mencari video di Google
Dalam demo aneh di atas panggung dengan pemutar rekaman, Google memamerkan trik pencarian baru yang sangat mengesankan. Anda sekarang dapat merekam video, dan mencarinya untuk mendapatkan hasil, dan semoga mendapat jawaban.
Dalam hal ini, Googler-lah yang bertanya-tanya bagaimana cara menggunakan pemutar rekaman; dia mencapai rekor untuk memfilmkan unit tersebut sambil menanyakan sesuatu dan kemudian mengirimkannya. Google melakukan keajaiban pencariannya dan memberikan jawaban dalam bentuk teks, yang dapat dibacakan. Ini cara yang benar-benar baru untuk menelusuri Lensa Google untuk video, dan juga sangat berbeda dari AI sehari-hari Project Astra yang akan datang, karena AI ini perlu direkam dan kemudian dicari dibandingkan bekerja secara real-time.
Namun, ini adalah bagian dari perpaduan Gemini dan AI generatif dengan Google Penelusuran, yang bertujuan agar Anda tetap berada di halaman tersebut dan mempermudah mendapatkan jawaban. Sebelum demo penelusuran dengan video ini, Google memamerkan pengalaman generatif baru untuk resep dan santapan. Ini memungkinkan Anda mencari sesuatu dalam bahasa alami dan mendapatkan resep atau bahkan rekomendasi restoran di halaman hasil.
Sederhananya, Google berupaya sekuat tenaga dengan AI generatif dalam penelusuran, baik untuk hasil maupun berbagai cara untuk mendapatkan hasil.
- Kapan peluncurannya? Google mengatakan bahwa “penelusuran dengan video akan segera tersedia untuk pengguna Search Labs dalam bahasa Inggris di AS” dan akan “meluas ke lebih banyak wilayah seiring waktu”
Kami telah mengagumi kreasi OpenAIalat teks-ke-video Sora selama beberapa bulan terakhir, dan sekarang Google melakukannya bergabung dengan pesta video generatif dengan alat barunya yang disebut Veo. Seperti Sora, Veo dapat menghasilkan video berdurasi satu menit dalam kualitas 1080p, semuanya hanya dengan perintah sederhana.
Perintah tersebut dapat mencakup efek sinematik, seperti permintaan untuk pengambilan gambar selang waktu atau udara, dan sampel awal terlihat mengesankan. Anda juga tidak harus memulai dari awal – unggah video masukan dengan perintah, dan Veo dapat mengedit klip agar sesuai dengan permintaan Anda. Ada juga opsi untuk menambahkan topeng dan mengubah bagian tertentu dari video juga.
Berita buruknya? Seperti Sora, Veo belum tersedia secara luas. Google mengatakan fitur ini akan tersedia bagi pembuat konten tertentu melalui VideoFX, salah satu fitur Labs eksperimentalnya, “dalam beberapa minggu mendatang.” Mungkin perlu waktu lama hingga kita bisa melihat peluncurannya secara luas, namun Google telah berjanji untuk menghadirkan fitur tersebut Youtube Celana pendek dan aplikasi lainnya. Dan itu akan terjadi Adobe bergeser dengan gelisah di kursi yang dihasilkan AI.
- Kapan peluncurannya? Sekarang kamu bisa bergabunglah dengan daftar tunggu Veo, dengan Google menyatakan bahwa itu akan “tersedia untuk pembuat konten tertentu dalam pratinjau pribadi di VideoFX”. Google juga mengatakan bahwa “di masa depan, kami juga akan menghadirkan beberapa kemampuan Veo ke YouTube Shorts” dan produk lainnya
6. Android mendapat infus Gemini yang besar
Sama seperti fitur “Lingkaran untuk Menelusuri” Google yang ada di atas aplikasi, Gemini kini diintegrasikan ke dalam inti Android untuk berintegrasi dengan aliran Anda. Seperti yang ditunjukkan, Gemini kini dapat melihat, membaca, dan memahami apa yang ada di layar ponsel Anda, sehingga dapat mengantisipasi pertanyaan tentang apa pun yang Anda lihat.
Sehingga dapat mengetahui konteks video yang Anda tonton, mengantisipasi permintaan ringkasan saat melihat PDF yang panjang, atau siap menghadapi berbagai pertanyaan tentang aplikasi yang Anda gunakan. Memiliki AI yang peka terhadap konten yang dimasukkan ke dalam OS ponsel bukanlah hal yang baik. Ini bukanlah hal yang buruk dan terbukti sangat berguna.
Selain Gemini yang terintegrasi pada tingkat sistem, Gemini Nano dengan Multimodality akan diluncurkan akhir tahun ini pada perangkat Pixel. Apa yang akan diaktifkannya? Ya, ini seharusnya mempercepat, tetapi fitur penting untuk saat ini adalah Gemini yang mendengarkan panggilan dan dapat memberi tahu Anda secara real-time jika itu spam. Itu cukup keren dan didasarkan pada penyaringan panggilan, fitur lama ponsel Pixel. Ini siap untuk menjadi lebih cepat dan memproses lebih banyak di perangkat daripada mengirimkannya ke cloud.
- Kapan peluncurannya? Google mengatakan bahwa ‘Gemini Nano dengan Multimodalitas’ akan tersedia “di Pixel akhir tahun ini”. Peningkatan Circle to Search dan fitur penipuan bank baru untuk panggilan telepon juga akan hadir “akhir tahun ini”
7. Google Workspace akan menjadi lebih pintar
Pengguna ruang kerja adalah mendapatkan harta karun berupa integrasi Gemini dan fitur-fitur bermanfaat yang bisa memberikan dampak besar setiap hari. Di dalam Mail, berkat panel samping baru di sebelah kiri, Anda dapat meminta Gemini untuk merangkum semua percakapan terbaru dengan seorang kolega. Hasilnya kemudian dirangkum dengan poin-poin yang menyoroti aspek-aspek terpenting.
Gemini di Google Meet dapat memberi Anda hal-hal penting dari sebuah rapat atau apa yang mungkin ditanyakan oleh orang lain dalam panggilan tersebut. Anda tidak perlu lagi membuat catatan selama panggilan berlangsung, yang mungkin berguna jika panggilan berlangsung lama. Dalam Google Spreadsheet, Gemini dapat membantu memahami data dan memproses permintaan seperti menarik jumlah atau kumpulan data tertentu.
Rekan setim virtual “Chip” mungkin merupakan contoh paling futuristik. Itu bisa hidup di G-chat dan dipanggil untuk berbagai tugas atau pertanyaan. Meskipun alat-alat ini akan hadir di Workspace, kemungkinan besar melalui Lab terlebih dahulu, pertanyaan selanjutnya adalah kapan alat-alat ini akan tersedia untuk pelanggan reguler Gmail dan Drive. Mengingat pendekatan Google terhadap AI untuk semua orang dan mendorongnya dengan keras dalam penelusuran, hal ini mungkin hanya masalah waktu saja.
- Kapan peluncurannya? Panel samping Gemini di Gmail, Dokumen, Drive, Slide, dan Spreadsheet akan ditingkatkan ke Gemini 1.5 Pro “mulai hari ini” (14 Mei). Untuk aplikasi Gmail, fitur ‘ringkas email’ akan tersedia bagi pengguna Workspace Labs “bulan ini” (Mei) dan bagi pelanggan Gemini for Workspace serta pelanggan Google One AI Premium “bulan depan”