Jika Anda mendengarkan Google I/O, Pembaruan Musim Semi OpenAIatau Microsoft Membangun bulan ini, Anda mungkin mendengar istilah agen AI cukup banyak muncul dalam sebulan terakhir. Mereka dengan cepat menjadi hal besar berikutnya di bidang teknologi, tapi apa sebenarnya mereka? Dan mengapa semua orang tiba-tiba membicarakannya?

CEO Google Sundar Pichai menggambarkan sistem kecerdasan buatan yang bisa mengembalikan sepasang sepatu atas nama Anda saat di atas panggung di Google I/O. Di Microsoft, perusahaan mengumumkan sistem Copilot AI yang dapat bertindak secara mandiri seperti karyawan virtual. Sementara itu, OpenAI meluncurkan sistem AI, GPT-4 Omni, yang dapat melihat, mendengar, dan berbicara. Sebelumnya, CEO OpenAI Sam Altman mengatakan kepada MIT Technology hal itu agen yang membantu memiliki potensi teknologi terbaik. Jenis sistem ini adalah tolok ukur baru yang ingin dicapai oleh semua perusahaan AI, namun hal ini lebih mudah diucapkan daripada dilakukan.

Sederhananya, agen AI hanyalah model AI yang melakukan sesuatu secara mandiri. Ini seperti Jarvis dari Manusia BesiTar dari interstaller, atau HAL 9000 dari Pengembaraan Luar Angkasa. Mereka melangkah lebih jauh dari sekadar menciptakan respons seperti chatbot yang kita kenal – ada tindakan. Untuk memulainya, Google, Microsoft, dan OpenAI mencoba mengembangkan agen yang dapat menangani tindakan digital. Artinya, mereka mengajari agen AI untuk bekerja dengan berbagai API di komputer Anda. Idealnya, mereka dapat menekan tombol, mengambil keputusan, memantau saluran secara mandiri, dan mengirimkan permintaan.

“Saya setuju bahwa masa depan adalah agen,” kata pendiri dan CEO Echo AI Alexander Kvamme. Perusahaannya membangun agen AI yang menganalisis percakapan bisnis dengan pelanggan dan memberikan wawasan tentang cara meningkatkan pengalaman tersebut. “Industri sudah membicarakan hal ini selama bertahun-tahun dan hal itu belum terwujud. Ini hanya masalah yang sulit.”

Kvamme mengatakan sistem yang benar-benar agenik perlu membuat lusinan atau ratusan keputusan secara independen, dan hal ini sulit untuk diotomatisasi. Misalnya, untuk mengembalikan sepasang sepatu, seperti yang dijelaskan oleh Google Pichai, agen AI mungkin harus memindai email Anda untuk mencari tanda terima, mengambil nomor pesanan dan alamat Anda, mengisi formulir pengembalian, dan melakukan berbagai tindakan atas nama Anda. Ada banyak keputusan dalam proses itu yang bahkan tidak Anda pikirkan, namun secara tidak sadar Anda buat.

Seperti yang telah kita lihat, model bahasa besar (LLM) tidak sempurna bahkan dalam lingkungan terkendali. Hal favorit baru Altman adalah menelepon ChatGPT “sangat bodoh,” dan dia tidak sepenuhnya salah. Saat Anda meminta LLM untuk bekerja secara mandiri di internet terbuka, mereka rentan terhadap kesalahan. Namun hal itulah yang sedang dikerjakan oleh banyak startup, termasuk Echo AI, serta perusahaan besar seperti Google, OpenAI, dan Microsoft.

Jika Anda dapat membuat agen secara digital, tidak ada banyak hambatan untuk menciptakan agen yang juga dapat bekerja dengan dunia fisik. Anda hanya perlu memprogram tugas itu ke robot. Kemudian Anda benar-benar masuk ke dalam fiksi ilmiah, karena agen AI menawarkan potensi untuk menugaskan robot tugas seperti “menerima pesanan meja itu” atau “memasang semua sirap di atap ini.” Kita masih jauh dari tujuan tersebut, namun langkah pertama adalah mengajari agen AI untuk melakukan tugas-tugas digital sederhana.

Ada masalah yang sering dibicarakan dalam dunia agen AI: memastikan Anda tidak merancang agen untuk melakukan suatu tugas juga Sehat. Jika Anda membangun agen untuk mengembalikan sepatu, Anda harus memastikan agen tersebut tidak mengembalikan semua sepatu Anda, atau mungkin semua barang yang Anda punya tanda terimanya di kotak masuk Gmail Anda. Meskipun kedengarannya konyol, ada sekelompok kecil peneliti AI yang khawatir bahwa agen AI yang terlalu gigih dapat menimbulkan malapetaka bagi peradaban manusia. Saya kira ketika Anda membuat karya fiksi ilmiah, itu adalah kekhawatiran yang sah.

Di sisi lain ada orang-orang yang optimis, seperti Echo AI, yang percaya bahwa teknologi ini akan memberdayakan. Perbedaan dalam komunitas AI cukup mencolok, namun mereka yang optimis melihat efek yang membebaskan dari agen AI yang sebanding dengan komputer pribadi.

“Saya sangat yakin bahwa banyak pekerjaan yang akan diselesaikan (agen) adalah pekerjaan yang tidak ingin dilakukan oleh manusia,” kata Kvemme. “Dan ada nilai guna yang lebih tinggi atas waktu mereka dalam hidup. Tapi sekali lagi, mereka harus beradaptasi.”

Kasus penggunaan lain dari agen AI adalah mobil self-driving. Tesla dan Waymo saat ini menjadi yang terdepan dalam teknologi ini, di mana mobil menggunakan teknologi AI untuk menavigasi jalan-jalan kota dan jalan raya. Meskipun tergolong khusus, teknologi self-driving merupakan bidang yang cukup berkembang dalam agen AI, dimana kita sudah melihat AI beroperasi di dunia nyata.

Jadi, apa yang akan membawa kita ke masa depan di mana AI dapat mengembalikan sepatu Anda? Pertama, model AI yang mendasarinya mungkin harus menjadi lebih baik dan akurat. Artinya, pembaruan pada ChatGPT, Gemini, dan Copilot mungkin akan mendahului sistem agen yang berfungsi penuh. Chatbot AI masih harus melewati masa-masa besarnya masalah halusinasi, yang banyak peneliti tidak lihat jawabannya. Namun perlu juga adanya pembaruan pada sistem agen itu sendiri. Saat ini, penyimpanan GPT OpenAI merupakan upaya paling maksimal untuk mengembangkan jaringan agen, namun hal tersebut masih belum terlalu maju.

Meskipun agen AI tingkat lanjut belum ada, itulah tujuan banyak perusahaan AI besar dan kecil saat ini. Hal inilah yang mungkin membuat AI jauh lebih berguna dalam kehidupan kita sehari-hari. Meskipun kedengarannya seperti fiksi ilmiah, ada miliaran dolar yang dihabiskan untuk mewujudkan agen dalam hidup kita. Namun, hal ini merupakan sebuah harapan besar bagi perusahaan AI yang telah berjuang untuk membuat chatbots dapat menjawab pertanyaan-pertanyaan dasar dengan andal.

Sumber