Model bahasa besar (LLM) semakin populer di dunia akademis dan industri karena kinerjanya yang belum pernah ada sebelumnya dalam berbagai aplikasi. Karena LLM terus memainkan peran penting dalam penelitian dan penggunaan sehari-hari, evaluasinya menjadi semakin penting, tidak hanya di tingkat tugas tetapi juga di tingkat masyarakat, untuk lebih memahami potensi risikonya. Selama beberapa tahun terakhir, berbagai upaya signifikan telah dilakukan untuk meneliti LLM dari berbagai perspektif.

Pada Global IndiaAI Summit 2024, yang diselenggarakan di Bharat Mandapam, New Delhi, diadakan sesi dengan topik “IndiaAI: Large Language Models”. Amitabh Nag, CEO Bhashini, menjadi moderator sesi tersebut. Srinivas Narayanan, Wakil Presiden Open AI, menyampaikan pidato utama selama sesi tersebut. Panelis lain dalam sesi tersebut meliputi, Prof. Ganesh Ramakrishnan, IIT Bombay; Shalini Kapoor, Kepala Teknologi APJ, AWS; Dr. Mohit Sewak, Peneliti AI dan Hubungan Pengembang, Asia Selatan, NVIDIA; Dr. Pratyush Kumar, Co-founder, Sarvam AI dan Dr. Kalika Bali, Peneliti Utama, Microsoft.

Sesi dimulai dengan moderator yang memperkenalkan Misi IndiaAI dan Pusat Inovasi INDIAai. “Revolusi AI merupakan inovasi utama setelah Revolusi Industri,” kata Nag saat perkenalan.

Saat menyampaikan pidato utama, Srinivas Narayan berbicara tentang posisi kita saat ini dalam LLM dan berbagai kemungkinan LLM. “LLM adalah cara paling alami untuk berinteraksi dengan teknologi, dan ini terjadi untuk pertama kalinya”, katanya. Ia juga berbicara tentang tantangan yang ditimbulkan oleh keberagaman bahasa di India dan pentingnya keselamatan saat mengembangkan LLM. Sebagai manusia, menyediakan keahlian dengan skala besar adalah salah satu masalah penting yang kita hadapi. AI dapat membantu manusia dalam mengatasi masalah ini dan menjadi lebih produktif.

Mengembangkan LLM di India

AI adalah teknologi baru. Proses pengembangannya masih berlangsung dan masih jauh dari kata selesai. India, sebagai sebuah negara, seharusnya lebih optimis. “LLM sedikit lebih maju”, kata Dr. Pratyush Kumar, berbicara tentang pengembangan LLM di India. Ia berpendapat bahwa India perlu membuka sumber proses pengembangan sambil mempertimbangkan budaya dan bahasa. Meskipun banyak entitas menyatakan biaya produksi sebagai tantangan signifikan dalam proses tersebut, menurut Pratyush Kumar, biaya pengembangan menurun dengan cepat karena komputasi menjadi semakin efisien. Ini adalah tren yang menguntungkan untuk menciptakan LLM di negara ini.

Ketersediaan dan pengelolaan data merupakan tantangan penting yang dihadapi para insinyur India. Shalini Kapoor menyatakan bahwa penggunaan model AI akan meningkatkan pembuatan data. Ia menekankan perlunya LLM khusus domain yang dapat memecahkan masalah khusus domain. Misalnya, model AI yang dibuat khusus untuk perawatan kesehatan mungkin lebih baik daripada model generik.

Kolaborasi pemangku kepentingan penting untuk pengembangan model AI. Keberhasilan BharatGPT sangat didukung oleh “kemitraan publik-swasta”. “Kolaborasi antara industri dan akademisi merupakan suatu keharusan untuk mengembangkan model AI yang masif”, kata Prof. Ganesh Ramakrishnan, berbicara tentang pentingnya kolaborasi pemangku kepentingan.

Menghormati budaya India

Menurut Dr. Kalika Bali, LLM saat ini memiliki pandangan orang luar terhadap budaya India. Untuk mengembangkan model yang berpusat pada India, sudut pandang orang dalam sangatlah penting. Lebih jauh, tidak ada definisi bias yang disepakati. “Kita tidak akan pernah bisa memiliki sistem yang bebas bias; sistem akan menjadi rumit jika kita memiliki banyak bahasa. Ketika berbicara tentang pengumpulan data, kita harus peka terhadap hal itu,” katanya.

India adalah negara dengan keragaman bahasa yang besar. “Setiap model yang dibutuhkan untuk menangani bahasa apa pun harus memiliki kosakata tokeniser sebanyak 2 lakhs 54 ribu”, kata Dr. Mohit Sewak. Ia menyarankan negara tersebut untuk memiliki lebih banyak model multimoda guna memenuhi kebutuhan percakapan negara tersebut. “Jika kita menginginkan LLM India yang sesungguhnya, kita memerlukan tokeniser dengan puluhan dan triliunan data”, tambahnya.

Lebih jauh lagi, dominasi perusahaan Barat atas perusahaan rintisan India juga berpusat pada tantangan bahasa India. Melatih model India dengan bahasa India membutuhkan investasi finansial yang lebih besar daripada melatih model asing.

Dr Kalika Bali mengatakan bahwa untuk membawa keahlian Pribumi ke dalam LLM, kita memerlukan kumpulan data khusus. “Model besar mungkin bukan solusi yang tepat; sebaliknya, menciptakan federasi model dan melakukan orkestrasi di sekitarnya mungkin merupakan jalan ke depan,” tambahnya.

Mengatasi tantangan

Untuk mengatasi tantangan variasi dialek, Prof. Ganesh menyarankan dokumentasi dialek, pembelajaran terfederasi, berbagi data di antara para pemangku kepentingan, dan menghormati inklusivitas. Karena populasi negara yang sangat besar, India memiliki kapasitas untuk menjadi ibu kota kasus penggunaan di dunia. Nilai bisnis yang diperoleh dari model tersebut akan menentukan banyaknya penggunaan AI itu sendiri.



Sumber