NLP for Indonesian Languages

NLP for Indonesian Languages

Pada hari Kamis, 17 Oktober 2024, Fakultas Informatika Universitas Telkom menyelenggarakan kuliah umum dengan tema “How to Write a Good Research Proposal” dan informasi beasiswa dari Mohamed Bin Zayed University of Artificial Intelligence (MBZUAI). Acara ini dihadiri oleh sekitar 40 dosen dan mahasiswa dan dilaksanakan secara hybrid, bertempat di Ruang Multimedia Lt. 3 Gedung Tokong Nanas serta melalui platform Zoom. Kegiatan ini merupakan bagian dari kerjasama antara MBZUAI dan Telkom University.

Acara dibuka oleh Dr. Didit Adytia, S.Si., M.Si., selaku Wakil Dekan Fakultas Informatika. Dalam sambutannya, Dr. Didit menyampaikan pentingnya kolaborasi antara kedua institusi untuk meningkatkan kualitas pendidikan dan penelitian di bidang kecerdasan buatan.

Sesi pertama dimulai dengan pemaparan oleh Dr. Alham Fikri Aji, Assistant Professor di MBZUAI. Dr. Alham menjelaskan tentang teknologi pemrosesan bahasa alami (Natural Language Processing/NLP), khususnya Model Bahasa Besar (Large Language Model/LLM). Ia memperkenalkan dua model terkenal, yakni ChatGPT dari OpenAI dan Gemini dari Google, serta membahas LLM yang dilatih untuk beroperasi dalam berbagai bahasa. Dengan pelatihan pada dataset masif, LLM multilanguage mampu mengelola komunikasi lintas bahasa tanpa perlu penerjemahan awal ke bahasa Inggris.

Menurut Dr. Alham, meski ada lebih dari 6.500 bahasa yang diwakili dalam pemrosesan bahasa alami, banyak bahasa yang tidak mendapatkan akses ke pelatihan LLM. Ini disebabkan oleh dominasi bahasa Inggris dalam pengembangan model, yang mengarah pada kesenjangan bahasa digital. Situasi ini menimbulkan apa yang disebut Dataset Bottleneck, di mana ketersediaan data untuk bahasa non-Inggris terbatas, mempengaruhi efisiensi dan performa LLM.

Dr. Alham juga menyebutkan potensi penelitian dalam NLP berbahasa Indonesia yang masih terbuka lebar. Dalam konteks ini, ia menjadikan NLP berbahasa Indonesia sebagai salah satu testcase dalam penulisan proposal penelitian, menunjukkan bagaimana pendekatan ini dapat meningkatkan pemahaman dan pengembangan model bahasa yang lebih inklusif. Beberapa bidang yang bisa dieksplorasi termasuk pengumpulan data yang lebih efisien, pelatihan model spesifik, dan metode yang menangkap nuansa lokal dalam bahasa.

Sesi kedua dilanjutkan dengan presentasi oleh Jingjing Huang, Senior Student Recruitment & Admission Specialist dari MBZUAI. Huang memaparkan profil MBZUAI sebagai universitas penelitian pascasarjana pertama di dunia yang fokus pada kecerdasan buatan. Didirikan di Abu Dhabi, universitas ini menawarkan program gelar di bidang Visi Komputer, Pembelajaran Mesin, Pemrosesan Bahasa Alami, dan Robotika. Huang menekankan pencapaian MBZUAI yang telah diakui secara global sebagai salah satu dari 20 universitas terbaik di dunia untuk disiplin ilmu terkait AI.

MBZUAI juga memiliki program eksekutif yang sukses, menarik mahasiswa dari seluruh dunia, dan telah menempatkan lebih dari 90 mahasiswa dalam program magang di organisasi terkemuka. Dengan komunitas mahasiswa dari lebih dari 40 negara, MBZUAI menciptakan lingkungan belajar yang multikultural dan inklusif, serta menekankan pentingnya pelatihan praktis dan dukungan kewirausahaan bagi mahasiswa.

Acara ditutup dengan sesi tanya jawab, memberikan kesempatan bagi peserta untuk menggali lebih dalam mengenai penelitian dan peluang yang ditawarkan oleh MBZUAI. Kegiatan ini diharapkan dapat mendorong lebih banyak kolaborasi dan penelitian di bidang kecerdasan buatan antara kedua institusi.

Kontributor:
Faizal Riza