"Loading..."
logo

Korpus adalah kumpulan kata dalam teks yang diolah secara elektronik untuk mengetahui penggunaan bahasa di suatu masyarakat. Korpus Indonesia (Koin) memuat teks-teks berbahasa Indonesia dari berbagai bidang dan jenis. Data Koin berasal dari berbagai sumber tulis dan lisan, seperti artikel ilmiah yang dipublikasikan pada jurnal nasional terakreditasi dari beberapa universitas terkemuka di Indonesia, artikel media massa, teks sastra, baik klasik maupun modern, serta dokumen resmi dan perundang-undangan. Data ini akan terus dikembangkan hingga mencakup penggunaan bahasa Indonesia di berbagai ranah kehidupan dan menjadi sumber data kebahasaan yang komprehensif. Koin akan menjadi korpus umum atau korpus monitor bahasa Indonesia yang dapat dimanfaatkan untuk penelitian bahasa, penyusunan kamus, pemelajaran bahasa, dan sebagainya.

Perincian Data Berdasarkan Pemutakhiran
Oktober 2023:

logo
Berkas Baru
Text : 1,005
Lisan : 1,700
logo
Token Baru
Text : 3,670,033
Lisan : 1,476,872
logo
Jumlah Berkas Dalam Korpus
Text : 22,352
Lisan : 1,700
logo
Jumlah Token Dalam Korpus
Text : 28,406,567
Lisan : 1,476,872

TIM REDAKSI 2022

Pengarah: E. Aminudin Aziz (Kepala Badan Pengembangan dan Pembinaan Bahasa)

Penanggung Jawab: Imam Budi Utomo (Kepala Pusat Pengembangan dan Pelindungan Bahasa dan Sastra)

Pemimpin Redaksi: Adi Budiwiyanto (Koordinator KKLP Perkamusan dan Peristilahan)

Pengembang Pangkalan Data: Dewi Puspita, Amat Triatna, Toni Gunawan

Pengembang Aplikasi: Insan Kamil, Marcelino Endrico Dengah, Ari Ferdianto

logo