Wikipedia:WikiProjek Jawi/Panduan-tambah-korpus


Tujuan

Panduan ini bertujuan untuk memberi pandaun kepada para penyunting yang ingin menyumbang kepada penggunaan aksara Jawi sebagai paparan laternatif kepada aksara Rumi di Wikipedia bahasa Melayu.

Pengenalan ringkas

sunting

Skrip Jawi atau tulisan Jawi ialah skrip yang digunakan untuk menulis bahasa Melayu semenjak lebih kurang 700 tahun dahulu. 'Tulisan Jawi' bersinonim dengan bahasa Melayu akan tetapi penggunaannya dalam penulisan bahasa Melayu merudum selepas pertengahan abad ke-20, khususnya di Malaysia. Namun, ia masih penting dan banyak usaha sedang dilakukan untuk 'menghidupkan semula' penggunaan tulisan Jawi.

Wikipedia Bahasa Melayu amat sesuai dijadikan wahana buat memperkenalkan skrip Jawi di alam maya.

Projek ini bertujuan untuk membina korpus kamus Rumi-Jawi agar rencana-rencana yang terkandung dalam Wikipedia bahasa Melayu dapat dipaparkan denagn dua skrip, yakni skrip Rumi dan juga Jawi.

Wikipedia bahasa lain

sunting

Terdapat beberapa projek saudara bahasa-bahasa Wikipedia yang menggunakan dua skrip untuk paparan kandungan. Antaranya adalah Wikipedia Khazakh (kk.wikipedia.org) dan Wikipedia Bugis (bug.wikipedia.org). Wiki Khazakh menggunakan tiga skrip: Rumi, Cyrillic dan Arab; sementara Wiki Bugis menggunakan Rumi dan skrip Bugis secara bercampur-campur.

Wiki Khazakh menggunakan tiga laman berlainan untuk paparan, satu untuk setiap skrip. Wiki Bugis, sperti dikatakan terdahulu, mencampur-campurkan skrip pada satu laman.

Pendekatan Wiki BM

sunting

Wiki Bahasa Melayu menggunakan JavaScript untuk pengkomputan pengalihan skrip dengan dibantu satu kamus yang mengandungi kata-kata yang perlu dialihkan.

Skrip yang diilhamkan Kurniasan menggunakan kata dasar dari kamus dan jika perlu, akan menambah apitan mengikut teks Rumi.

Penyunting yang ingin membantu

sunting

Penyunting dapat membantu mengembangkan penggunaan Jawi dengan menambah kata-kata pada korpus kamus. Untuk melakukan ini, berikut peralatan yang perlu ada:

Penyunting teks

Alat yang paling sesuai untuk membina kamus ialah penyunting teks, walaupun pemproses kata (word processor) juga boleh digunakan. Penyunting teks yang bersesuaian untuk platform Windows termasuk 'Notepad' (ada pada Windows) atau, lebih baik, 'Notepad++' (boleh dimuat turun percuma).

Untuk Linux: Emacs, Vim atau Gedit.

Untuk OS X: Aquamacs atau Jedit.

Minat

Ingat, sedikit-sedikit, lama-lama menjadi bukit.

Paparan Jawi dan pembinaan korpus

sunting
Laman-laman yang berkaitan

Salin kamus kepada laman kamus anda sendiri. Anda tidak dapat menyunting laman-laman diatsa oleh sebab keperluan keselamatan. Jadi anda perlu salin kamus. Panduan bagaimana melakukannya terdapat pada laman-laman di atas.

Tugas utama ialah membina korpus kamus. Buat masa ini kamus mengandungi lebih kurang 500 kata yang dipadankan dengan Jawi.

Berikut cara yang digunakan untuk membina korpus:

  • Dapatkan kata. Sumber terbuka yang mengandungi banyak kata bahasa Melayu ialah ... Wikipedia! Justeru muat turun rencana dan simpan dalam format teks, bukan html.
Kalau anda ada pelayar teks seperti Lynx anda boleh taip:
lynx -dump -nomargins <url-rencana> untuk mendapatkan salinan teks sesuatu rencana.
  • Bersihkan teks. Teks perlu dibersihkan kerana kita tidak mahu kata yang berganda dalam korpus. 'Notepad++' mempunyai pemalam untuk memanipulasi teks dan juga untuk mengisih teks. Kalau tidak ada utiliti tersebut, anda boleh lakukan secara insani.
  • Padankan kata dengan ejaan Jawi. Untuk memudahkan kerja, setiap kata perlu ditulis pada barisnya sendiri. Ini akan memudahkan semakan dan juga kerja-kerja seperti pengisihan dan pertukaran teks oleh penyunting teks seperti 'Notepad++'.
Sumber-sumber semakan ejaan termasuk PRPM yang mengandungi perisian ejaan Jawi, laman 'ejawi.net' atau 'jawiware.org'.
  • Semak sebelum muat naik. Semak ejaan setiap kata yang mahu dimuat naik. Kamus ditulis dalam format JSON. Format ini amat mudah digunakan tetapi perlu rapi agar tidak tertinggal tanda-tanda yang penting sperti koma, tanda petikan dan sebagainya.
  • Muat naik kepada kamus di Wikipedia BM. Buka laman kamus dalam pelayar dan salin dan tampal daripada fail anda. Beri perhatian kepada notis-notis yang mungkin timbul dalam laman selepas anda memuat naik teks. Notis-notis akan muncul secara automatik sekiranya terdapat ralat dalam teks yang anda tampal.
  • Simpan suntingan dan singkirkan cache. Selepas ini anda dapat melihat hasil penat lelah anda terpapar dalam Wikipedia.

---

2014-06-13 17:34:30