Kod Piawai Amerika untuk Pertukaran Maklumat atau juga dikenali dengan singkatan Inggerisnya ASCII ("American Standard Code for Information Interchange") adalah satu format yang lazim digunakan untuk fail teks dalam komputer dan internet. Kod ASCII telah dibangunkan oleh American National Standards Institute (ANSI).

Terdapat 95 kod ASCII yang boleh dicetak, yang dinomborkan dari 32 hingga 126.

Dalam fail yang menggunakan kod ASCII, setiap aksara (angka, abjad dan simbol khas) diwakili oleh sejumlah 7 bit nombor perduaan yang terdiri daripada rentetan tujuh '0' atau '1'. Ia melibatkan sejumlah 128 aksara biasa dengan tambahan 128 aksara lanjutan.


Saya telah mengesahkan cadangan yang telah diberikan oleh Setiausaha Kewangan berkenaan dengan piawaian yang perlu diwujudkan semasa merakam Kod Piawai untuk kegunaan Perkongsian maklumat di atas pita magnetik dan pita kertas semasa digunakan di atas komputer. Semua komputer atau peralatan yang mempunyai konfigurasi yang hampir serupa yang di bawa masuk ke dalam senarai peralatan kerajaan Federal pada dan selepas 1 Julai 1969 hendaklah mempunyai kemampuan untuk menggunakan Kod Piawai untuk kegunaan Perkongsian maklumat dan format piawai untuk pita magnetik dan pita kertas jika bahan ini akan digunakan.

— Lyndon B. Johnson, Memorandum Kelulusan pengambilan Kod Piawai oleh Kerajaan Federal bagi tujuan Perkongsian Maklumat pada 11 Marc 1968 di Gerhard Peters (ed.) Projek Presiden Amerika, [2]

Pengenalan

sunting

Seperti kod-kod komputer yang lain, ASCII memberikan rujukan yang spesifik kepada susunan bit digital dan juga glyph (contohnya simbol) untuk sebuah bahasa penulisan. Ini membolehkan peralatan digital berkomunikasi antara satu sama lain untuk memproses, menyimpan dan berkomunikasi menggunakan maklumat berdasarkan simbol.Proses "encode" Kod ASCII [1]- atau "compatible extension" - digunakan hampir di setiap komputer umum, terutama komputer peribadi dan pusat pekerjaan. Nama MIME yang digunakan untuk proses "encode" ini adalah "US-ASCII".".[2]


Walaupun pengecualian kepada beberapa Kod Kawalan ASCII yang menggunakan format berdasarkan barisan,ko ASCII tidak ditakrifkan di mana-mana mekanisma untuk takrifan kepada struktur atau penampilan sesebuah perkataan didalam sebuah dokumen. Skema lain seperti bahasa markup, alamat dan format dokumen.

Kod ASCII adalah kod tujuh bit, ini bermakna ia menggunakan susunan tujuh angka binari dari angka desimal 0 hingga 127 untuk mewakili setiap simbol. Sewaktu kod ASCII diperkenalkan, banyak komputer pasa masa itu menggunakan lapan-bit bait ( kumpulan bit, yang dikenali sebagai Oktet, sebagai unit terkecil untuk data. Di dalam kod ASCII tujuh-bit, bit ke-8 biasanya digunakan sebagai bit pariti untuk memeriksa jika terdapat sebarang kesalahan didalam talian komunikasi atau untuk fungsi peralatan yang lain. Mesin yang menggunakan pemeriksaan pariti biasanya akan menetapkan bit kelapan kepada 0.[3]


Institut Piawai Nasional Amerika ( the United States of America Standards Institute atau USASI) telah membangunakan kod ASCII merujuk kepada sistem enkod mesin telepencetak terdahulu. Di dalam linkungan tahun 1956an, Ivan Idelson di Ferranti di UK, telah memulakan penggunaan kod Cluff-Foster-Idelson diatas 7 pita kertas perentas untuk komuniti BSI. Kod ini telah menjadi kod ASCII. Kod ASCII sendiri telah buat pertama kalinya digunakan secara komersil pada tahun 1963 sebagai kod tujuh-bit untuk telepencetak yang digunakan oleh rangkaian American Telephone & Telegraph's TWX (Teletype Wide-area eXchange). TWX pada asalnya menggunakan kod lima-bitkod Baudot, yang juga digunakan oleh syarikat pencabar meraka iaitu sistem Telex telepencetak. Sistem Belll telah merancang untuk menaik taraf ke kod enam-bit sehubungan daripada projek Fieldata, yang telah memuatkan tanda kata nama dan juga huruf kecil ke dalam kod Baudot. Namun telah dipujuk untuk memasuki Pertubuhan Standard Amerika ( merupakan cabang dari Institut Standard Nasional Amerika ANSI) sebagai salah satu daripada rangkaian komiti yang telah memulakan pembangunan kod ASCII.[perlu rujukan]

Jika dibandingkan dengan kod telegraf terdahulu, seperti contoh kod Bell dan kod ASCII, kedua-duanya telah melalui susunan semua untuk kesesuaian penyusunan kod terutama dari segi abjab di dalam sebuah senarai. Selain itu, terdapat tambahan beberapa fungsi kepada peralatan lain selain telepencetak. Bob Bemer telah memperkenalkan fungsi baru seperti contoh aturan escape.[perlu rujukan] Rakannya Hugh McGregor Ross telah membantu untuk memperkenalkan hasilnya itu mengikut kata Bemer, "kod ASCII yang asal adalah dikenali sebagai kod Bemer-Ross di Eropah".[perlu rujukan]

Kod ASCII telah dikemaskini dari masa ke semasa dan telah dicetak sebagai USASI X3.4-1968, ANSI X3.4-1977, dan akhirnya ANSI X3.4-1986.

Pertubuhan-pertubuhan Piawai Antarabangsa yang lain telah memperkenalkan kod-kod lain seperti ISO 646, dimana kod ini mempunyai banyak persamaan dan hampir sama dengan kod ASCII, dengan penambahan untuk beberapa simbol yang digunakan oleh kawasan atau negara-negara tersebut di mana tidak terdapat di dalam abjab Inggeris, selain simbol-simbol matawang seperti contoh Matawang United Kingdom yang menggunakan Pound Sterling (£). Walaupun kod-kod ini kadangkalanya merujuk kepada ASCII, namun ASCII yang asli adalah mengikut piawaian ANSI.


Kod ASCII telah dimasukkan didalam penggantinya unikod sebagai simbol 128 dan kebawah.

Simbol kawalan ASCII

sunting

ASCII menyimpan 32 kod pertama (nombor 0-31 titik perpuluhan) untuk dijadikan sebagai Simbol kawalan: kod asal yang tidak membawa sebarang maklumat yang boleh dicetak, namun begitu selain untuk mengawal peralatan seperti mesin cetak yang menggunakan ASCII, atau untuk menyediakan maklumat-meta mengenai laluan data seperti yang tersimpan di atas pita magnetik. Sebagai contoh, simbol 10 membawa maksud fungsi "line feed" yang akan menyebabkan mesin cetak menggerakkan kertas ke hadapan dan simbol 8 adalah merujuk kepada "backspace".

lihat Seni ASCII

Dedua Okt Dek Heks Kep PTP TKK KLA}} Penerangan
000 0000 000 0 00 NUL ^@ \0 Null character
000 0001 001 1 01 SOH ^A Start of Header
000 0010 002 2 02 STX ^B Start of Text
000 0011 003 3 03 ETX ^C End of Text
000 0100 004 4 04 EOT ^D End of Transmission
000 0101 005 5 05 ENQ ^E Enquiry
000 0110 006 6 06 ACK ^F Acknowledgment
000 0111 007 7 07 BEL ^G \a Bell
000 1000 010 8 08 BS ^H \b Backspace[d][i]
000 1001 011 9 09 HT ^I \t Horizontal Tab
000 1010 012 10 0A LF ^J \n Line feed
000 1011 013 11 0B VT ^K \v Vertical Tab
000 1100 014 12 0C FF ^L \f Form feed
000 1101 015 13 0D CR ^M \r Carriage return[h]
000 1110 016 14 0E SO ^N Shift Out
000 1111 017 15 0F SI ^O Shift In
001 0000 020 16 10 DLE ^P Data Link Escape
001 0001 021 17 11 DC1 ^Q Device Control 1 (oft. XON)
001 0010 022 18 12 DC2 ^R Device Control 2
001 0011 023 19 13 DC3 ^S Device Control 3 (oft. XOFF)
001 0100 024 20 14 DC4 ^T Device Control 4
001 0101 025 21 15 NAK ^U Negative Acknowledgement
001 0110 026 22 16 SYN ^V Synchronous Idle
001 0111 027 23 17 ETB ^W End of Trans. Block
001 1000 030 24 18 CAN ^X Cancel
001 1001 031 25 19 EM ^Y End of Medium
001 1010 032 26 1A SUB ^Z Substitute
001 1011 033 27 1B ESC ^[ \e[f] Escape[g]
001 1100 034 28 1C FS ^\ File Separator
001 1101 035 29 1D GS ^] Group Separator
001 1110 036 30 1E RS ^^ Record Separator
001 1111 037 31 1F US ^_ Unit Separator
111 1111 177 127 7F DEL ^? Delete[e][i]


Kod ASCII yang asal hanya menggunakan kosakata diskripsi yang pendek untuk semua simbol kawalan. Kadangkala, keadaan ini dibiarkan dengan sengaja (di mana simbol akan digunakan dengan cara yang berlainan di atas sambungan terminal berbanding dengan saluran data) dan kadangkala menyebabkan lebih banyak ketidaksinambungan (sepertimana "padam" bermaksud).

Secara dasarnya, Teletype corporation model siri 33 merupakan peralatan yang telah memberikan pengaruh besar kepada interpretasi simbol-simbol ini. Peralatan ini merupakan sebuah terminal percetakan yang dilengkapi dengan teknologi pita kertas untuk menebuk lubang dan mentafsirnya. Pita kertas merupakan antara medium yang terkenal untuk pengaturcaraan simpanan data jangka masa panjang sehingga tahun 1980an, dan menggunakan kos perkhidmatan yang rendah dan dalam masa yang sama lebih lasak jika dibandingakan dengan pita magnet. Selain itu, mesin Teletype 33 menggunakan kod 17 (Control-Q, DC1, juga dikenali sebagai XON), 19 (Control-S, DC3, juga dikenali sebagai XOFF), dan 127 (Padam) telah menjadi simbol de-facto standard. Oleh kerana kekunci atas untuk kekunci O boleh jua memaparkan simbol anak panah kiri ( dari ASCII-1963, yang mempunyai simbol ini disebalik simbol underscore), penggunaan kod 15 (Control-O, Shift In) yang tidak rasmi juga di takrifkan sebagai "padam simbol sebelumnya" juga telah digunakan oleh kebanyakan sistem perkongsian masa tetapi telah berkurangan disebabkan keadaan.


Penggunaaan Control-S (XOFF, simbol untuk "transmisi Nyahaktif") sebagai simbol amaran tangan bersalaman untuk menyuruh penghantar supaya menghentikan tranmisi disebabkan oleh arus lebihan, dan Control-Q (XON, "transmisi aktif") untuk menyambung penghantaran, dimana boleh dibandingkan dengan teknik yang digunakan pada hari ini di dalam sistem-sistem sebagai teknik kawalan data keluar secara manual. Di dalam sesetengah sistem, Control-S mengekalkan fungsinya tetapi Control-Q digantikan dengan Control-S kedua untuk fungsi penyambungan penghantaran data.

Simbol kawalan ruang bukan putih

sunting

RFC 2822 merujuk kepada NO-WS-CTL, Simbol kawalan ruang bukan putih. Simbol-simbol ini adalah simbol kawalan yang tidak memasukkan pembawa kembali (carriage return), pengisi barisan (line feed) dan simbol ruang putih (white space character)(lihat disini), contohnya: huruf desimal 1–8, 11–12, 14–31, dan 127.

Simbol ASCII yang boleh dicetak

sunting

Kod 32, simbol "space", memberikan jarak antara dua perkataan, hasilnya adalah seperti apabila kita menekan "spacebar" di atas papan kekunci di atas komputer.Kod 32 hingga 126, dikenali sebagai simbol yang boleh dicetak, mewakili huruf, angka, tanda seruan, dan beberapa simbol yang lain.

ASCII tujuh-bit memberikan tujuh simbol "national" dan, jikalau peralatan dan perisian membenarkan. Overstrikes boleh digunakan untuk memaparkan simbol antarabangsa tambahan: di dalam senario ini, "backspace" boleh di gunakan sebagai grave accent (di mana sebagai standard penduduk Amerika dan British, tetapi hanya standard berikut juga dikenali sebagai "opening single quoation mark"), backtick atau breath mark (inverted vel).

Binary Oct Dec Hex Glyph
010 0000 040 32 20 SP
010 0001 041 33 21 !
010 0010 042 34 22 "
010 0011 043 35 23 #
010 0100 044 36 24 $
010 0101 045 37 25 %
010 0110 046 38 26 &
010 0111 047 39 27 '
010 1000 050 40 28 (
010 1001 051 41 29 )
010 1010 052 42 2A *
010 1011 053 43 2B +
010 1100 054 44 2C ,
010 1101 055 45 2D -
010 1110 056 46 2E .
010 1111 057 47 2F /
011 0000 060 48 30 0
011 0001 061 49 31 1
011 0010 062 50 32 2
011 0011 063 51 33 3
011 0100 064 52 34 4
011 0101 065 53 35 5
011 0110 066 54 36 6
011 0111 067 55 37 7
011 1000 070 56 38 8
011 1001 071 57 39 9
011 1010 072 58 3A :
011 1011 073 59 3B ;
011 1100 074 60 3C <
011 1101 075 61 3D =
011 1110 076 62 3E >
011 1111 077 63 3F ?
Binary Oct Dec Hex Glyph
100 0000 100 64 40 @
100 0001 101 65 41 A
100 0010 102 66 42 B
100 0011 103 67 43 C
100 0100 104 68 44 D
100 0101 105 69 45 E
100 0110 106 70 46 F
100 0111 107 71 47 G
100 1000 110 72 48 H
100 1001 111 73 49 I
100 1010 112 74 4A J
100 1011 113 75 4B K
100 1100 114 76 4C L
100 1101 115 77 4D M
100 1110 116 78 4E N
100 1111 117 79 4F O
101 0000 120 80 50 P
101 0001 121 81 51 Q
101 0010 122 82 52 R
101 0011 123 83 53 S
101 0100 124 84 54 T
101 0101 125 85 55 U
101 0110 126 86 56 V
101 0111 127 87 57 W
101 1000 130 88 58 X
101 1001 131 89 59 Y
101 1010 132 90 5A Z
101 1011 133 91 5B [
101 1100 134 92 5C \
101 1101 135 93 5D ]
101 1110 136 94 5E ^
101 1111 137 95 5F _
Binary Oct Dec Hex Glyph
110 0000 140 96 60 `
110 0001 141 97 61 a
110 0010 142 98 62 b
110 0011 143 99 63 c
110 0100 144 100 64 d
110 0101 145 101 65 e
110 0110 146 102 66 f
110 0111 147 103 67 g
110 1000 150 104 68 h
110 1001 151 105 69 i
110 1010 152 106 6A j
110 1011 153 107 6B k
110 1100 154 108 6C l
110 1101 155 109 6D m
110 1110 156 110 6E n
110 1111 157 111 6F o
111 0000 160 112 70 p
111 0001 161 113 71 q
111 0010 162 114 72 r
111 0011 163 115 73 s
111 0100 164 116 74 t
111 0101 165 117 75 u
111 0110 166 118 76 v
111 0111 167 119 77 w
111 1000 170 120 78 x
111 1001 171 121 79 y
111 1010 172 122 7A z
111 1011 173 123 7B {
111 1100 174 124 7C |
111 1101 175 125 7D }
111 1110 176 126 7E ~

Struktur ASCII

sunting
  • Angka 0-9 diwakili oleh nilai mereka di dalam angka binari menggunakan 0011 ( ini bermaksud, mengubah BCD kepada ASCII adalah dengan hanya mengambil BCD masing-masing secara berasingan dan menambah 0011 kepadanya.
  • Huruf kecil dan huruf besar hanya berbeza dari segi Susunan bit dengan perbezaan 1 bit sahaja, dengan meringkaskan kotak pertukaran kepada ujian terhad ( untuk mengelakkan pertukaran simbol yang bukan huruf) dan hanya satu operasi bit. Kotak pertukaran pantas adalah penting kerana ia sering digunakan untuk situasi pengabaian simbol di dalam carian algoritma .
  • Perbandingan dengan EBCDIC, huruf kecil dan huruf besar masing-masing memenuhi 26 posisi secara berturutan.


Rujukan

sunting
  1. ^ International Organization for Standardization (December 1, 1975). "The set of control characters for ISO 646". Internet Assigned Numbers Authority Registry. Alternate U.S. version: [1] Diarkibkan 2006-03-05 di Wayback Machine. Accessed August 7, 2005.
  2. ^ Internet Assigned Numbers Authority (January 28, 2005). "Character Sets". Accessed August 7, 2005.
  3. ^ A Tex Primer for Scientists (dalam bahasa English). CRC Press. January 1, 1995. m/s. 13. ISBN 0-8493-7159-7. Unknown parameter |coauthors= ignored (|author= suggested) (bantuan); Check date values in: |date= (bantuan); |access-date= requires |url= (bantuan)CS1 maint: unrecognized language (link)