Unicode, Teknologi dibalik pengetikan huruf
A. Pengertian
Dikutip dari Wikipedia Unicode adalah suatu standar industri yang dirancang untuk mengizinkan teks dan simbol dari semua sistem tulisan di dunia untuk ditampilkan dan dimanipulasi secara konsisten oleh komputer. Dikembangkan secara tandem dengan standar Universal Character Set dan dipublikasikan dalam bentuk buku The Unicode Standard. Unicode mengandung suatu kumpulan karakter, suatu metodologi pengkodean dan kumpulan standar penyandian karakter, suatu kumpulan bagan kode untuk referensi visual, deskripsi sifat karakter seperti huruf besar dan huruf kecil, suatu kumpulan data referensi berkas komputer, serta aturan normalisasi, dekomposisi, pembandingan (collation), serta penggambaran (rendering).
Unicode memungkinkan dukungan semua bahasa di seluruh dunia dan rangkaian karakter uniknya – Unicode juga dapat mendukung lebih dari 1 juta karakter! Cara kerja Unicode adalah memungkinkan lebih banyak jumlah bit, yang merupakan singkatan dari b inary dig it , yang merupakan unit informasi pada mesin. Kenyataannya Karakter ASCII hanya membutuhkan sekitar 7 bit, sementara Unicode menggunakan 16 bit. Hal Ini diperlukan karena dibutuhkan lebih banyak bit untuk memproses bahasa seperti Cina, Arab, dan Rusia.
Ada berbagai jenis Unicode termasuk UTF-8 dan UTF-16, merupakan dua kode yang paling umum. UTF-8 telah menjadi standar khas yang digunakan di web karena menyesuaikan jumlah bit yang digunakan tergantung pada karakter. Hal ini berarti karakter ASCII dalam UTF-8 hanya mengambil bit yang mereka butuhkan untuk diproses.
Unicode tidak hanya mengandung aksara dari bahasa tertentu saja melainkan juga terdapat simbol-simbol lain juga seperti tanda baca, Emoji, dan logo logo tertentu. Dengan Unicode kini semua abjad yang ada diseluruh dunia yang ada disemua bahasa bisa dimasukan kedalam komputer sehingga abjad tersebut tidak bisa punah.
B. Sejarah
Unicode Consortium, suatu organisasi nirlaba yang mengkoordinasikan pengembangan Unicode memiliki tujuan ambisius untuk dapat, pada akhirnya, menggantikan skema pengkodean karakter yang ada dengan Unicode dan skema Unicode Transformation Format (UTF) nya, karena banyak skema yang ada sekarang memiliki keterbatasan ukuran dan lingkup dan takserasi dengan lingkungan multibahasa. Kesuksesan Unicode menyatukan set karakter telah membawa pada penggunaannya yang luas dan pradominan dalam internasionalisasi dan lokalisasi perangkat lunak komputer. Standar ini telah diterapkan pada teknologi-teknologi terkini, termasuk XML, bahasa pemrograman Java, dan sistem operasi modern.
C. Mengapa menggunakan Unicode?
Unicode mendukung data dengan banyak skrip seperti Prancis, Jepang, dan Ibrani. Ini memungkinkan suatu komputer untuk menggabungkan catatan dari skrip yang berbeda pada satu laporan. Sebelum Unicode, komputer hanya dapat memproses dan menampilkan simbol tertulis pada halaman kode sistem operasinya, yang diikat ke satu skrip. Misalnya, jika komputer dapat memproses bahasa Prancis, itu tidak dapat memproses bahasa Jepang dan bahasa Ibrani.
Ada tren yang berkembang untuk semua teknologi komputer baru untuk menggunakan Unicode untuk data teks. Selain Pembuat Informasi, Unicode telah diadopsi oleh para pemimpin industri seperti Microsoft, Apple®, HP®, IBM, Oracle®, SAP®, dan banyak lainnya. Banyak sumber data penting yang diakses WebFOCUS sekarang mendukung tipe data Unicode. Pengenalan Unicode ke WebFOCUS memungkinkan Anda untuk mengakses dan bekerja secara langsung dengan data Unicode dan membuat file UTF-8 Unicode HOLD.
Unicode adalah metode pengkodean teks yang disukai di browser seperti Google Chrome dan Firefox. Unicode juga digunakan secara internal dalam teknologi Java, HTML, XML, dan Windows dan Office. Unicode memungkinkan produk Pembangun Informasi untuk secara mulus menangani antarmuka dengan fasilitas pihak ketiga yang menggunakan Unicode dan terintegrasi ke dalam lini produk Pembuat Informasi.
transcoding dari Unicode ke Shift-JIS. Sebagian besar sistem manajemen basis data relasional dan non-relasional yang didukung oleh Pembuat Informasi memiliki arsitektur halaman kode yang sama dengan WebFOCUS, yang berarti mereka memiliki komponen internal, mirip dengan Pembuat Informasi NLS API, yang menangani transcoding. Sumber halaman dan pengaturan halaman kode klien biasanya diatur selama instalasi atau dengan mengedit pengaturan dalam file konfigurasi. Untuk detail, lihat dokumentasi vendor tertentu.
Menentukan Jenis Data Alfanumerik
UTF-8 adalah skema pengkodean panjang variabel. Secara umum, karakter ASCII 7-bit (huruf bahasa Inggris yang akrab) adalah satu byte, banyak karakter Eropa (nasional) diperpanjang dua byte, dan simbol Set Karakter Double-Byte (kanji Jepang) adalah tiga byte.
Definisi data alfanumerik yang familier seperti SQL CHAR ( n ) atau WebFOCUS A n merujuk pada byte, bukan karakter. Namun, tipe data alfanumerik yang lebih kompleks dari Oracle dan vendor lain dapat merujuk ke karakter ketika pengkodean sisi klien mereka diatur ke UTF-8.
D. Kelebihan dan Kekurangan Unicode
Kelebihan:
· Mendukung jutaan abjad diseluruh dunia
· Sebagai backup abjad agar bisa dibaca komputer
· Merestorasi dan Mencegah terjadinya kepunahan abjad
· Bisa membaca emoji
· Pengkodean abjad lebih banyak dibandingkan ASCII
· Lebih fleksibel di semua perangkat elektronik modern
Kekurangan:
· Memerlukan perangkat yang lebih baru agar semua karakter unicode bisa terbaca
· Metode pengetikan untuk setiap bahasa berbeda-beda
Demikian ulasan admin tentang Apa itu Unicode semoga bermanfaat
Komentar
Posting Komentar