ASCII, UNİCOD, UTF-8 NEDİR?

ASCII(American Standart Code For Information Interchange)Nedir?

Türkçesi “Bilgi değişimi için Amerika standart kodlama sistemi” olan ASCII kodları 7 bitlik karakter kümesidir. 1963 yılında ANSI yani Amerikan Ulusal Standartlar Enstitüsü tarafından sunulmuştur. 33 tane basılmayan kontrol karakteri, 95 tane basılan karakter bulunur. ASCII tablosundaki 0-31 arasındaki sayılar, yazıcı gibi bazı çevresel aygıtları denetlemek için kullanılan denetim karakterlerine atanmıştır. Örnek vermek gerekirse ASCII de 13’ün karşılığı satır başı demektir. 32-126 arası klavyede veya bir belgede gördüğümüz karakterleri temsil eden aralıktır, 127 sil komutunu temsil eder. ASCII kodunda 65 “A” harfini temsil eder. Genişletilmiş ASCII ile birlikte “Ç”, “ü” gibi harfler de tabloya katılmıştır fakat yine de birçok dilde bu karakterlere katılmayan simgeler vardır, bu sebeple bölgesel ASCII çeşitlemeleri vardır. Örneğin Kuzey Amerika, Batı Avrupa, Avustralya ve Afrika dillerine ait yazılım programlarında ISO 8859-1 olarak bilinen ASCII tablosu kullanılır.

Unicode(Evrensel Kod) Nedir?

Unicode Consortium organizasyonu tarafından geliştirilen ve her karaktere bir sayı değeri karşılığı atayan bir standarttır. Her karaktere bir sayı atayan standarttır. Geniş gövdeli ASCII olarak da tanımlanabilir. 120.000’den fazla karakteri ve emoji gibi çeşitli sembol kümeleri kapsamaktadır. Unicode kodlarından oluşan karakter dizilerini(metinlerini) bilgisayarda verimli bir biçimde saklayabilmek amacıyla çeşitli karakter donanımlarıyla geliştirilmiştir. Bunlardan en yaygın olanı UFT-8 ve UFT-16’dır.

UFT-8 ile 16 arasındaki fark nedir?

UFT-16 kodlamasında kod birimleri 16 bit, UFT-8 de 8 bit uzunluğundadır.

UFT-8 Nedir?


8 bitlik bir Unicode dönüşüm biçimidir. Rob Pike ve Ken Thompson tarafından geliştirilmiştir. Karakterleri  1-6 bayt uzunluğunda diziler olarak kodlar. ASCII kodlaması içinde 0-127 arasında kalan karakterleri aynen kendi kodları ile kullanır, diğerleri ise bayt dizileri haline gelir. UFT kullanarak 1 milyondan fazla karakter kodlanabilir. Örnek verecek olursak “ş” harfinin Unicode kodu U+015F’tir.

Yorumlar

Bu blogdaki popüler yayınlar

ORACLE DA TABLESPACE OLUŞTURMA VE EKLEME YAPMA

MDF,NDF,LDF NEDİR?

ORACLE VERİ TABANI BACKUP ALMA İŞLEMİ(RMAN)