Diacritice
Una din problemele pe care doream să le rezolv pe acest blog era lipsa caracterelor cu diacritice din articole. Ştiam că folosesc o tastatură românească, le puteam vedea uşor pe Mac, Firefox-ul de Windows le afişa oarecum ciudat, dar le afişa, pe când Internet Explorer 6.0 le înlocuia cu nişte pătrate.
Motivul pentru care nu se afişau caracterele în mod corect l-am aflat de pe site-ul lui Cristian Secară:
În cazul codării proprietare de pagină CP1250 folosită de sistemul de operare Microsoft Windows, în forma ei actuală, caracterele Ş/ş şi Ţ/ţ au atribuite codurile Unicode U015E (S cu sedilă), U015F (s cu sedilă), U0162 (T cu sedilă) şi U0163 (t cu sedilă). Ele sunt descrise în cadrul subsetului Unicode Latin Extended-A.
Aceste caractere, cu sedilă, sunt specificate şi în cadrul standardului internaţional ISO/IEC 8859-2:1998 (Latin2).
Caracterele corecte din punct de vedere al limbii române sunt de fapt caracterele ale căror coduri Unicode sunt U0218 (S cu virgulă), U0219 (s cu virgulă), U021A (T cu virgulă) şi U021B (t cu virgulă). Ele sunt descrise în cadrul subsetului Unicode Latin Extended-B.
Aceste caractere, cu virgulă, sunt specificate atît în cadrul standardului românesc SR 13411:1999, cît şi în cadrul standardului internaţional ISO/IEC 8859-16:2001 (Latin10).
Tastatura românească pentru Mac pe care o folosesc eu a fost dezvoltată de Sorin Paliga şi foloseşte standardul ISO revizuit în 2004. Caracterele tipărite sunt Ş şi Ţ cu virgulă, nu cu sedilă pentru că Apple a oferit imediat suport pentru aceste caractere.
Suportul pentru limba română în Windows a fost tot timpul o problemă: tastatura iniţială avea inversate literele Y şi Z şi multe din caracterele non-alfanumerice erau repoziţionate pe tastatură. În Vista, Microsoft a introdus (într-un final!) suport pentru Ş cu virgulă şi Ţ cu virgulă şi o nouă tastatură românească la fel ca versiunea prezentă pe site-ul lui Cristi Secară. Efectul imediat s-a văzut pe internet, unde diverse persoane se plângeau că articolele scrise din Windows Vista nu se văd la fel de bine şi din XP (cum a remarcat şi Ovidiu Platon pe la mijlocul lunii noiembrie).
Microsoft a emis un update referitor la aceste caractere şi fonturile specifice Microsoft, adică Arial, Times New Roman şi Verdana, după cum a anunţat şi Michael Kaplan, Technical Lead la Microsoft pe astfel de probleme. În mod normal acest update este disponibil folosind Windows Genuine Advantage.
Update: Am modificat tastatura românească a domnului Paliga pentru Mac OS X astfel încât să se poată scrie cu Ş şi Ţ cu sedilă, nu cu virgulă, astfel încât să fie compatibil cu sistemele Windows pre-Vista. Mai multe detalii.