You are here

Ćirilički URL

Kroz istoriju se uvek vodila bitka za korišćenje lokalnih pisama u softveru i na hardveru koji je dominantno proizveden u Americi. Davno pre ere interneta, korisnici su morali da se hvataju ukoštac sa činjenicom da „27. slovo“ jednostavno nije predviđeno, i da ih nisu podržavali sistemi kao što su DOS, Windows, Unix… Čak i kada je stanje stvari počelo krajem prošlog veka da se popravlja, to su više bile kozmetičke promene nego suštinsko poboljšanje – postojale su desetine različitih standarda, štampače su zbunjivali ti čudni kodovi (a rezultat koji su pružali je bio jako neizvesan) itd.

Korisnici su, naravno, nalazili prečice. To je rezultiralo dodatnim haosom, desetinama standarda, fontovima lošeg kvaliteta i ponekad sasvim onemogućenom razmenom dokumenata između platformi.

Na svi sreću, stvari se popravljaju.

Kako napraviti dobar sajt na ćirilici

Postepeno, to je reč koja sve najbolje objašnjava. Kada je IDN format domena tek nastao, pretraživači su ga različito tretirali, svaki na svoj način. Na primer, Mozilla Firefox je zahtevala posebno odobrenje (tzv. hardcoding) za dozvoljene nazive domena, a .срб nije bio među podrazumevanima.

Sledeća dilema na dnevnom redu bila je set karaktera. Međunarodni simboli bili su obuhvaćeni sa više standarda, a jedan od najodgovornijih aktera tog haosa bio je niko drugi do Majkrosoft sa svojom idejom o „boljim i drugačijim“ odgovorima na pitanja na koja je već bilo odgovoreno.

Pokori se tvorcu

Jedini put napretka je zapravo put poštovanja internet standarda. Kada je reč o neengleskim pismima, kao što je slučaj sa srpskom ćirilicom, ispostavilo se da je traženi standard UTF-8.

Pre svega, potrebno je da obavestite pregledač (browser) koji set karaktera koristite u dokumentu:

<meta charset="utf-8" />

Zatim, potrebno je da koristite isti set karaktera i u samom URL-u:

https://www.rnids.rs/nacionalni-domeni/registracija-nacionalnih-domena

To je ono što standard omogućava. Pregledači ne omogućavaju? To je onda njihov problem. Zaista jeste. A taj se problem neće rešiti sam. Čak i danas, karakteri neengleskih pisama imaju drugačiji tretman u odnosu karaktere engleskog alfabeta. Opet, to je njihov problem. Upornost je ključ, ne traženje prečica.

Na kraju, nije loša ideja da obavestite “buntovne“ pregledače šta pokušavate da postignete:

<!--[if lt IE 7]><html class="lt-ie9 lt-ie8 lt-ie7" lang="sr" dir="ltr"><![endif]-->
<!--[if IE 7]><html class="lt-ie9 lt-ie8" lang="sr" dir="ltr"><![endif]-->
<!--[if IE 8]><html class="lt-ie9" lang="sr" dir="ltr"><![endif]-->

To je primer nestandardnog, ali efikasnog rešenja.

Obavestite pretraživačku mašinu

Često je nelatinički sadržaj duplikat sadržaja na latinici. Obavestite pretraživače da je to slučaj. Ovo je od nedavno dostupna mogućnost, ali mi toplo preporučujemo da je koristite:

<link href="/%D0%BD%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%B0%D0%BB%D0%BD%D0%B8-%D0%B4%D0%BE%D0%BC%D0%B5%D0%BD%D0%B8/%D1%80%D0%B5%D0%B3%D0%B8%D1%81%D1%82%D1%80%D0%B0%D1%86%D0%B8%D1%98%D0%B0-%D0%BD%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%B0%D0%BB%D0%BD%D0%B8%D1%85-%D0%B4%D0%BE%D0%BC%D0%B5%D0%BD%D0%B0" rel="alternate" hreflang="sr" />

<link href="/lat/nacionalni-domeni/registracija-nacionalnih-domena" rel="alternate" hreflang="sr-Latn" />

<link href="/en/national-domains/registering-national-domains" rel="alternate" hreflang="en" />

Koristimo isti URL kao iznad ali Google Chrome i dalje „sakriva“ ćirilicu. Ne obraćajte pažnju, pre ili kasnije će se opametiti. U stvari sva tri URL-a koriste isto UTF-8 kodiranje.

„Obavestiti“ pretraživače da je reč o istom sadržaju može biti od koristi, jer onda neće favorizovati ni engleski ni bilo koji drugi jezik – ponašaće se u skladu sa podešavanjima korisnikovog sistema. Ako ste iz Srbije, i koristite ćirilicu, Windows (ili drugi operativni sistem) to mora da zna, a vi morate da prestanete da se osećate „pomalo neprijatno“ zato što koristite maternji jezik i njegovo pismo. Sami se morate izboriti, niko drugi to neće učiniti umesto vas.

Strpljenja, molim

Internet će vremenom sigurno podržavati sva moguća pisma, i više od toga. Ali, traženje jednokratnih prečica neće pomoći da se to dogodi, štaviše, usporiće proces adaptacije. Ako postoji standard – primenjujte ga!

Pratite fabulu

Kako pregledači i drugi softveri napreduju, kvalitet podrške za neengleska pisma raste. To je van svake sumnje, jer smo to posvedočili tokom prošle decenije. Možda ćete pasti u iskušenje da koristite „hakerske“ trikove i pravite jednokratna rešenja koja će momentalno ispravno prikazivati slova, ali nemojte. Mnogo je bolja ideja da zahtevate tu mogućnost– Google, Microsoft, Mozilla i drugi nisu gluvi na takve zahteve.

Sveobuhvatna upotreba pisma

Ne postoji nijedan razlog da sadržaj sajta bude na ćirilici, a URL na latinici. Možda je tako moralo ranije, ali više ne. Zašto da pravite korak unazad, kada možete ići dva unapred?

Male tajne velikih majstora

Postoji nekoliko „caka“ koje mogu biti korisne pri radu sa URL-ovima na neengleskim pismima.

Apač veb server, koji se više nego dominantno koristi na internetu, ima poteškoće da interpretira direktan unos ćirilice u konfiguracione fajlove. Potrebno je da pribegavate upotrebi IDN ekvivalenata, ili vršite preusmeravanja i sl. Na primer:

ServerName xn--d1aholi.xn--90a3ac # actually, рнидс.срб

Prilično je zabavna činjenica da se sam konfiguracioni fajl zove рнидс.срб.conf. To je zato što Linux nema problem sa ćirilicom, a iznad svega nema ni Apač, osim što…

Kada pokušate da kopirate ćirilički URL, dobićete nešto ovako:

https://www.rnids.rs/%D1%9B%D0%B8%D1%80%D0%B8%D0%BB%D0%B8%D1%86%D0%B0-%D0%BD%D0%B0-%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82%D1%83/idn-%D0%B5%D0%BD%D0%BA%D0%BE%D0%B4%D0%B5%D1%80

U pitanju je vrlo jednostavan URL, koji zapravo ovako glasi https://www.rnids.rs/ćirilica-na-internetu/idn-enkoder. Međutim, većina pregledača će vam „pripomoći“ transkodovanjem. URL je sasvim ispravan i radi, ali ga razume samo mašina, ljudima je sasvim beskoristan.

Google Chrome se nedavno rešio ove loše navike, i sad je moguće kopirati ćirilički URL iz adresnog polja u drugi pregledač. Ovim se ponovo naglašava pređašnja preporuka „strpljenja, molim“. Drugi pregledači to još nisu postigli, ali postoji način da se i sa ovim izađe na kraj – uklonite samo jedno slovo, na primer prvo h iz naziva protokola, i pretraživač će ispravno kopirati URL. Ovako to izgleda u poslednjoj verziji Firefox-a:

ttps://www.rnids.rs/ćirilica-na-internetu/idn-enkoder

Bitka traje, ali to je bitka koju smo već dobili.

 

Vladimir Marić, Mrežni sistemi d.o.o.

www.mreznisistemi.rs