[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: Unikody
Zaraz, zaraz... Czy to oznacza, że
w Unicode litera o tym samym wygladzie ma
ten sam kod, niezaleznie od tego, z jakiego alfabetu pochodzi? Czy np.
litera
'b' z alfabetu lacinskiego ma ten sam kod co litera 'b' z cyrylicy? To
byloby
tragiczne... Wtedy rzeczywiscie nie udaloby sie zrobic globalnego
sortowania.
Nie czuję się kompetentnym, żeby jednozncznie odpowiedzieć na takie
pytanie. Sprawdziłem jak to wygląda w przypadku litery "B". W
alfabecie łacińskim i cyrlicy maja różne kody, ale przy wielu literach
jest komentarz, że ta litera jest używana w wielu językach. Myślę, że
chyba nie ma tak jednoznacznej reguły. Na pewno jednym z kryteriów jest
wygląd liter, ale chyba też są brane pod uwagę pewne rodziny alfabetów:
np: łaciński, cyrlica chociaż i tutaj pewnie sa jakieś wyjątki. Np: przy
literze 'a' ze znaczkiem 'v' u góry jest komentarz: 'Romanian,
Vietnamese, Latin, ...' a przy literze 'd' z przekreśloną laseczką (takie
złączenie litery 'o' i 't') jest komentarz: 'Croatian, Vietnamese,
Sami'. Zresztą można to wszystko pięknie obejrzeć w plikach *.pdf na
stronie opisującej Unikody
http://www.unicode.org/
w punkcie 'Code Charts'
Pozdrawiam,
Henryk Jusza mailto:henju@pg.gda.pl
--------------------------------------------------------------
Ośrodek Informatyczny Politechniki Gdańskiej
Pracownia Rozwoju Oprogramowania
tel (058) 347-28-01 fax (058) 347-24-63