[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Unikody



Zaraz, zaraz... Czy to oznacza, że w Unicode litera o tym samym wygladzie ma
ten sam kod, niezaleznie od tego, z jakiego alfabetu pochodzi? Czy np. litera
'b' z alfabetu lacinskiego ma ten sam kod co litera 'b' z cyrylicy? To byloby
tragiczne... Wtedy rzeczywiscie nie udaloby sie zrobic globalnego sortowania.

Nie czuję się kompetentnym, żeby jednozncznie odpowiedzieć na takie pytanie. Sprawdziłem jak to wygląda w przypadku litery "B". W alfabecie łacińskim i cyrlicy maja różne kody, ale przy wielu literach jest komentarz, że ta litera jest używana w wielu językach. Myślę, że chyba nie ma tak jednoznacznej reguły. Na pewno jednym z kryteriów jest wygląd liter, ale chyba też są brane pod uwagę pewne rodziny alfabetów: np: łaciński, cyrlica chociaż i tutaj pewnie sa jakieś wyjątki. Np: przy literze 'a' ze znaczkiem 'v' u góry jest komentarz: 'Romanian, Vietnamese, Latin, ...' a przy literze 'd' z przekreśloną laseczką (takie złączenie litery 'o' i 't')  jest komentarz: 'Croatian, Vietnamese, Sami'. Zresztą można to wszystko pięknie obejrzeć w plikach *.pdf na stronie opisującej Unikody http://www.unicode.org/ w punkcie 'Code Charts'
Pozdrawiam,

                   
Henryk Jusza               mailto:henju@pg.gda.pl
--------------------------------------------------------------
Ośrodek Informatyczny Politechniki Gdańskiej
Pracownia Rozwoju Oprogramowania
tel (058) 347-28-01          fax (058) 347-24-63