dimanche 14 juillet 2019

Mystères et Merveilles de l’Unicode (2)



J'ai acheté un PC, du coup j'ai enfin accès aux emoji ! … Et au final je trouve ça un peu décevant, je préfère l'Unicode. Du coup voilà, un autre article sur l'Unicode.

Déjà un article en anglais qui met le doigt sur des insuffisances et manques injustifiés dans le standard, par exemple des caractères bengali manquants alors que tout le script est censé être disponible — peut-être dû au fait que les membres du consortium Unicode sont tous occidentaux : “I Can Text You a Pile of Poo, But I Can’t Write My Name”.


À gauche, sous Windows ;
à droite, sous Linux ou Mac OS.
Le bonhomme de neige Unicode (☃) est connu, mais saviez-vous qu'il existe aussi un bonhomme de neige noir Unicode ? ⛇ À noter que son apparence change pas mal selon le système d'exploitation que vous avez.  Perso j'aime bien la version minimaliste Linux / Mac OS, qui met le doute sur ce que l'on voit. Genre ça pourrait tout autant évoquer un canard de bain maléfique vu de face. Ou un… un drôle de truc en tout cas.

En passant, saviez-vous que les bonhommes de neige ont généralement deux boules en France et au Royaume-Uni, mais trois boules en Allemagne et aux États-Unis ? (Sources : Wikipédia et Karambolage.)


U+058E · ֎
֎ et ֍ sont un symbole arménien symbolisant l'éternité, appelé arevakhach. Il semble qu'il soit très connu et courant là-bas, où il fait partie intégrante de la culture nationale.


U+06DE · ۞
Le symbole ۞ (rub el hizb) est utilisé pour marquer une fin de chapitre en calligraphie arabe. (Et sans le petit rond au milieu, le symbole est utilisé sur la pochette de l'album We Care a Lot de Faith No More, ce qui n'a rien à voir.)


U+06E9 · ۩
۩ est un caractère utilisé dans le Coran pour indiquer quand il faut se prosterner « temps de sujūd » d'après Wikipédia). Sinon il ressemble aussi à une porte dimensionnelle trop cool avec des pourtours en néon qui clignotent ou un truc du genre.


U+07F7 · ߷
߷, appelé gbakurunen et symbolisant trois pierres sur lesquelles on pourrait poser une marmite, est un caractère appartenant à l'alphabet N'ko, créé en 1949 par Solomana Kante pour retranscrire les langues mandingues d'Afrique de l'Ouest. Comme beaucoup de jolis symboles, il est utilisé pour marquer la fin d'une section dans un texte.



L'empereur Claude a inventé trois lettres : le Ↄ, le Ⅎ et le Ⱶ. Ces « lettres claudiennes » ne furent usitées que quelques années, puis abandonnées après la mort de l'empereur. Le Ⅎ aurait servi à distinguer U et V, qui étaient toutes deux écrites V à l'époque ; V aurait été la voyelle U, Ⅎ la consonne V.

U+0F12 · ༒

Rgya gram shad (༒) : encore un caractère pour indiquer les fins de sections de textes ; celui-là est tibétain et utilisé dans les textes bouddhistes.



U+1CC4 · ᳄
Le bindu leu satanga (techniquement , félicitations si ça s'affiche correctement chez vous) est un signe de ponctuation de l'alphabet soundanais — pas soudanais, soundanais, ce qui recoupe une partie de Java ! — dont le sens est « incertain » selon Wikipédia. Oui, on dirait un logo contemporain.


Je me suis demandé pourquoi il existait un caractère pour deux points d'exclamation (‼) : quel intérêt ? En fait c'est pour les scripts qui s'écrivent verticalement.


Plusieurs caractères étranges ont fait partie de l'alphabet phonétique international avant d'être abandonnés en 1976, par exemple le ʆ, le deux barré (ƻ) ou le ƾ (croisement chimérique entre un "t" et un "s").


Avez-vous déjà vu ces symboles circulaires chinois ? Parfois on peut aussi les voir sans cercle, comme celui pour “shòu” qui peut ressembler à un insecte ou à une arête de poisson (voir ci-contre).

Il s'agit de formes stylisées de caractères classiques appartenant à la religion traditionnelle chinoise ou shenisme, et symbolisant respectivement : la chance, la prospérité, la longévité, le bonheur et la richesse. Il est assez intéressant de voir comment les caractères peuvent changer avec cette stylisation !

Cf. la fiche PDF officielle de chez Unicode, qui explique ça avec quelques images en plus.


Sinon je me demande qui a un système capable d'afficher tous les caractères Unicode ? Il y a bien l'impressionnant projet Noto de Google censé remplir cette fonction, mais j'ai testé, tout ne fonctionne pas chez moi. (Et si Windows a bien voulu installer ces 1.1 Go (!) de polices, il n'a pas apprécié des masses le fait de devoir les supprimer ensuite !)

D'autres polices Unicode sont disponibles, comme la famille CODE2000, CODE2001 et CODE2002 qui possèdent déjà un sacré paquet de caractères.

Aucun commentaire:

Publier un commentaire