J'aimerais bien comprendre pourquoi le caractère Paragraphe_(symbole) tapé sur mon clavier [Maj+!] n'est pas reconnu comme 1 unique caractère délimiteur par cut ?
Je n'ai trouvé nulle-part mention que ce soit un caractère spécial pour bash.
Je soupçonne / crains que d'autres caractères que j'ignorent, produisent cette mauvaise farce.
Car rien n'y fait avec : §
Ici un échantillon... j'ai tenté d'avantage de syntaxes sans plus de succès
cut --delimiter="§" -f 1 test.txt
cut: le délimiteur doit être un seul caractère
Saisissez « cut --help » pour plus d'informations.
cut --delimiter=§ -f 1 test.txt
cut: le délimiteur doit être un seul caractère
Saisissez « cut --help » pour plus d'informations.
cut -d \§ -f 1 test.txt
cut: le délimiteur doit être un seul caractère
Saisissez « cut --help » pour plus d'informations.
cut -d§ -f 1 test.txt
cut: le délimiteur doit être un seul caractère
Saisissez « cut --help » pour plus d'informations.
cut -d "§" -f 1 test.txt
cut: le délimiteur doit être un seul caractère
Saisissez « cut --help » pour plus d'informations.
cut -d '§' -f 1 test.txt
cut: le délimiteur doit être un seul caractère
Saisissez « cut --help » pour plus d'informations.
UTF-8 uses the 2 high bits (bit 6 and bit 7) to indicate if there are any more bytes: Only the low 6 bits are used for the actual character data.
That means that any character over ''7F'' requires (at least) 2 bytes. Ç signifie que tot caractère au dessus de 7F nécessite (aumoins) 2 octets.
Pour une liste, je verrai ça plus tard.... si j'y repense
Pour la liste, en 1ère approximation (non-vérifié > incomplète)
on peut déjà tabler sur : Unicode > Basic Latin
Pour en finir : 1 octet = 8 bit (0/1) ce qui donne 2^8 = 256 possibilités de valeur
pour une raison que je n'ai pas recherchée le jeu de caractère ASCII est codé sur 7 bits (1 bit libre pour autre chose ...) => 2^7= 128 = 0080 (base 16)
Donc 128 est le maxi sur 7bits (0-127) ce qui correspond aux caractères de ce tableau :