Soll das Encoding einer Datei gewandelt werden, so ist dies z.B. mit iconv oder dem Editor vim möglich.
Zunächst das vorhandene Encoding anzeigen lassen:
$ file datei.txt
datei.txt: ISO-8859 text
Wandel in UTF-8 mit iconv:
$ iconv -f ISO_8859-1 -t UTF-8 datei.txt > datei-utf8.txt
$ file datei-utf8.txt
datei-utf8.txt: UTF-8 Unicode text
Die mit iconv möglichen Encodings zeigt “iconv -l
” an.
Auch der Editor vim bietet die Möglichkeit, in gewünschtem Encoding zu speichern; dazu im Befehlsmodus eingeben:
:set fileencoding=utf-8
Es ist im vim weiterhin möglich ein “byte order mark, BOM” zu setzen; dies dient der einfacheren Erkennung, welches Unicode Encoding und welche Endianness (big endian oder little endian) verwendet wurde. Dazu im Befehlsmodus eingeben:
:set fileencoding=utf-8 bomb
$ file datei.txt
datei.txt: UTF-8 Unicode (with BOM) text
Welche encodings vim unterstützt läßt sich mit :help encoding-names
anzeigen. Unten stehend ein Auszug der Unicode-Varianten:
utf-8 32 bit UTF-8 encoded Unicode (ISO/IEC 10646-1)
ucs-2 16 bit UCS-2 encoded Unicode (ISO/IEC 10646-1)
ucs-2le like ucs-2, little endian
utf-16 ucs-2 extended with double-words for more characters
utf-16le like utf-16, little endian
ucs-4 32 bit UCS-4 encoded Unicode (ISO/IEC 10646-1)
ucs-4le like ucs-4, little endian
Diesen Artikel drucken