Wechsel ASCII / ISO-8859-1 zu UTF-8

Soll das Encoding einer Datei gewandelt werden, so ist dies z.B. mit iconv oder dem Editor vim möglich.

Zunächst das vorhandene Encoding anzeigen lassen:

$ file datei.txt
datei.txt: ISO-8859 text

Wandel in UTF-8 mit iconv:
$ iconv -f ISO_8859-1 -t UTF-8 datei.txt > datei-utf8.txt
$ file datei-utf8.txt
datei-utf8.txt: UTF-8 Unicode text

Die mit iconv möglichen Encodings zeigt “iconv -l” an.

Auch der Editor vim bietet die Möglichkeit, in gewünschtem Encoding zu speichern; dazu im Befehlsmodus eingeben:
:set fileencoding=utf-8

Es ist im vim weiterhin möglich ein “byte order mark, BOM” zu setzen; dies dient der einfacheren Erkennung, welches Unicode Encoding und welche Endianness (big endian oder little endian) verwendet wurde. Dazu im Befehlsmodus eingeben:
:set fileencoding=utf-8 bomb

$ file datei.txt
datei.txt: UTF-8 Unicode (with BOM) text

Welche encodings vim unterstützt läßt sich mit :help encoding-names anzeigen. Unten stehend ein Auszug der Unicode-Varianten:

utf-8 32 bit UTF-8 encoded Unicode (ISO/IEC 10646-1)
ucs-2 16 bit UCS-2 encoded Unicode (ISO/IEC 10646-1)
ucs-2le like ucs-2, little endian
utf-16 ucs-2 extended with double-words for more characters
utf-16le like utf-16, little endian
ucs-4 32 bit UCS-4 encoded Unicode (ISO/IEC 10646-1)
ucs-4le like ucs-4, little endian

 

Diesen Artikel drucken Diesen Artikel drucken

Die Kommentarfunktion ist geschlossen.