Przejdź to tekstu

Łatwa konwersja z ISO do UTF8 - i nie tylko

Kategoria: FAQ, etykiety: konwersja, kodowanie, enca

Dodany przez: Jacekalex, 2010-10-13 01:44 (zmodyfikowany: 2014-10-24 01:18)

Wyświetleń: 15292

Witam

Linux od dawna działa na kodowaniu UTF8, natomiast sporo starszych plików, i część współczesnych ma inne kodowania, zazwyczaj ISO-8859-2, czy CP1250 z Windows.

Do zmiany kodowania pliku tekstowego przydaje się program enca:

sudo apt-get install enca

Konwersja na kodowanie używane w systemie:

enca -c plik

Program rozpozna format kodowania, i przekonwertuje na używany w systemie - zazwyczaj utf8, na inne kodowanie -(wymuszenie) np: na iso-8859-2

enca -x iso-8859-2 plik

sprawdzanie kodowania pliku po zmianie:

~ $ enca -m plik
   ISO-8859-2

Dla kodowania w standardach ISO* działa prawidłowo, dla CP1250 (Windows) nie sprawdzałem (nie posiadam ani jednego pliku w tym kodowaniu :))) )

W ten sposób można zmieniać kodowanie plików tekstowych, html, skryptów php i podobnych. Praktycznie wszystkich plików - które można otworzyć w edytorze tekstowym (np gedit, kate) lub programistycznym ( np geany).

Mam nadzieję - ze komuś się przyda.

Pozdrawiam ;)

OSnews Wykop Blip Flaker Kciuk Śledzik Facebook Identi.ca Twitter del.icio.us Google Bookmarks