CharsetConvert
| Formát: | CHARSETCONVERT <ze souboru> <ze znakové sady> [do souboru] [do znakové saady] [EOL [CR] [LF] [CRLF]] |
| Šablona: | FROM/A, FROMCHARSET/A, TO, TOCHARSET, EOL/K |
| Účel: | Převede textový soubor z jedné znakové sady do druhé. |
| Cesta: | C:CHARSETCONVERT |
Příkaz CHARSETCONVERT převede textový soubor upřesněný argumentem FROM ze znakové sady určené argumentem FROMCHARSET na znakovou sadu zadanou argumentem TOCHARSET nebo na aktuální systémovou výchozí znakovou sadu, pokud není zadán argument TOCHARSET. Výsledek se zapíše do souboru určeného argumentem TO nebo na výstup do aktuálního okna, pokud není zadán argument TO.
Argumenty FROMCHARSET a TOCHARSET jsou charsetové názvy nebo aliasy registrované u IANA uložené v ADRESÁŘI L:Charsets/. Aktuálně jsou podporovány pouze 8bitové znaky s mapovací tabulkou do Unicode (které lze vytvořit příkazem BuildMapTable) v L: Charsets/, plus tyto další charsety:
- FROMCHARSET může být také UTF-7, UTF-8, UTF-16BE, UTF-16LE, UTF-32BE nebo UTF-32LE.
- TOCHARSET může být také UTF-8.
Příkaz CHARSETCONVERT vrátí návratový kód 20 (FAILURE), když dojde k závažné chybě, s výsledným kódem 10 (ERROR), když vstupní soubor obsahuje neplatná data (NUL nebo znaková nebo kódovací sekvence, která je v souboru FROMCHARSET nalezena v souboru FROM) nedefinovaná nebo neplatná) , s kódem výsledku 5 (WARN), když v TOCHARSETU nemohl být reprezentován alespoň jeden vstupní znak a byl nahrazen sekvencí "<UXXXX>", a s kódem výsledku 0 (OK), pokud vše šlo dobře.
Parametry
| TO <název> | Určuje výstupní soubor nebo zařízení. Ve výchozím nastavení jsou výstupy směrovány do aktuálního okna. | |
| TOCHARSET <název> | Určuje cílovou znakovou sadu. Ve výchozím nastavení probíhá převod do aktuální výchozí znakové sady systému. | |
| EOL <typ> | Převede sekvence typu End-Of-Line (EOL) na zadaný typ. Pokud není uvedeno, nedojde k žádné konverzi. Parametr typu EOL musí odpovídat jednomu z následujících klíčových slov: | |
| CR | EOL výstup jako CR (0x0D, "\ r") (Mac styl). | |
| LF | EOL výstup jako LF (0x0A, "\n") (Amiga styl). | |
| CRLF | EOL výstup jako CRLF (0x0D0A, "\r\n") (PC styl). | |
Příklady
| 1> CHARSETCONVERT russian KOI8-R russian-ISO ISO-8859-5 EOL=LF |
Přečte textový soubor rusky, převede znakovou sadu z KOI8-R na ISO-8859-5, převede sekvence EOL do Amiga stylu a výsledek zapíše do russian-ISO.
| 2> CHARSETCONVERT czech.txt X-ATO-E2 czech-ISO2.txt ISO-8859-2 |
Přečte textový soubor czech.txt, převede znakovou sadu z X-ATO-E2 (znaková sada českých katalogových souborů OS3.x) na ISO-8859-2, nahradí nekonvertibilní znaky sekvencí <UXXXX> a zapíše výsledek do czech-ISO2.txt.
| 3> SETFONT topaz 8 CHARSET ISO-8859-16 3> CHARSETCONVERT polish.txt X-ATO-PL TOCHARSET ISO-8859-16 |
Přečte textový soubor polish.txt, převede znakovou sadu z X-ATO-PL (znaková sada souborů polského katalogu OS3.x) na ISO-8859-16 a zobrazí výsledek v aktuálním okně pomocí fontu topaz.font, velikost 8, v ISO-8859-16.



