Inne działy

 

Kodowanie znaków XML

 

Dokumenty XML mogą zawierać znaki inne niż ASCII, jak norweskie æ ø å, lub francuskie ê è é.

Aby uniknąć błędów, należy określić kodowanie XML lub zapisywać pliki XML jako Unicode.


 

Błędy kodowania XML

Jeśli wczytamy dokument XML, można uzyskać dwa różne błędy wskazujące na problemy z kodowaniem znaków:

Odnaleziono nieprawidłowy znak w treści tekstu.

Otrzymaszten błąd, jeśli kod XML zawiera znaki inne niż ASCII, i plik został zapisany jako jednobajtowy ANSI (lub ASCII) bez określonego kodowania.

 

<root>
<name>æåø</name>
</root>

Przejście z obecnego kodowania do określonego kodowania nie jest obsługiwane.

Otrzymasz ten błąd, jeśli plik XML został zapisany jako double-byte Unicode (lub UTF-16) z kodowaniem single-byte (Windows-1252, ISO-8859-1, UTF-8).

Możesz również uzyskać ten błąd, jeśli plik XML został zapisany, jako jednobajtowy ANSI (lub ASCII), z określonym kodowaniem double-byte (UTF-16).

 

<root>
<name>æåø</name>
</root>

Notatnik Windows Notatnik Windows zapisuje pliki domyślnie, jako single-byte ANSI (ASCII). Jeśli wybierzesz opcję "Zapisz jako...”, można określić dwubajtowy Unicode (UTF-16). Eksperymentuj z plikiem XML zapisz go formacie Unicode, ANSI, UTF-8 (uwaga, dokument nie zawiera atrybutu kodowania):

<?xml version="1.0"?>
<notatka>
<od>Janicki</od>
<do>Alek</do>
<wiadomość>Norwegian: æøå. French: êèé</wiadomość>
</notatka>

Spróbuj przeciągnąć pliki do przeglądarki, aby zobaczyć wynik. Różne przeglądarki wyświetlą różne wyniki.

 

<?xml version="1.0" encoding="us-ascii"?>

<?xml version="1.0" encoding="windows-1252"?>

<?xml version="1.0" encoding="ISO-8859-2"?>

<?xml version="1.0" encoding="UTF-8"?>

<?xml version="1.0" encoding="UTF-16"?>

 

Plik zapisany z odpowiednim kodowaniem:

<notatka >
<do>Alek</do>
<od>Janicki</od>
<nagłówek>Przypomnienie</nagłówek>
<wiadomość>Norwegian: æøå. French: êèé</wiadomość>
</notatka >

Plik zapisany z niewłaściwym kodowaniem:

<notatka>
<do>Alek</do>
<od>Janicki</od>
<nagłówek>Przypomnienier</nagłówek>
<wiadomość>Norwegian: CC8C%. French: C*C(C)</wiadomość>
</notatka>

 

Wniosek

  • Zawsze należy używać atrybutu kodowania
  • Użyj edytora, który obsługuje kodowanie
  • Upewnij się, że wiesz, co wykorzystuje kodowanie edytora
  • Użyj tego samego kodowania w swoim atrybutu kodowania

 

Zobacz nasze wszystkie kursy

WWW


HTML
HTML - Znaczniki
CSS - Tutorial
CSS - Selektory
PHP
JavaScript

XML

XSLT

Bazy danych


SQL
SQLite
MySQL
PostgreSQL

 

 

Programowanie


C
C++
C#
Java
VisualBasic
Python

Linux


Podstawy Linuxa
Bash
Linuks artykuły

Windows


Excel funkcje
Windows wskazówki
Outlook

Pozotałe działy


Programy
Rozrywka

 

 

 

This email address is being protected from spambots. You need JavaScript enabled to view it.