• Home
  • Corsi

    Informazioni sui corsi

    • Tutti i corsi
    • Diventa un insegnante
    • Profilo insegnante
    Fondamenti di programmazione: le basi del linguaggio C++

    Fondamenti di programmazione: le basi del linguaggio C++

    €29.99 €9.99
    Read More
    D4F Games
  • Develop4fun
    • Chi siamo
    • Portfolio
    • Eventi
    • Galleria
    • Negozio
    • FAQ
  • Articoli
  • Contattaci
  • Accedi

Cerca

Hai qualche domanda?
contact@develop4fun.com
Develop4fun
  • Home
  • Corsi

    Informazioni sui corsi

    • Tutti i corsi
    • Diventa un insegnante
    • Profilo insegnante
    Fondamenti di programmazione: le basi del linguaggio C++

    Fondamenti di programmazione: le basi del linguaggio C++

    €29.99 €9.99
    Read More
    D4F Games
  • Develop4fun
    • Chi siamo
    • Portfolio
    • Eventi
    • Galleria
    • Negozio
    • FAQ
  • Articoli
  • Contattaci
  • Accedi
    • Categorie

      • Backend
        • PHP e MySQL
      • C#
      • C++
      • CMS
      • CSS
      • Frontend
        • CSS
        • Html
        • Javascript
      • Html
      • Javascript
      • Javascript
      • Linguaggio di programmazione
        • C#
        • C++
        • Javascript
        • Lua
      • LOVE2D
      • Lua
      • Phaser 3
      • PHP e MySQL
      • RayLib
      • Sviluppo
        • Linguaggio di programmazione
          • C#
          • C++
          • Javascript
          • Lua
        • Videogiochi
          • LOVE2D
          • Phaser 3
          • RayLib
          • Unity3D
          • Unreal Engine
        • Web
          • Backend
            • PHP e MySQL
          • CMS
          • Frontend
            • CSS
            • Html
            • Javascript
      • Unity3D
      • Unreal Engine
      • Videogiochi
        • LOVE2D
        • Phaser 3
        • RayLib
        • Unity3D
        • Unreal Engine
      • Web
        • Backend
          • PHP e MySQL
        • CMS
        • Frontend
          • CSS
          • Html
          • Javascript

Html

Home » Articoli » Simboli e caratteri speciali: ASCII, ISO, HTML

Simboli e caratteri speciali: ASCII, ISO, HTML

  • Pubblicato da Antonella De Chiara
  • Categorie Html, PC, Web
  • Data 30 Agosto 2019
  • Commenti 0 commenti
html
(Ultimo aggiornamento: 21 Settembre 2021)

Tabelle dei caratteri speciali

La sigla “ASCII” sta per: “American Standard Code for Information Interchange”, cioè “Standard americano per lo scambio di informazioni”. Venne proposto nel 1963 da A.N.S.I (American National Standard Institute) e divenne definitivo nel 1968.

Il codice ASCII fu inventato per le comunicazioni fra telescriventi (infatti ci sono dei codici di comandi specifici che sono quasi incomprensibili oggi ma che al tempo avevano la loro funzione), poi man mano è diventato uno standard mondiale. Si trattava di una codifica a 7 bit che successivamente, per non confonderlo con le estensioni a 8 bit proposte successivamente, venne chiamato US-ASCII. Inizialmente l’ottavo bit, mancante nella tabella US-ASCII, era utilizzato per i controlli di parità finalizzati alla determinazione degli errori di trasmissione.

La tabella ASCII in origine includeva quindi la definizione di 128 caratteri di cui 33 non stampabili definiti solitamente come caratteri di controllo:

BinaryDecHexAbbrCDescription
000 0000 0 00 NUL \0 Null character
000 0001 1 01 SOH  Start of Header
000 0010 2 02 STX  Start of Text
000 0011 3 03 ETX  End of Text
000 0100 4 04 EOT  End of Transmission
000 0101 5 05 ENQ  Enquiry
000 0110 6 06 ACK  Acknowledgment
000 0111 7 07 BEL \a Bell
000 1000 8 08 BS \b Backspace
000 1001 9 09 HT \t Horizontal Tab
000 1010 10 0A LF \n Line feed
000 1011 11 0B VT \v Vertical Tab
000 1100 12 0C FF \f Form feed
000 1101 13 0D CR \r Carriage return
000 1110 14 0E SO  Shift Out
000 1111 15 0F SI  Shift In
001 0000 16 10 DLE  Data Link Escape
001 0001 17 11 DC1  Device Control 1 (oft. XON)
001 0010 18 12 DC2  Device Control 2
001 0011 19 13 DC3  Device Control 3 (oft. XOFF)
001 0100 20 14 DC4  Device Control 4
001 0101 21 15 NAK  Negative Acknowledgement
001 0110 22 16 SYN  Synchronous Idle
001 0111 23 17 ETB  End of Trans. Block
001 1000 24 18 CAN  Cancel
001 1001 25 19 EM  End of Medium
001 1010 26 1A SUB  Substitute
001 1011 27 1B ESC \e Escape
001 1100 28 1C FS  File Separator
001 1101 29 1D GS  Group Separator
001 1110 30 1E RS  Record Separator
001 1111 31 1F US  Unit Separator
111 1111 127 7F DEL  Delete

La codifica US-ASCII consente quindi la rappresentazione numerica dei caratteri alfanumerici, simboli di punteggiatura e altri simboli. La rappresentazione mediante codifica numerica è necessaria in quanto il computer può “capire” solo sequenze di bit. Per esempio il carattere “@” è rappresentato dal codice ASCII “64”, “Y” dal ‘”89″, “+” dal “43”, ecc.

Quando qualcuno richiede delle informazioni in formato ASCII (per esempio il vostro curriculum, oppure un articolo, ecc) significa che richiede un testo salvato in una modalità standard facilmente leggibile da qualsiasi sistema operativo e programma.

Infatti il formato ASCII è universalmente riconosciuto da tutti i computer, cosa non è vera nel caso di testi “formattati”, cioè quelli che presentano caratterizzazioni tipografiche come la sottolineature, stili, grassetti, etc. Ecco l’elenco dei caratteri US-ASCII stampabili

Poiché il numero dei simboli usati nelle lingue naturali è di molto più grande dei caratteri codificabili con US-ASCII è stato necessario espanderne il set di codifica. Le varie estensioni utilizzavano 128 caratteri aggiuntivi codificabili utilizzando l’ottavo bit disponibile in ogni byte.

L’IBM introdusse allora una codifica a 8 bit sui suoi IBM PC con varianti per i diversi paesi. Le codifiche IBM risultavano ASCII-compatibili, poiché i primi 128 caratteri del set mantenevano il valore originario (US-ASCII). Le varie codifiche vennero divise in pagine (code page).

Le diverse code page differivano nei 128 caratteri aggiuntivi codificati utilizzando l’ottavo bit disponibile in ogni byte. I pc costruiti per il Nord America utilizzavano la code page 437, per la Grecia la code page 737, per l’Italia e la Francia la code page 850.

Per vedere in DOS la pagina attiva occorre usare il comando dos chcp.
Ecco il set di caratteri (esclusi quelli US-ASCII) relativi alla code page 850

In seguito al proliferare di codifiche proprietarie, l’ISO rilasciò uno standard denominato ISO/IEC 8859 contenente un’estensione a 8 bit del set ASCII. Il più importante fu l’ISO/IEC 8859-1, detto anche Latin1, contenente i caratteri per i linguaggi dell’Europa Occidentale. Tale specifica conteneva per la precisione la codifica di 192 caratteri grafici.

Una particolarità dell’ISO/IEC 8859 rispetto agli altri caratteri estesi è che i caratteri dal 128 al 159, i cui 7 bit più bassi corrispondono ai caratteri di controllo ASCII, non sono usati per non creare problemi di compatibilità.

I codici 00–1F e 7F–9F non sono quindi assegnati ad alcun carattere da parte dell’ ISO/IEC 8859-1.

Caratteri grafici
I codici 00–1F e 7F–9F non sono assegnati ad alcun carattere da parte dell’ ISO/IEC 8859-1.

Lo standard ISO/IEC 8859 rappresenta la base di partenza per le codifiche ISO-8859-1 e Windows-1252. Entrambe le codifiche sono un soprainsieme dell’ ISO/IEC 8859-1; Aggiungono altri simboli ai 191 caratteri standard.

ISO-8859-1 è la codifica di default dei documenti HTML distribuiti mediante il protocollo HTTP con MIME Type del tipo “text/”. Molti browser e clienti di posta interpretano ISO-8859-1 come Windows-1252 in modo da sistemare alcuni errori dovuti alla codifica ma questo non è un comportamento corretto ed è quindi da evitare (da parte di chi sviluppa i browser) .

ISO-8859-1

Windows-1252 è stato creato da Microsoft  (è un set compatibile con l’ISO 8859-1) ed utilizzato come lo standard di default per le versioni europee di Windows. Windows-1252 coincide con ISO-8859-1 anche per gli intervalli da 0x00 a 0x7F e da 0xA0 a 0xFF, ma non nell’intervallo 0x80 a 0x9F.

Una nuova codifica chiamata Unicode fu sviluppata nel 1991 per poter codificare più caratteri in modo standard e permettere di utilizzare più set di caratteri estesi (es. greco e cirillico) in un unico documento; questo set di caratteri è oggi largamente diffuso. Inizialmente prevedeva 65.536 caratteri (code points) ed è stato in seguito esteso a 1.114.112 (= 220 + 216) e finora ne sono stati assegnati circa 101.000. I primi 256 code point ricalcano esattamente quelli dell’ISO 8859-1.

La maggior parte dei codici sono usati per codificare lingue come il cinese, il giapponese ed il coreano. L’elenco completo delle tabelle unicode è raggiungibile al seguente link: http://www.unicode.org/charts/

Visualizzazioni post: 1.276

Tag:ASCII, caratteri speciali, chcp, code page, DOS, HTML 5, ISO, ISO-8859-1, Latin1, Microsoft, Testo HTML, Unicode, US-ASCII, Windows, Windows-1252

  • Share:

INFORMAZIONI SULL'AUTORE

Antonella De Chiara
Antonella De Chiara

Appassionata di giochi di ruolo giapponesi, genere che ha scoperto grazie alla saga Final Fantasy e approfondito con i capolavori usciti negli ultimi anni, s’interessa al retrogaming, rigiocando e programmando vecchie glorie come Monkey Island, Prince of Persia o vecchi capolavori marchiati Nintendo.
Antonella comincia il suo percorso giornalistico in Italia, lavorando con Gamerepublic, PS Mania e Pokémon Mania. Si trasferisce in Francia per studiare la programmazione web e gamedev: grazie a questo percorso anomalo nasce Develop4fun.

Articolo precedente

[Unity] Programmare in C# – Coroutine
30 Agosto 2019

Articolo successivo

Programmare in C# – Vettori (Arrays)
4 Settembre 2019

Ti potrebbe anche piacere

Steam
Come pubblicare un videogioco su Steam?
21 Settembre, 2021
Censura internet Cina
Censura internet: la nuova frontiera del controllo
12 Maggio, 2021
Programming
5 consigli utili per lavorare da casa in smart working riducendo i consumi energetici
13 Aprile, 2021

Lascia un commento Annulla risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Cerca

Impara a programmare videogiochi web con Phaser 3

Impara a programmare videogiochi web con Phaser 3

€49.99 €9.99
HTML e CSS: Corso di programmazione per principianti

HTML e CSS: Corso di programmazione per principianti

€69.99 €9.99
[Lua & LOVE2D] Introduzione alla programmazione dei videogiochi

[Lua & LOVE2D] Introduzione alla programmazione dei videogiochi

€49.99 €9.99
D4F Games

Ultimi articoli pubblicati

unity3d
Chi sono gli sviluppatori nel mondo dei videogiochi?
22Nov2021
[Unreal Engine] Un nuovo fantastico asset GRATUITO!
[Unreal Engine] Slay, un nuovo fantastico asset GRATUITO!
22Set2021
Steam
Come pubblicare un videogioco su Steam?
21Set2021

© Develop4fun.it by Develop4fun  2016-2022. Tutti i diritti riservati.

Gestisci Consenso Cookie
Usiamo cookie per ottimizzare il nostro sito web ed i nostri servizi.
Funzionale Sempre attivo
L'archiviazione tecnica o l'accesso sono strettamente necessari al fine legittimo di consentire l'uso di un servizio specifico esplicitamente richiesto dall'abbonato o dall'utente, o al solo scopo di effettuare la trasmissione di una comunicazione su una rete di comunicazione elettronica.
Preferenze
L'archiviazione tecnica o l'accesso sono necessari per lo scopo legittimo di memorizzare le preferenze che non sono richieste dall'abbonato o dall'utente.
Statistiche
L'archiviazione tecnica o l'accesso che viene utilizzato esclusivamente per scopi statistici. L'archiviazione tecnica o l'accesso che viene utilizzato esclusivamente per scopi statistici anonimi. Senza un mandato di comparizione, una conformità volontaria da parte del vostro Fornitore di Servizi Internet, o ulteriori registrazioni da parte di terzi, le informazioni memorizzate o recuperate per questo scopo da sole non possono di solito essere utilizzate per l'identificazione.
Marketing
L'archiviazione tecnica o l'accesso sono necessari per creare profili di utenti per inviare pubblicità, o per tracciare l'utente su un sito web o su diversi siti web per scopi di marketing simili.
Gestisci opzioni Gestisci servizi Gestisci fornitori Per saperne di più su questi scopi
Preferenze
{title} {title} {title}