segunda-feira, 31 de outubro de 2016

Padrões de codificação de caracteres

Nesta aula iniciamos uma nova unidade relacionada com os conceitos básicos da multimédia, começando pelo Texto.




Os padrões de codificação de caracteres descrevem o relacionamento entre o conjunto de caracteres com um conjunto de outra coisa, por exemplo impulsos elétricos ou números com o objetivo de facilitar o armazenamento de texto em computadores e a sua transmissão através de redes de telecomunicação. Os exemplos mais comuns são o código Morse que codifica as letras do alfabeto latino e os numerais como sequências de pulsos elétricos de longa e curta duração, existe também o ASCII (que vamos abordar mais à  frente) que codifica os mesmos caracteres do codigo Morse e ainda outros símbolos através de números inteiros e da representação binária. 

Código ASCII


ASCII (do inglês American Standard Code for Information Interchange) é um código binário (cadeias de bits: 0s e 1s) que codifica um conjunto de 128 sinais: 95 sinais gráficos (letras do alfabeto latino, sinais matemáticos e sinais de pontuação) e 33 sinais de controle, utilizando portanto apenas 7 bits para representar todos os seus símbolos.

A codificação ASCII é usada para representar textos em computadores, equipamentos de comunicação, entre outros dispositivos. Desenvolvida a partir de 1960, grande parte das codificações de caracteres modernas a herdaram como base. Os sinais não-imprimíveis, conhecidos como caracteres de controlo, são amplamente utilizados em dispositivos de comunicação e afetam o processamento do texto.




Código Unicode

Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Originalmente publicado no livro The Unicode Standard 1, 2 o padrão consiste de pouco mais de 107 mil caracteres, um conjunto de diagramas de códigos para referência visual, uma metodologia para codificação e um conjunto de codificações padrões de caracteres, uma unumeração de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referência, além de regras para normalização, decomposição e ordenação alfabética.




Webgrafia:
https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgQVtkYy2inrAjw2IxwUr9GYjwbfQ59USSJqI1a1SYivcB4NRnTuZE5tztjH6J_pbEucaqw0uvSpDv71qL2SFrcaS5CXJwFGvuSU-VwAt7DitzLL5JCfKgpdA2n85L_tWUoumo4Sj4M3r-b/s1600/unicode-table-medium-postbit-745.png
https://pt.wikipedia.org/wiki/Codifica%C3%A7%C3%A3o_de_caracteres
https://pt.wikipedia.org/iki/ASCII
http://docplayer.com.br/docs-images/21/1258930/images/4-0.png
https://pt.wikipedia.org/wiki/Unicode
http://www.biega.com/ISO-8859-1.gif

Sem comentários:

Enviar um comentário