Articles of unicode

Caracteres en cadena cambiados después de descargar HTML de Internet

Usando el siguiente código, puedo descargar el HTML de un archivo de internet: WebClient wc = new WebClient(); // …. string downloadedFile = wc.DownloadString(“http://www.myurl.com/”); Sin embargo, a veces el archivo contiene caracteres “interesantes” como é to é , ← to ↠y フシギダネ a フシギダム. Creo que puede ser algo relacionado con diferentes tipos […]

😃 (y otros caracteres Unicode) en identificadores no permitidos por g ++

Estoy 😞 para encontrar que no puedo usar 😃 como un identificador válido con g ++ 4.7, incluso con la opción -fextended-identifiers habilitada: int main(int argc, const char* argv[]) { const char* 😃 = “I’m very happy”; return 0; } main.cpp: 3: 3: error: extraviar ‘\ 360’ en el progtwig main.cpp: 3: 3: error: extraviar […]

Escribir utf16 en el archivo en modo binario

Intento escribir un wstring para archivar con ofstream en modo binario, pero creo que estoy haciendo algo mal. Esto es lo que he intentado: ofstream outFile(“test.txt”, std::ios::out | std::ios::binary); wstring hello = L”hello”; outFile.write((char *) hello.c_str(), hello.length() * sizeof(wchar_t)); outFile.close(); Al abrir test.txt en, por ejemplo, Firefox con la encoding establecida en UTF16, se mostrará […]

Codificación de caracteres JSON: ¿el navegador UTF-8 está bien soportado o debería usar secuencias de escape numéricas?

Estoy escribiendo un servicio web que usa json para representar sus recursos, y estoy un poco atascado pensando en la mejor manera de codificar el json. Al leer el json rfc ( http://www.ietf.org/rfc/rfc4627.txt ) queda claro que la encoding preferida es utf-8. Pero el rfc también describe un mecanismo de escape de cadena para especificar […]

Codificación FPDF utf-8 (CÓMO-TO)

¿Alguien sabe cómo configurar la encoding en el paquete FPDF para utf-8? ¿O al menos a ISO-8859-7 (griego) que admite caracteres griegos? Básicamente quiero crear un archivo pdf que contenga caracteres griegos. Cualquier sugerencia ayudaría. Jorge

JSON y personajes que escapan

Tengo una cadena que se serializa en JSON en Javascript y luego se deserializa en Java. Parece que si la cadena contiene un símbolo de grado, entonces aparece un problema. Podría usar algo de ayuda para descubrir a quién culpar: ¿Es la implementación de Spidermonkey 1.8? (esto tiene una implementación JSON incorporada) ¿es Google gson […]

(grep) Regex para que coincida con caracteres que no sean ASCII?

En Linux, tengo un directorio con muchos archivos. Algunos de ellos tienen caracteres que no son ASCII, pero todos son UTF-8 válidos. Un progtwig tiene un error que impide que funcione con nombres de archivo que no sean ASCII, y tengo que averiguar cuántos se ven afectados. Iba a hacer esto con find y luego […]

Imprimir caracteres Unicode en el indicador de PowerShell

Estoy intentando configurar Mercurial para que imprima el estado del repository en el que me encuentro actualmente con PowerShell. Hasta ahora, tengo todo funcionando, pero me gustaría poder imprimir ‘☿’ cuando se encuentre en un repository. Desafortunadamente, parece que PowerShell tiene algunos problemas con la impresión de caracteres Unicode. En la respuesta aceptada para ¿Hay […]

Cómo almacenar unicode en MySQL?

¿Cómo almaceno Unicode en la edición gratuita de MySQL? No parece haber un tipo nvarchar como en SQL Server. ¿Unicode no es compatible con MySQL? Intenté usar text pero eso tampoco funciona.

python3 imprimir unicode a la consola de windows xp codificar cp437

Ok, quiero imprimir una cadena en mi consola de Windows XP. Hay varios caracteres que la consola no puede imprimir, así que tengo que codificar en stdout.encoding, que es ‘cp437’. pero al imprimir la cadena codificada, ‘ß’ se imprime como ‘\ xe1’. Después de decodificar de nuevo a Unicode e imprimir la cadena, obtengo la […]