Articles of encoding de caracteres

¿Cómo se usa WideCharToMultiByte correctamente?

He leído la documentación en WideCharToMultiByte , pero estoy atascado en este parámetro: lpMultiByteStr [out] Pointer to a buffer that receives the converted string. No estoy muy seguro de cómo inicializar correctamente la variable y alimentarla a la función

Algoritmo de detección de encoding de caracteres

Estoy buscando una manera de detectar conjuntos de caracteres dentro de los documentos. He estado leyendo la implementación de detección de conjuntos de caracteres de Mozilla aquí: Detección universal de caracteres También encontré una implementación de Java llamada jCharDet: JCharDet Ambos se basan en investigaciones llevadas a cabo utilizando un conjunto de datos estáticos. Lo […]

¿Cuáles son las diferencias entre utf8_general_ci y utf8_unicode_ci?

Posible duplicado: Cuál es la diferencia entre utf8_general_ci y utf8_unicode_ci Tengo dos opciones para unicode que parecen prometedoras para una base de datos mysql. utf8_general_ci unicode (multilingual), case-insensitive utf8_unicode_ci unicode (multilingual), case-insensitive ¿Puede explicar cuál es la diferencia entre utf8_general_ci y utf8_unicode_ci? ¿Cuáles son los efectos de elegir uno sobre el otro cuando se diseña […]

Usando Unicode en el código fuente de C ++

¿Cuál es la encoding estándar del código fuente de C ++? ¿El estándar de C ++ incluso dice algo sobre esto? ¿Puedo escribir fuente C ++ en Unicode? Por ejemplo, ¿puedo usar caracteres no ASCII como caracteres chinos en los comentarios? Si es así, ¿está permitido Unicode completo o solo un subconjunto de Unicode? (por […]

Codificación de caracteres jQuery AJAX

Actualmente estoy codificando un sitio web francés. Hay una página de progtwigción, donde un enlace en el lateral se puede utilizar para cargar el horario de otro día. Aquí está el JS que estoy usando para hacer esto: function load(y) { $.get(y,function(d) { $(“#replace”).html(d); mod(); }); } function mod() { $(“#dates a”).click(function() { y = […]

¿Qué significa “Content-type: application / json; charset = utf-8 “¿en serio?

Cuando realizo una solicitud POST con un cuerpo JSON para mi servicio REST, incluyo Content-type: application/json; charset=utf-8 Content-type: application/json; charset=utf-8 en el encabezado del mensaje. Sin este encabezado, recibo un error del servicio. También puedo usar Content-type: application/json sin la porción ;charset=utf-8 . ¿Qué hace exactamente charset=utf-8 ? Sé que especifica la encoding de caracteres […]

Diferencias de formato Unicode, UTF, ASCII, ANSI

¿Cuál es la diferencia entre las Unicode , UTF8 , UTF7 , UTF16 , UTF32 , ASCII y ANSI ? ¿De qué manera son útiles para los progtwigdores?

La entrada Unicode recuperada a través de los componentes de entrada de PrimeFaces se corrompe

Cuando todavía estaba usando PrimeFaces v2.2.1, pude escribir entradas Unicode como chino con un componente de entrada PrimeFaces como y , y recuperar la entrada en buen estado en el método de bean administrado . Sin embargo, después de actualizar a PrimeFaces v3.1.1, todos esos personajes se convierten en Mojibake o signos de interrogación. Solo […]

¿Cómo hacer un conjunto de caracteres Unicode en cmd.exe por defecto?

El juego de caracteres 866 instalado por defecto en cmd.exe de Windows es pobre e inconviniente en comparación con el glorioso Unicode. ¿Puedo instalar Unicode de forma predeterminada o reemplazar cmd.exe a otra consola y hacerlo predeterminado para que programms lo use en lugar de cmd.exe? Entiendo que chcp 65001 cambia la encoding solo en […]

¿Cómo puedo encontrar caracteres que no sean ASCII en MySQL?

Estoy trabajando con una base de datos MySQL que tiene algunos datos importados de Excel . Los datos contienen caracteres que no son ASCII (guiones, etc.), así como retornos de carro ocultos o alimentaciones de línea. ¿Hay alguna manera de encontrar estos registros usando MySQL?