Articles of utf 8

Python y normalización de caracteres

Hola, recupero datos basados ​​en texto utf8 de una fuente extranjera que contiene caracteres especiales como u”ıöüç” mientras quiero normalizarlos en inglés, como “ıöüç” -> “iouc” . ¿Cuál sería la mejor manera de lograr esto?

¿Cómo hacer “usar My :: defaults” con los valores predeterminados modernos de perl & utf8?

Quiero hacer un módulo para mi propio “uso predeterminado”, por ejemplo: use My::perldefs; con el siguiente contenido (basado principalmente en la publicación de Tchrist ). use 5.014; use strict; use features qw(switch say state); no warnings; use warnings qw(FATAL closed threads internal debugging pack substr malloc unopened portable prototype inplace io pipe unpack regexp deprecated […]

¿Por qué Java BufferedReader () no lee correctamente los caracteres en árabe y chino?

Intento leer un archivo que contiene caracteres en inglés y árabe en cada línea y otro archivo que contiene caracteres en inglés y chino en cada línea. Sin embargo, los caracteres de árabe y chino no se muestran correctamente, solo aparecen como signos de interrogación. ¿Alguna idea de cómo puedo resolver este problema? Aquí está […]

¿Por qué es opcional el valor de retorno de String.addingPercentEncoding ()?

La firma del método String para el porcentaje de escape es: func addingPercentEncoding(withAllowedCharacters: CharacterSet) -> String? (Esto era stringByAddingPercentEncodingWithAllowedCharacters en Swift 2.) ¿Por qué este método devuelve un opcional? La documentación dice que el método devuelve nil “si la transformación no es posible”, pero no está claro en qué circunstancias podría fallar la transformación de […]

Usando .NET cómo convertir archivos de texto codificados ISO 8859-1 que contienen caracteres acentuados Latin-1 a UTF-8

Me están enviando archivos de texto guardados en formato ISO 88591-1 que contienen caracteres acentuados del rango Latin-1 (así como ASCII az normal, etc.). ¿Cómo convierto estos archivos a UTF-8 usando C # para que los caracteres acentuados de un solo byte en ISO 8859-1 se conviertan en caracteres UTF-8 válidos? Intenté usar un StreamReader […]

Problema de encoding de Java 8 UTF-8 (¿error de Java?)

Hay una incoherencia al crear una cadena con encoding UTF-8. Ejecute este código: public static void encodingIssue() throws IOException { byte[] array = new byte[3]; array[0] = (byte) -19; array[1] = (byte) -69; array[2] = (byte) -100; String str = new String(array, “UTF-8”); for (char c : str.toCharArray()) { System.out.println((int) c); } } En Java […]

cómo cambiar la encoding del archivo fuente en el proyecto csharp (visual studio / msbuild machine)?

¿Hay alguna manera de obligar a VS a usar siempre Unicode, en lugar de algo extraño de ISO? Estoy trabajando en un proyecto de winapp cs utilizando Visual Studio 2008 en Vista (configuración regional polaca). El problema aparece cuando construyo el proyecto en Win Server 2003 (configuración regional en inglés); luego, el diacrítico polaco desaparece. […]

Caracteres Unicode en PDF ggplot Salida

¿Cómo puedo usar caracteres Unicode para tags, títulos y cosas similares en un diagtwig PDF creado con ggplot2? Considere el siguiente ejemplo: library(ggplot2) qplot(Sepal.Length, Petal.Length, data=iris, main=”Aʙᴄᴅᴇғɢʜɪᴊᴋʟᴍɴᴏᴘǫʀsᴛᴜᴠᴡxʏᴢ”) ggsave(“t.pdf”) El título de la gráfica usa caracteres Unicode (letras mayúsculas), que en el resultado aparecen como … El problema ocurre solo con diagtwigs de pdf; si reemplazo […]

Conversión de punto de código unicode a carácter de cadena en Ruby

Tengo estos valores de una base de datos Unicode, pero no estoy seguro de cómo traducirlos a la forma legible por humanos. ¿Cómo se llaman estos? Aquí están: U+2B71F U+2A52D U+2A68F U+2A690 U+2B72F U+2B4F7 U+2B72B ¿Cómo puedo convertir estos símbolos allí legibles?

Android Studio: carácter no identificable para codificar UTF-8

Después de importar mi proyecto de Eclipse a Android Studio, tengo el siguiente error: Error: unmappable character for encoding UTF-8 Estudio Android : 0.5.8