Articles of unicode

(grep) Regex para que coincida con caracteres que no sean ASCII?

En Linux, tengo un directorio con muchos archivos. Algunos de ellos tienen caracteres que no son ASCII, pero todos son UTF-8 válidos. Un progtwig tiene un error que impide que funcione con nombres de archivo que no sean ASCII, y tengo que averiguar cuántos se ven afectados. Iba a hacer esto con find y luego […]

Imprimir caracteres Unicode en el indicador de PowerShell

Estoy intentando configurar Mercurial para que imprima el estado del repository en el que me encuentro actualmente con PowerShell. Hasta ahora, tengo todo funcionando, pero me gustaría poder imprimir ‘☿’ cuando se encuentre en un repository. Desafortunadamente, parece que PowerShell tiene algunos problemas con la impresión de caracteres Unicode. En la respuesta aceptada para ¿Hay […]

Cómo almacenar unicode en MySQL?

¿Cómo almaceno Unicode en la edición gratuita de MySQL? No parece haber un tipo nvarchar como en SQL Server. ¿Unicode no es compatible con MySQL? Intenté usar text pero eso tampoco funciona.

python3 imprimir unicode a la consola de windows xp codificar cp437

Ok, quiero imprimir una cadena en mi consola de Windows XP. Hay varios caracteres que la consola no puede imprimir, así que tengo que codificar en stdout.encoding, que es ‘cp437’. pero al imprimir la cadena codificada, ‘ß’ se imprime como ‘\ xe1’. Después de decodificar de nuevo a Unicode e imprimir la cadena, obtengo la […]

Mostrar caracteres árabes en la aplicación de consola C #

Creo que fue posible mostrar caracteres árabes en una aplicación de consola hace más de 13 años, desde los días de Windows ME. Ahora estoy usando Visual Studio 2013, en Windows 8, y el siguiente código muestra: ????? ?? Console.OutputEncoding = System.Text.Encoding.Unicode; Console.WriteLine(“مرحبا بك”); ¿Hay alguna forma de mostrar los caracteres árabes en la salida […]

Eliminar caracteres unicode de archivos de texto – sed, otros métodos bash / shell

¿Cómo elimino los caracteres Unicode de un grupo de archivos de texto en la terminal? Lo intenté pero no funcionó: sed ‘g/\u’U+200E’//’ -i *.txt Necesito eliminar estos unicodes de los archivos de texto U+0091 – sort of weird “control” space U+0092 – same sort of weird “control” space A0 – non-space break U+200E – left […]

¿Cómo puedo obtener los puntos de código Unicode de un personaje?

¿Cómo puedo extraer los puntos de código Unicode de un Character dado sin convertirlo primero en una String ? Sé que puedo usar lo siguiente: let ch: Character = “A” let s = String(ch).unicodeScalars s[s.startIndex].value // returns 65 pero parece que debería haber una manera más directa de lograr esto utilizando solo la biblioteca estándar […]

¿Manera fácil de eliminar acentos de una cadena Unicode?

Quiero cambiar esta oración: Et ça sera sa moitié. A : Et ca sera sa moitie. ¿Hay una manera fácil de hacer esto en Java, como lo haría en Objective-C? NSString *str = @”Et ça sera sa moitié.”; NSData *data = [str dataUsingEncoding:NSASCIIStringEncoding allowLossyConversion:YES]; NSString *newStr = [[NSString alloc] initWithData:data encoding:NSASCIIStringEncoding];

¿Cómo puedo realizar un personaje consciente de Unicode por comparación de caracteres?

Mi aplicación tiene un objective internacional, personas de muchos países lo usarán e ingresarán texto (texto que debo procesar) utilizando su propio idioma. Si, por ejemplo, tengo que enumerar las diferencias de dos cadenas usando una comparación carácter por personaje, ¿es suficiente este simple código C o me falta algo? var differences = new List<Tuple>(); […]

¿Cómo reemplazo los caracteres latinos acentuados en Ruby?

Tengo un modelo de ActiveRecord , Foo , que tiene un campo de name . Me gustaría que los usuarios puedan buscar por nombre, pero me gustaría que la búsqueda ignore mayúsculas y minúsculas y acentos. Por lo tanto, también estoy almacenando un campo canonical_name contra el cual buscar: class Foo validates_presence_of :name before_validate :set_canonical_name […]