Articles of fuzzy search

Fusionando dos marcos de datos usando coincidencia de cadenas difusa / aproximada en R

DESCRIPCIÓN Tengo dos conjuntos de datos con información que necesito fusionar. Los únicos campos comunes que tengo son cadenas que no coinciden perfectamente y un campo numérico que puede ser sustancialmente diferente La única forma de explicar el problema es mostrarle los datos. Aquí está a.csv y b.csv . Estoy intentando fusionar B con A. […]

Fuzzy string search library en Java

Estoy buscando una biblioteca de alto rendimiento de Java para la búsqueda de cadenas difusas. Existen numerosos algoritmos para encontrar cadenas similares, distancia Levenshtein, Daitch-Mokotoff Soundex, n-grams, etc. ¿Qué implementaciones Java existen? Pros y contras para ellos? Estoy al tanto de Lucene, ¿alguna otra solución o Lucene es la mejor? Encontré esto, ¿alguien tiene experiencia […]

¿Cómo hago una coincidencia aproximada de nombres de compañías en MYSQL con PHP para autocompletar?

Mis usuarios importan a través de cortar y pegar una cadena grande que contendrá los nombres de las compañías. Tengo una base de datos MYSQL existente y en crecimiento de nombres de compañías, cada una con un company_id único. Quiero poder analizar a través de la cadena y asignar una coincidencia difusa a cada uno […]

Coincidencia difusa usando T-SQL

Tengo una tabla Personas con datos personales, etc. Hay muchas columnas, pero las que nos interesan aquí son: addressindex , lastname y firstname donde addressindex es una dirección única que se abre hacia la puerta del apartamento. Entonces, si tengo ‘como a continuación’ dos personas con el lastname y uno los firstnames son los mismos, […]