[PDF] [PDF] Sujet détude : distance de Levenshtein





Previous PDF Next PDF



Sujet détude : distance de Levenshtein

La distance de Levenshtein mesure le degré de similarité entre deux chaînes de spectives n1 et n2 consiste en la mise en œuvre l'algorithme suivant :.



Comparaison de textes: quelques approches

17 oct. 2013 2.3.6 Distance (d'édition) de Levenshtein . ... L'algorithme de Porter [Porter 1980] est le plus utilisé.



Un usage particulier de lalgorithme de Damerau-Levenshtein dans

23 sept. 2014 Un usage particulier de l'algorithme de. Damerau-Levenshtein dans le domaine occitan. Guylaine Brun-Trigaud. To cite this version:.



Distance entre mots

2 Distance de Levenshtein et programmation dynamique. 3 Distance de Stoilos. Thierry Lecroq (Univ. Rouen). Distance entre mots.



Correction orthographique de requêtes : lapport des distances de

good performance of the normalized edit distance of Levenshtein we have demonstrated in Dans [3] l'auteur essaye d'améliorer l'algorithme de.



Algorithmique

7 déc. 2015 Distance de Levenshtein. Principes. Chaîne de Multiplications de matrices. Plus longue sous-séquence commune. 3. Algorithmes gloutons.



Programmation Dynamique

2.1 Par l'exemple : Distance de Levenshtein. Ces algorithmes admettent des solutions récursives. Examinons par exemple le cas de la distance d'édition.



Distance entre mots

2 Distance de Levenshtein et programmation dynamique. 3 Distance de Stoilos. Thierry Lecroq (Univ. Rouen). Distance entre mots.



SIN5U1 – Algorithmique Avancée Devoir2 : Un correcteur

24 janv. 2013 Calcul de la distance de Levenshtein (ou distance d'édition). •. Construction et utilisation d'une table de ... cet algorithme dans le TD 6.



MASTER 1 MEEF : C Correction orthographique

La distance de Levenshtein entre deux mots u et v (de longueurs A.14 Déduire des questions précédentes un algorithme levenshtein qui calcule la distance ...



[PDF] Comparaison de mots : distance dédition

Soient x et y deux mots sur un alphabet ? On voudrait définir une distance entre ces mots Définition 1 Les opérations d'éditions sont les opérations 



[PDF] TP n 3 Distance dédition de Levenshtein - Université Côte dAzur

La distance d'édition de Levenshtein date de 1965 et mesure la différence entre deux chaînes de carac- tères Elle intervient dans les applications qui 



[PDF] Sujet détude : distance de Levenshtein

La distance de Levenshtein mesure le degré de similarité entre deux chaînes de caractères Elle est égale au nombre minimal de caractères qu'il faut 



[PDF] tp_l8dn003_20_04_cor_q3

29 mar 2020 · La distance de Levenshtein ou distance d'édition est une façon de mesurer à quel point deux mots se ressemblent



[PDF] MASTER 1 MEEF : C Correction orthographique - CNRS

A 9 En déduire un algorithme récursif (naïf) de calcul de la distance de Levenshtein entre deux mots def levenshtein_naif(uv): if len(u) == 0:



(PDF) Adaptation de la distance de Levenshtein Pour la Correction

29 mai 2019 · PDF On May 7 2014 Abdellah Yousfi and others published Adaptation de la distance de eles de langage et l'algorithme de Levenshtein



[PDF] LEVENSHTEIN ALGORITHM

The most common way to calculate this is by the dynamic programming approach A matrix is initialized to measure the Levenshtein distance between the first 



[PDF] Distance entre mots - IGM

2 Distance de Levenshtein et programmation dynamique 3 Distance de Stoilos Thierry Lecroq (Univ Rouen) Distance entre mots



[PDF] lapport des distances de Levenshtein et Stoilos - CISMeF

Methods: In addition to exact phonetic term matching we have tested two approximate string comparators The approximate comparators are the string distance



[PDF] Algorithmique - LRDE

7 déc 2015 · Distance de Levenshtein Principes Chaîne de Multiplications de matrices Plus longue sous-séquence commune 3 Algorithmes gloutons

:

Sujet d"étude : distance de Levenshtein

La distance de Levenshtein mesure le degré de similarité entre deux chaînes de caractères. Elle est

égale au nombre minimal de caractères qu"il faut supprimer, insérer ou remplacer pour passer d"une

chaîne à l"autre. C"est une distance au sens mathématique du terme, donc en particulier c"est un

nombre positif ou nul, et deux chaînes sont identiques si et seulement si leur distance est nulle. On a

aussi des propriétés de symétrie, et l"inégalité triangulairede la géométrie est ici aussi vérifiée.

Par exemple, pour passer de la chaîne NICHE à la chaîne CHIENS, il faut : supprimer les lettres N et I, insérer les lettres I, N et S. donc la distance de Levenshtein entre ces deux chaînes est au plus 5. On peut montrer

1qu"elle est

en faitexactement5. Notons au passage que cette distance ne s"intéresse pas aux déplacements de

caractères.

Une des applications de cette distance est la correction orthographique : lorsqu"une personne tape un

mot, on le compare à un dictionnaire. Si le mot est présent, on ne fait rien, sinon, on cherche parmi

les mots du dictionnaire ceux dont la distance de Levenshtein au mot tapé est inférieure à une limite

donnée. Les mots les plus proches sont suggérés comme remplacement en premier. La mesure de la distance de Levenshtein entre deux chaînesChaine1etChaine2, de longueurs re-

spectivesn1etn2, consiste en la mise en oeuvre l"algorithme suivant :fonctionDistanceDeLevenshtein (Chaine1,Chaine2 : chaîne ) : entier ;

N e st u n e ntier r eprésentant l a l ongueur d e l a p lus g rande c haîne m anipulable variables: n1,n2 : entiers t ailles d es d eux c haînes L e t ableau p ermettant d e c alculer l a d istance e ntre l es d eux c haînes O n e n r emplira q ue l es n 1 +1 p remières l ignes e t l es n 2 +1 p remières c olonnes d : tableau [0..N,0..N] d" entiers ; i , j ,c : entiers c e st l e c oût d une s ubstitution n1 Les remarques ne garantissent pas qu"on ne peut pas passer de NICHE à CHIENS en faisant moins de 5 opérations.

Pour illustrer le fonctionnement de cet algorithme, observons son déroulement avecChaine1="SAMEDI"

etChaine2="VENDREDI". On commence par initialiser le tableau :VENDREDI

012345678

S1 A2 M3 E4 D5 I6

Ensuite on le remplit ligne par ligne, de la gauche vers la droite. Voici deux étapes intermédiaires :

VENDREDI

012345678

S112345678

A22234

M3 E4 D5

I6VENDREDI

012345678

S112345678

A222345678

M333345678

E443 D5 I6

Dans le tableau de gauche, la case au dessus de celle calculée contient 4, la cas à gauche 3, le

minimum est donc 3, auquel on ajoute 1. La case en diagonale contient 3, auquel il faut ajouter 1 parce que la lettre A de SAMEDI n"est pas la lettre D de VENDREDI. Le minimum des deux valeurs est

4, c"est donc ce qu"on inscrit dans cette case.

Dans le tableau de droite, le principe est le même, mais la lettre E étant commune aux deux mots, on

n"ajoute rien à la case en diagonale, le minimum est donc 3. À la fin du remplissage, on obtient le tableau suivant :VENDREDI

012345678

S112345678

A222345678

M333345678

E443445567

D554445656

I665555665

Le chemin en gras indique les opérations à exécuter pour passer du premier mot au second : un déplacement horizontal indique une insertion, un déplacement vertical indique une suppression, un déplacement en diagonal indique une substitution. Ainsi, la séquence permettant de passer deSAMEDIàVENDREDIest : SAMEDI -> VSAMEDI -> VESAMEDI -> VENAMEDI -> VENDMEDI -> VENDREDI

soit deux insertions et trois substitutions. D"autres solutions sont possibles : il suffit d"aller de case

en case en partant de la case inférieure droite, et en allant vers une case réalisant le minimum calculé

dans cette case. Dans l"exemple qui nous occupe, peu importe à quel moment on fait les insertions et

les substitutions. On aurait ainsi pu faire : SAMEDI -> VAMEDI -> VEMEDI -> VENEDI -> VENDEDI -> VENDREDI

Le but de ce sujet d"étude est d"étudier cet algorithme sur quelques exemples, et de réaliser quelques

programmes le mettant en oeuvre et illustrant son fonctionnement. 2

ÉTUDE DE QUELQUES EXEMPLES

Pour bien comprendre comment fonctionne cet algorithme, étudions des exemples dans lesquels une seule opération est à réaliser. 1) Construir ela matrice issue du calcul de la distance entr ePAPAetPARA(exemple d"une unique substitution). 2) Construir ela matrice issue du calcul de la distance entr eFORTetFORET(exemple d"une unique insertion). 3) Construir ela matrice issue du calcul de la distance entr eLEONetLEO(exemple d"une unique suppression). 4) Construir ela matrice issue du calcul de la distance entr eNICHESetCHINE.

Déduire de cette matrice tous les moyens de passer d"un mot à l"autre en effectuant à chaque

étape une seule opération.

MISE EN OEUVRE DE L"ALGORITHME

1) Écrir eune fonction P ASCALprenant en argument deux chaînes, et calculant la distance de Lev- enshtein entre elles. Insérer cette fonction dans un programme permettant de la tester sur quelques chaînes saisies par l"utilisateur. 2)

Amélior erla fonction précédente de manièr eà lui fair eaf ficherla matrice calculée, ainsi qu"une

suite de transformations possibles permettant de passer d"une chaîne à l"autre. 3)

Amélior erencor ela fonction précédente de manièr eà lui fair eaf fichertoutesles suites de trans-

formations possibles.

UN EXEMPLE DE CORRECTION ORTHOGRAPHIQUE

On va étudier sur un exemple le mécanisme de suggestion de mots de substitutions lors d"une correc-

tion orthographique. 1) Écrir eune fonction pr enanten ar gumentune chaîne c, un entierket un tableautdeNchaînes, et renvoyant un tableaurde chaînes, ne contenant aucune chaîne si la chaînecest une des

chaînes det, et contenant sinontoutes les chaînesdetdont la distance àCest inférieure àk.

2)

T estervotr efonction à l"aide d"un pr ogrammedemandant à l"utilisateur de r emplirun dictionnair e

(le tableaut), puis lui demandant une chaîne (la chaînec) et une borne (l"entierk), et renvoyant

toutes les suggestions issues du dictionnaire si le mot tapé n"est pas dans le dictionnaire.

On pourra ajouter une option permettant à l"utilisateur d"ajouter le mot tapé au dictionnaire !

RECHERCHES COMPLÉMENTAIRES

Se documenter sur les sujets connexes aux notions étudiées dans ce sujet d"étude : distance entre

deux mots, correction orthographique...

Sources :

3quotesdbs_dbs35.pdfusesText_40
[PDF] correcteur orthographe python

[PDF] edit distance python

[PDF] distance kilometrique entre les communes de guadeloupe

[PDF] radars fixes maroc gps

[PDF] liste radar fixe maroc

[PDF] radars fixes maroc 2017

[PDF] emplacement radar fixe maroc

[PDF] radar vitesse maroc

[PDF] infraction radar fixe maroc

[PDF] lire une carte routière cm2

[PDF] via michelin

[PDF] apprendre ? lire une carte ign

[PDF] mappy

[PDF] calcul de distance entre deux coordonnées

[PDF] calcul distance coordonnées gps excel