Recherche de mots clefs

Analyser un contenu et connaitre quels sont les mots clefs qui ressortent le plus, ainsi que les expressions!
Générateurs d'expressions et de mots clefs dont voici les principaux aspects :
Le script va regrouper les 10 mots clefs principaux du document et chercher
pour chacun de ces 10 mots clefs une expression du document qui lui est rattachée. Le total des expressions trouvées
aura toujours un total de 10 expressions differentes.
Le noyau du script fonctionne avec des tableaux virtuelles pour l'extraction. Le moteur du script
compare les tableaux et filtre par mots clefs et expressions.
La BDD des mots à bannir est sous forme de tableau en dur pour mieux s'integrer au noyau du script et accederer la vitesse d'execution du script
lors des comparaisons de mots clefs.
L'algorithme decrit plus bas est un projet en Open Source. L'algorithme a été mis en place sur toute les pages de l'annuaire
du site. Il est visible dans le menu de droite "Ressources". Si vous êtes interressé de suivre l'évolution de
l'algorithme, l'analyse de son indexation dans Google et Yahoo, vous pouvez
me contacter.
ALGORITHME :
1° place tous les mots d'une chaine dans un tableau
2° enleve les mots bannis
3° groupe les mots identiques
4° compte et trie par ordre croissant des mots
5° NOYAU : cherche pour chaque mot l'expression qui lui appartient
6° NOYAU : pointe sur le mot du texte original et prend 1 mot devant et 2 mots
derriere pour une tentative de trouver une expression avec 4 mots.
7° FILTRE 1: enleve les mots bannis des expressions
8° FILTRE 1: enleve les doublons en debut et fin d'expression
9° FILTRE 2: enleve les doublons dans les expressions
Aucune extraction. Lancez une tentative d'extraction pour une recherche de mots clefs avec le formulaire ci-dessous.