[Résolu]Trier lignes en fonction d'un nb de similitudes

Discussions à propos du tableur Calc.
Les questions sur les macros doivent être postées dans la section dédiée en dessous.

Modérateur : Vilains modOOs

Règles du forum
Cette section est uniquement dédiée au tableur Calc. Vous ne devez pas poster ici de questions sur les macros mais utiliser la section éponyme.
lesampaud
Membre lOOyal
Membre lOOyal
Messages : 30
Inscription : 29 août 2013 08:11

[Résolu]Trier lignes en fonction d'un nb de similitudes

Message par lesampaud »

Bonjour

Alors est ce que mon titre est clair, j'en doute mais je vais tenter de m'expliquer
J'ai un tableau extrait d'une application qui me donne 20000 lignes de deux colonnes.
La première colonne comporte l'identification de la personne ou de l'entreprise Nom prénom mélangés ex : DUPONT Albert
La seconde colonne comporte des montants positifs et négatifs
J'ai constaté que bon nombre de personnes se retrouvaient sur plusieurs lignes. Mais bien entendu il y a quelques variantes (un espace en trop en nom et prénom) inversion nom et prénom...

Ma question est : quelle solution pourrait s'offrir à moi afin de faire un tri ou alimente une colonne pour trier ou marquer les lignes dont au moins 6 caractères sonsécutifs soint identiques.

Je ne peux malheureusement pas fournir le tableau car il revêt un caractère soumis au secret professionnel.

En vous remerciant
Dernière modification par lesampaud le 10 avr. 2017 17:54, modifié 3 fois.
au bureau : libreoffice 7.3.0.3 sous W10, ordis d'administration bridés pour les mises à jour
Avatar de l’utilisateur
MrPropre
MOOdérateur
MOOdérateur
Messages : 1139
Inscription : 01 oct. 2008 16:54

Re: rechercehr des caractère identiques dans cellules

Message par MrPropre »

Bonjour,
lesampaud a écrit :Je ne peux malheureusement pas fournir le tableau car il revêt un caractère soumis au secret professionnel.
Cet argument n'est pas recevable. Il vous appartient de fournir un document anonymisé :
lesampaud a écrit : ex : DUPONT Albert
A vous de continuer à compléter pour avoir matière à vous aider.
lesampaud a écrit :Alors est ce que mon titre est clair,
Profitez-en pour corriger le mot "rechercehr"
Nettoyez votre PC du piratage, utilisez des logiciels libres à chaque lavage.
Une seule dose de OpenOffice suffit à éliminer durablement toute trace de MS-Office.
lesampaud
Membre lOOyal
Membre lOOyal
Messages : 30
Inscription : 29 août 2013 08:11

Re: trier lignes en fonction d'1 certain nombre de similitud

Message par lesampaud »

J'ai modifié le titre et anonymiser mon tableau

Je précise au cas où cela soit nécessaire que je travaille sous la version 4.3.7.2

Merci de l'aide

Bonne soirée
Vous ne pouvez pas consulter les pièces jointes insérées à ce message.
au bureau : libreoffice 7.3.0.3 sous W10, ordis d'administration bridés pour les mises à jour
Avatar de l’utilisateur
micmac
RespOOnsable forum
RespOOnsable forum
Messages : 9252
Inscription : 28 août 2010 08:45

Re: trier lignes en fonction d'1 certain nombre de similitud

Message par micmac »

Bonjour,
votre signature a écrit :Bureau : libreoffice 3.6.5.2 sous W7
[b][color=#404080]lesampaud[/color][/b] a écrit :je travaille sous la version 4.3.7.2
Cliquez sur ce lien pour accéder à votre signature et y porter cette information
Touche Ctrl de Windows = touche cmd⌘ sur Mac
Outils > Options sur Windows = OpenOffice > Préférences sur Mac
lesampaud
Membre lOOyal
Membre lOOyal
Messages : 30
Inscription : 29 août 2013 08:11

Re: trier lignes en fonction d'1 certain nombre de similitud

Message par lesampaud »

exact, la MAJ s'est faite cette semaine

merci
au bureau : libreoffice 7.3.0.3 sous W10, ordis d'administration bridés pour les mises à jour
Jeff
GourOOu
GourOOu
Messages : 9628
Inscription : 18 sept. 2006 09:40
Localisation : France

Re: trier lignes en fonction d'1 certain nombre de similitud

Message par Jeff »

Bonjour,

Ce que j’ai testé :
  • Dans une colonne à part, extraction des 6 premiers caractères
  • Dans une autre colonne, avce la fonction NB.SI, je cherche ces 6 caractères n’importe où ailleurs dans d’autres cellules
Avec un PC équipée d’un processeur 4 cœurs cadencé à 3 GHz et 8 Mo de Ram, il faut plusieurs minutes de calcul pour 2 500 lignes, je n’ose même pas imaginer avec 20 000 lignes :aie:

N’aurais-tu pas intérêt à essayer de rapatrier ton classeur vers Base (par exemple, consulter https://forum.openoffice.org/fr/forum/v ... lc#p274809), et d’essayer avec une requête adaptée ?

A +
lesampaud
Membre lOOyal
Membre lOOyal
Messages : 30
Inscription : 29 août 2013 08:11

Re: trier lignes en fonction d'1 certain nombre de similitud

Message par lesampaud »

Bonjour,

Ce que j’ai testé :
Jeff a écrit :Dans une colonne à part, extraction des 6 premiers caractères
Ce serait quoi le formule pour trouver 6 caractère parmi une chaîne de caractère ??
Jeff a écrit : N’aurais-tu pas intérêt à essayer de rapatrier ton classeur vers Base
Peux tu m'expliquer ce que tu entends par base???

Merci de ton aide
Dernière modification par Oukcha le 18 mars 2017 14:12, modifié 1 fois.
Raison : Balise 'quote' corrigée + citations réduites à l'essentiel
au bureau : libreoffice 7.3.0.3 sous W10, ordis d'administration bridés pour les mises à jour
Jeff
GourOOu
GourOOu
Messages : 9628
Inscription : 18 sept. 2006 09:40
Localisation : France

Re: trier lignes en fonction d'1 certain nombre de similitud

Message par Jeff »

Pour extraire les 6 premiers caractères sans espaces surnuméraires, en D2 :

Code : Tout sélectionner

=SUPPRESPACE(GAUCHE(A2;6))
(à copier sur la colonne, une fois la formule validée par Entrée, se repositionner sur la cellule, puis clic sur la poignée de recopie (le petit carré noir en bas à droite) et tirer vers le bas sans lâcher, pour recopier la formule sur une cinquaine de ligne, je préfère que tu commence "petit", ça te donnera une idée avec 2500, voir 20000 cellules :aie: )

Pour comparer le contenu de D2 sur l'ensemble des données, il faut au préalable utiliser le menu Outils > Options > Calc > Calculer > Autoriser les caractères génériques dans les formules, ensuite en E2, saisir la formule suivante :

Code : Tout sélectionner

=NB.SI($A3:$A$2601;".*"&D2&".*")
(à copier sur la colonne, une fois la formule validée par Entrée, se repositionner sur la cellule, puis double-clic sur la poignée de recopie (le petit carré noir en bas à droite) pour recopier la formule sur la longueur remplie de la colonne E)
lesampaud a écrit :ce que tu entends par base
Base, c'est le "petit nom" du logiciel de base de données de Apache OpenOffice et dérivés.
lesampaud
Membre lOOyal
Membre lOOyal
Messages : 30
Inscription : 29 août 2013 08:11

Re: trier lignes en fonction d'1 certain nombre de similitud

Message par lesampaud »

L'écho je teste lundi
au bureau : libreoffice 7.3.0.3 sous W10, ordis d'administration bridés pour les mises à jour
lesampaud
Membre lOOyal
Membre lOOyal
Messages : 30
Inscription : 29 août 2013 08:11

Re: trier lignes en fonction d'1 certain nombre de similitud

Message par lesampaud »

Hello

Je reviens vers mon sujet, je pense que ce je demandais, était trop pour mon PC, ce dernier a décidé de rendre l'âme sans me laisser le temps de sauvegarder mes données, toutefois, j'ai testé la solution de Jeff, ça fonctionne mais bien trop long pour plus de lignes.

Merci et bonne soirée
au bureau : libreoffice 7.3.0.3 sous W10, ordis d'administration bridés pour les mises à jour