[RESUELTO] Eliminar datos duplicados usando rutas de archivo

Discute sobre la aplicación de hojas de cálculo
Responder
Avatar de Usuario
novato2019
Mensajes: 3
Registrado: Dom Jun 16, 2019 6:07 pm

[RESUELTO] Eliminar datos duplicados usando rutas de archivo

Mensaje por novato2019 »

Hola
Para empezar tengo algo de experiencia con el excel 2007 pero 0 experiencia con el Calc, aunque observo varias similitudes, así que espero que no será tan difícil adaptarse. Utilizo Versión: 6.2.4.2 (x64) y Windows 10 home 64bits. Supongo que el Calc utiliza VBA a la hora de programar las macros.

He rellenado una hoja de calculo XLS con las rutas de archivos de un directorio, incluye subdirectorios y archivos. Incluye nombres de artículos, el problema es que algunos de estos artículos están duplicados y me interesa eliminarlos, y conservar solo un articulo.
Sé que puedo utilizar el filtro avanzado>sin duplicados etc. pero hay un inconveniente, dichos artículos se encuentran en subdirectorios diferentes, por lo que la ruta no es la misma, un ejemplo genérico seria el siguiente:

C:\Objetos\vasos\vaso rojo
C:\Objetos\copas\vaso rojo
C:\Objetos\menaje\vaso rojo

Así pues como puedo eliminar:
C:\Objetos\copas\vaso rojo
C:\Objetos\menaje\vaso rojo

Y conservar solo : C:\Objetos\vasos\vaso rojo ?

Es decir todas aquellas rutas de archivo (datos) en los que aparece duplicado el objeto vaso rojo?

Son un total de 64.650 artículos.

Configuré el filtro avanzado para que me copiara el resultado en la columna B, y así lo hizo, pero obviamente arrojó exactamente el mismo número de datos, ya que no hay ninguna ruta de archivo (dato) que esté exactamente duplicado.
Tal vez usando comodines? pero no sé como hacerlo.
Alguna idea?

Gracias de antemano.
Última edición por novato2019 el Dom Jun 23, 2019 4:03 pm, editado 1 vez en total.
OpenOffice 6.2.4.2 (x64)
Windows 10 64bits
Avatar de Usuario
fornelasa
Mensajes: 3268
Registrado: Jue Feb 17, 2011 8:30 pm
Ubicación: Estado de México, México.

Re: Eliminar datos duplicados usando rutas de archivo

Mensaje por fornelasa »

Mira si este ejemplo ordenado por la columna artículo y con formulas y filtro avanzado te sirve.
Saludos, Federico.
Adjuntos
articulos.ods
Artículos únicos
(12.91 KiB) Descargado 115 veces
lo 6.2.0 | aoo 4.1.6 | win 7/10
¡Un aplauso para todos los que luchan por proteger y promover la Web abierta!
Avatar de Usuario
novato2019
Mensajes: 3
Registrado: Dom Jun 16, 2019 6:07 pm

Re: Eliminar datos duplicados usando rutas de archivo

Mensaje por novato2019 »

Hola Federico, muchas gracias por tu aporte. :)
Hace mucho tiempo que no toco el excel de hecho la versión que tengo es del 2007 con que imaginate, ni siquiera lo tengo instalado; de hecho el listado xls lo hice con unos comandos vía CMD y lo abrí con el Calc.
No obstante intentaré extrapolar tus formulas a mi listado de rutas de archivos.
Lo que realmente necesito y no sé si se puede, es eliminar todos los archivos duplicados del directorio/subdirectorios, que puedan existir.
La primera idea fue obtener un listado de archivos, luego eliminar los duplicados, y quedarme solo con los archivos únicos, tal como tu has hecho, con el fin de tener claro que archivos están duplicados y como debería quedar el directorio una vez eliminados.
Acto seguido intentar eliminar los archivos duplicados del directorio/subdirectorios, que puedan haber (tal vez mediante una macro?); quizás dicha macro debería localizar los archivos duplicados y eliminarlos, es la opción que me parece más sencilla sin tener que programar una aplicación solo para conseguirlo.
La cuestión es que estoy observando que en OpenOffice aunque similar no es del todo igual que con VBA, no obstante he observado también que usando Option Compatible o una función,CompatibilityMode() facilita bastante las cosas. Tendré que familiarizarme un poco con el modo de hacer que tiene OpenOffice a la hora de programar macros, todo esto suponiendo que sea posible hacer lo que yo quiero hacer a través de una macro, y no sin antes hacer un backup del directorio por supuesto.

Puedes dar por hecho que si me servirá tu hoja de datos dado que has conseguido justo lo que yo quiero hacer, si tienes alguna idea sobre si es o no posible lo que yo quiero hacer, te agradecería infinitamente que me lo hicieras saber.

Gracias de nuevo.
Saludos, Álvaro.
OpenOffice 6.2.4.2 (x64)
Windows 10 64bits
mriosv
Mensajes: 2335
Registrado: Sab Dic 27, 2008 1:12 am
Ubicación: Galiza (España)

Re: Eliminar datos duplicados usando rutas de archivo

Mensaje por mriosv »

Puedes hacerlo creando una lista combinando en cada celda "DEL C:\.....\ficheroaborrar.*" de los ficheros que quieres borrar, la copias en un fichero .BAT y lo ejecutas.
Puedes usar "Subir adjunto" en Respuesta rápida - Editor Completo - Pestaña Subir adjunto
Apache OpenOffice 4, LibreOffice (Win10x64)
Avatar de Usuario
novato2019
Mensajes: 3
Registrado: Dom Jun 16, 2019 6:07 pm

Re: Eliminar datos duplicados usando rutas de archivo

Mensaje por novato2019 »

@ mriosv
Gracias por tu ayuda. :)
Finalmente he descargado un programilla que localiza los duplicados y los elimina.
OpenOffice 6.2.4.2 (x64)
Windows 10 64bits
Responder