Doublons et organisation.... vaste sujet?

Demande d'aide : c'est ici.
Répondre
Boriskof
Membre
Membre
Messages : 13
Inscription : 18 août 2025, 21:51
Status : Hors-ligne

Y-a-t-il déjà une rubrique dédiée à l'organisation des dosssiers (et leurs fichiers) ?

Voici une première question:
- Quel outil pour supprimer les doublons dans google drive: j'ai utilisé rmlint . Aucun doublon trouvé alors qu'il y en a des kilos.
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 6069
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

Bonjour,
il faut déja bien définir ce qu'est un doublon. Le même nom ne veut pas forcément dire que c'est un doublon.
Je ne sais pas si il existe des logiciels tout fait, mais un script python ou bash pour faire ça est simple (une fois qu'on a défini ce qu'on considère comme un doublon ..)
Boriskof
Membre
Membre
Messages : 13
Inscription : 18 août 2025, 21:51
Status : Hors-ligne

Bonsoir merci pour ta réponses dans mes sujets du matin. Et oui avnat de synchroniser je veux essayer de mieux organiser mes centaines de fichiers Freecad. Et la question est très bien renvoyée: c'est quoi un doublon d'un fichier retravaillé. Je ne pense pas que je pourrai me pemettre de tous les ouvrir pour les comparer.
Dans Python, tu veux dire un script qui reprend les éléments valables pour déclarer "c'est ou ce n'est pas un doublon"? Je peux demander un coup de main à un ami là-dessus
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 6069
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

Généralement, pour vérifier que le contenu de 2 fichiers est strictement identique, on utilise une somme de controle (un hash en anglais). On le calcule pour tous les fichiers, et on regarde ceux qui sont identiques.
Mais est que tu veux rechercher les fichiers au contenu strictement identique (pas un seul bit d'écart) ? a toi de réfléchir à ton besoin.
En python,tu va calculer tous les hash, et les comparer entre eux. Ce n'est pas très compliqué, il existe des bibliothèques pour faire une grosse partie du travail.
Je te conseille de ne pas faire effacer les doublons automatiquement par le script, mais de demander l'autorisation de l'utilisateur.
Répondre