Grupy dyskusyjne   »   wyszukiwarka duplikatów jpg

wyszukiwarka duplikatów jpg



1 Data: Marzec 10 2010 22:43:47
Temat: wyszukiwarka duplikatów jpg
Autor: Marek 

Może mi ktoś doradzić sprawny program do wyszukiwania duplikatów plików
graficzych ? mam ich trochę na dysku po oidzyskiwaniu danych- są w różnych
katalogach, i na pewno jest dużo podwójnych...
Wydawało mi się, że acdsee to potrafi, ale on porównuje wielkość pliku i
jak są 2 pliki o tej samej długości to dla niego są identyczne!!! (tak
przynajmniejszukał duplikatów plików tekstowych...) Nie chciałbym pokasować
zdjęć, które tylko wielkość pliku mają tą samą. Jakiego /tym razem free/
programu użyć ?



2 Data: Marzec 10 2010 22:51:31
Temat: Re: wyszukiwarka duplikatów jpg
Autor: Cezary Grądys 

Marek pisze:

Może mi ktoś doradzić sprawny program do wyszukiwania duplikatów plików
graficzych ? mam ich trochę na dysku po oidzyskiwaniu danych- są w różnych
katalogach, i na pewno jest dużo podwójnych...
Wydawało mi się, że acdsee to potrafi, ale on porównuje wielkość pliku i
jak są 2 pliki o tej samej długości to dla niego są identyczne!!! (tak
przynajmniejszukał duplikatów plików tekstowych...) Nie chciałbym pokasować
zdjęć, które tylko wielkość pliku mają tą samą. Jakiego /tym razem free/
programu użyć ?

fdupes

3 Data: Marzec 10 2010 23:17:20
Temat: Re: wyszukiwarka duplikatów jpg
Autor: Eneuel Leszek Ciszewski 


"Marek"

[..] Jakiego /tym razem free/ programu użyć ?

Ja używam do tego AceUtilities -- nie jest bezpłatny.

--
   .`'.-.         ._.                           .-.
   .'O`-'     ., ; o.'    eneuel@@gmail.com    '.O_'
   `-:`-'.'.  '`\.'`.'    ~'~'~'~'~'~'~'~'~    o.`.,
  o'\:/.d`|'.;. p \ ;'. . ;,,. ; . ,.. ; ;. . .;\|/....

4 Data: Marzec 11 2010 08:49:33
Temat: Re: wyszukiwarka duplikatów jpg
Autor: GS 

Użytkownik Marek napisał:

Może mi ktoś doradzić sprawny program do wyszukiwania duplikatów plików
graficzych ? mam ich trochę na dysku po oidzyskiwaniu danych- są w różnych
katalogach, i na pewno jest dużo podwójnych...
Wydawało mi się, że acdsee to potrafi, ale on porównuje wielkość pliku i
jak są 2 pliki o tej samej długości to dla niego są identyczne!!! (tak
przynajmniejszukał duplikatów plików tekstowych...) Nie chciałbym pokasować
zdjęć, które tylko wielkość pliku mają tą samą. Jakiego /tym razem free/
programu użyć ?

Za przeproszeniem DupDetector
http://www.keronsoft.com/dupdetector.html

pzdr
Grzegorz S

5 Data: Marzec 11 2010 17:01:28
Temat: Re: wyszukiwarka duplikatów jpg
Autor: Jacek Rogalewicz 


Użytkownik "Marek"  napisał w wiadomości

Może mi ktoś doradzić sprawny program do wyszukiwania duplikatów plików
graficzych ?

Dobry, ale nie darmowy - D'peg.

http://www.somewareonthe.net/index.cfm?page=3495&pagename=d`peg!

Pytanie czy 25 USD to do przezycia czy nie.

pzdr.
/JR

6 Data: Marzec 11 2010 19:28:36
Temat: Re: wyszukiwarka duplikatów jpg
Autor: Kris 


Użytkownik "Marek"  napisał w wiadomości

Może mi ktoś doradzić sprawny program do wyszukiwania duplikatów plików
graficzych ? mam ich trochę na dysku po oidzyskiwaniu danych- są w różnych
katalogach, i na pewno jest dużo podwójnych...
Wydawało mi się, że acdsee to potrafi, ale on porównuje wielkość pliku i
jak są 2 pliki o tej samej długości to dla niego są identyczne!!! (tak
przynajmniejszukał duplikatów plików tekstowych...) Nie chciałbym
pokasować
zdjęć, które tylko wielkość pliku mają tą samą. Jakiego /tym razem free/
programu użyć ?

tylko i wylacznie
DoubleKiller
szukasz wg wlasnych kryteriow
jak i sum crc32

http://www.bigbangenterprises.de/en/doublekiller/

7 Data: Marzec 11 2010 22:40:59
Temat: Re: wyszukiwarka duplikatów jpg
Autor: Cezary Grądys 

Kris pisze:

tylko i wylacznie
DoubleKiller
szukasz wg wlasnych kryteriow
jak i sum crc32


Jak to według sum crc32? Czyli cały plik czytany, żeby stwierdzić różnicę, która może na 10 bajcie już jest?
Było by to dobre jakby było większość plików jednakowych i chcieli byśmy wśród nich jeden inny (lub kilka) znaleźć.

8 Data: Marzec 11 2010 22:57:32
Temat: Re: wyszukiwarka duplikatów jpg
Autor: Kris 


Użytkownik "Cezary Grądys"  napisał w wiadomości

Jak to według sum crc32? Czyli cały plik czytany, żeby stwierdzić różnicę,
która może na 10 bajcie już jest?
Było by to dobre jakby było większość plików jednakowych i chcieli byśmy
wśród nich jeden inny (lub kilka) znaleźć.

powiem ci tak na rozne sposoby przefiltorwalem sobie swoje zasoby
dyski partycje itp
nic nie zastapi ci wlasnej ostroznosci i uwagi
bo zdazaly sie pliki o tym samym crc32

program jest doskonaly
bo samemu definiujesz co chcesz skanowac
i w jaki sposob czy dolaczajc nazwy wielkosc daty

dzieki niemu wywalilem tony plikow zduplikowanych
i zaprowadzilem porzadek

9 Data: Marzec 13 2010 01:24:50
Temat: Re: wyszukiwarka duplikatów jpg
Autor: nb 

at Thu 11 of Mar 2010 22:40, Cezary Grądys wrote:

Kris pisze:

tylko i wylacznie
DoubleKiller
szukasz wg wlasnych kryteriow
jak i sum crc32


Jak to według sum crc32? Czyli cały plik czytany, żeby stwierdzić
różnicę, która może na 10 bajcie już jest?

Zawartoć plików jest porównywana tylko wtedy, kiedy ich wielkoć
jest jednakowa. Wówczas prawdopodobieństwo że ich zawartoć jest
identyczna (a więc koniecznoć porównywania całych plików bajt
po bajcie) radykalnie rośnie. W mojej praktyce 99% czasu
działania fdupes to strata na jednakowych plikach.

I przykład jak to może wyglądać w praktyce:


~ls -l # mamy dwa bardzo duże pliki
 -r-- r-- r--   1 root  wheel  1466035052 13 Mar 00:37 K2.avi
 -r-- r-- r--   1 root  wheel  1466035052 22 Oct  2007 Kolja-DVD.avi

#time crc32 K* # szybkośc obliczenia crc
 bb2b61ee        K2.avi
 bb2b61ee        Kolja-DVD.avi
 real    0m42.831s
 user    0m7.646s
 sys     0m7.237s

#time fdupes .  # szybkoć działania fdupes
 ./Kolja-DVD.avi
 ./K2.avi
 real    5m33.525s
 user    4m36.092s
 sys     0m14.206s

Widać, że patent z crc jest około 8 razy szybszy.
Nawet md5 (wykluczający przypadkową zbieżnoć crc)
będzie pięć razy szybszy.


Było by to dobre jakby było większoć plików jednakowych i chcieli
byśmy wśród nich jeden inny (lub kilka) znaleźÄ‡.

A jakiś przykład podobny do mojego?


--
nb

10 Data: Marzec 13 2010 20:13:12
Temat: Re: wyszukiwarka duplikatów jpg
Autor: Cezary Grądys 

nb pisze:

#time crc32 K* # szybkośc obliczenia crc
 bb2b61ee        K2.avi
 bb2b61ee        Kolja-DVD.avi
 real    0m42.831s
 user    0m7.646s
 sys     0m7.237s

#time fdupes .  # szybkoć działania fdupes
 ./Kolja-DVD.avi
 ./K2.avi
 real    5m33.525s
 user    4m36.092s
 sys     0m14.206s

Widać, że patent z crc jest około 8 razy szybszy.
Nawet md5 (wykluczający przypadkową zbieżnoć crc)
będzie pięć razy szybszy.


No ten przykład świadczy na niekorzyć fdupes. Miałes 2 jednakowe pliki
więc żeby stwierdzić, że są jednakowe musiały być przeczytane w całości niezaleznie czy bezpośrednio porównane, czy liczona jakaś suma. Mnie się wydaje, że liczenie sum powinno być wolniejsze, bo to dodatkowa zbędna operacja.
Wielu chce liczyć te sumy, bo potrzeba te pliki (czy sumy) posortować przed porównaniem, nie do przyjęcia jest porównywanie każdy z każdym.
Ja osobiscie zastosował bym nastepujący algorytm (zakładam, że już odrzuciliśmy ze względu na długoć):
   - czytamy po 10..100 początkowych bajtów plików, zapisujemy do tablicy
   - sortujemy (sort)
   - szukamy duplikatów (uniq)
   - dla znalezionych duplikatów porównujemy całoć, a jak mamy ich
     bardzo dużo to powtarzamy procedurę dla większej ilosci bajtów
     poczatkowych.

Dlaczego tak?
Przede wszystkim powtarzających się plików będzie raczej niedużo, jest to jakaś patologia z którą walczymy. Czyli plików różnych może być 99%, a żeby stwierdzić różnoć nie trzeba czytać całości. Po drugie zapewne nawet dla bardzo długich plików różnica będzie już gdzieś na początku.
Plików jednakowej długosci może być całkiem sporo biorąc pod uwagę, ze mogą to być zdjęcia w RAW.

11 Data: Marzec 11 2010 21:55:26
Temat: Re: wyszukiwarka duplikatów jpg
Autor: lux 

Marek pisze:

duplicate_photo_finder

w wersji darmowej nie możesz tylko z programu usunąć podwójnego pliku tylko ręcznie. Ale program jest genialny np.: jeśli masz foto w tiff 10 mpx, to znajdzie jej duplikat zapisany pod inna nazwą jako jpeg 0,5 mpix. Ponadto posiada przeglądarkę która od razu wyświetla jej zdaniem identyczne foto, co ułatwia sprawę. Inne programy nie potrafią rozpoznawać "treści fotki".

lux

12 Data: Marzec 12 2010 12:42:20
Temat: Re: wyszukiwarka duplikatów jpg
Autor: EMPI 

duplicate_photo_finder

możesz podać link do strony z tym programem, bo google pokazuje pełno
różnych podobnych  programów...

EMPI
http://www.empi.art.pl

13 Data: Marzec 12 2010 20:56:13
Temat: Re: wyszukiwarka duplikatów jpg
Autor: Hue Saturation 


Użytkownik "EMPI"  napisał w wiadomości

duplicate_photo_finder

możesz podać link do strony z tym programem, bo google pokazuje pełno
różnych podobnych  programów...


Prosze bardzo http://duplicatefinder.firmtools.com/

14 Data: Marzec 13 2010 15:59:28
Temat: Re: wyszukiwarka duplikatów jpg
Autor: EMPI 

Hej !

możesz podać link do strony z tym programem, bo google pokazuje pełno
różnych podobnych  programów...

Prosze bardzo http://duplicatefinder.firmtools.com/

Ale tam jest tylko wersja Trial, nigdzie nie znalazłem wersji free ani
jakiegokolwiek zapisu odnośnie funkcjonalności jaka zostaje po upływie
okresu trial...

EMPI
http://www.empi.art.pl

15 Data: Marzec 13 2010 23:40:24
Temat: Re: wyszukiwarka duplikatów jpg
Autor: lux 


Ale tam jest tylko wersja Trial, nigdzie nie znalazłem wersji free ani
jakiegokolwiek zapisu odnośnie funkcjonalności jaka zostaje po upływie
okresu trial...
====
nie ma free. ten trial to tylko brak kasowania z programu.

lux

16 Data: Marzec 16 2010 17:19:16
Temat: Re: wyszukiwarka duplikatów jpg
Autor: Saiko Kila 

Proces lux  zwrócił błąd:

w wersji darmowej nie możesz tylko z programu usunąć podwójnego pliku
tylko ręcznie. Ale program jest genialny np.: jeśli masz foto w tiff 10
mpx, to znajdzie jej duplikat zapisany pod inna nazwą jako jpeg 0,5
mpix. Ponadto posiada przeglądarkę która od razu wyświetla jej zdaniem
identyczne foto, co ułatwia sprawę. Inne programy nie potrafią
rozpoznawać "treści fotki".

Ależ potrafią, tylko nie są popularne z jakiegoś powodu. Może tego, że
takie wyszukiwanie "trochę" trwa i nie jest takie trywialne, bo muszą
sobie zrobić bazę i trochę od użytkownika wymagają. Kiedyś używałem tego
sporo, teraz sporadycznie bo nie zależy mi na miejscu. DupDetector i
ImgSearch to dwa przykłady darmowych programów tego typu. OK, darmowe
były kiedy je na dysku umieściłem, teraz może nie są (lata 2002-2003),
nie sprawdzałem.

UPDATE:
to nowsza wersja ImgSearch, nadal darmowa
http://www.softpedia.com/get/Multimedia/Graphic/Graphic-Others/ImgSearch.shtml

i nowsza wersja DupDetector, nadal darmowa
http://www.photo-freeware.net/dupdetector.php

--
Saiko Kila
Unregistered Windows User #7.29581131e8

17 Data: Marzec 12 2010 19:04:13
Temat: Re: wyszukiwarka duplikatów jpg
Autor: mg 

Może mi ktoś doradzić sprawny program do wyszukiwania duplikatów plików graficzych ?

GQview ma opcję wyszukiwania plików według różnych kryteriów: nazwa,
rozmiar, data, wymiary, suma kontrolna, podobieństwo w procentach. Są
dwie opcje w menu:
- "wyszukaj pliki" - dla wyświetlanego obecnie pliku
- "wyszukaj duplikaty" - oddzielne okno do którego przeciąga się
porównywane zbiory

http://gqview-win.sourceforge.net/

Program wymaga biblioteki GTK (przygotowana razem z programem w dziale
pobrań).

wyszukiwarka duplikatów jpg



Grupy dyskusyjne