Duplikate

Toll ist der Filter für einzelne MP3s - aber wie würde einen Filter (oder etwas vergleichbares) lauten, mit dem ich Duplikate in einer MP3-Sammlung finden kann?
Als erstes Kriterium für Duplikate würde mir %title% einfallen - eine alphabetische Sortierung listet zwar auch gleiche Titel untereinander, aber ich schlafe beim Durchblättern so einer Liste fast immer bei "B" ein.

In iTunes gibt es so eine Funktion, nur ist es eben umständlich, erst in iTunes die Duplikate suchen zu lassen, dann in MP3-Tag zu wechseln, um ggf. die notwendigen Umbenennungen auszuführen (jedenfalls die, welche iTunes nicht kann wie Dateiname oder Sprache oder so), dann in iTunes zurückzukehren, den geänderten Inhalt aktualiseren zu lassen, die Liste in itunes aktualisieren und dann alles von vorne ...

Ich sitze jetzt nicht an meinem Rechner um die Schritte, die gehen würden, erklären zu können. Klick im Programm mal auf Hilfe und gucke mal ob du etwas zu md5 hash audio findest. Beim Export (.csv) mit md5 hash wird eine Nummer ausgegeben, die bei gleichen Audiospuren, dann auch identisch ist.

@ all, wenn es etwas unkomplizierter oder einfacher zu realisieren geht, bitte mal posten. Interessiert mich auch

Andere Diskussionen:
Doppelte mp3s finden
Datei konnte nicht umbenannt werden....

Es geht umständlich über die Exportfunktionen. Du musst nicht unbedingt die md5 hash audio Daten verwenden, du kannst auch überprüfen ob Titel gleich sind oder ähnliches. In Exportskripten kannst du Variablen dazu benutzen (s. hier unter Variable operations oder in der entsprechenden Hilfedatei).

mfG
gnor

Danke fürs Nachdenken - allerdings war ich gar nicht so anspruchsvoll, GENAU identische Paare (oder sogar Drillinge) zu finden - es würde mir eine Liste genügen, die anscheinend gleiche Titel zeigt, vermutlich wirklich am Feld %title% zu identifizieren. ITunes macht das schon nicht schlecht.

Besonders kam es mir auf den Medienbruch an, der im Moment noch nötig ist und der auch mit der Exportfunktion erzwungen wird: ich muss erst ein anderes Programm/eine andere Datei öffnen, um eine bestimmte Verwaltungsfunktion zu bekommen und dann wechsele ich wiederum das Programm, um die Änderungen auszuführen. Und dieses Hin- und Her wollte ich verhindern.

Die Kalkulation eines Hash-Werts ist wohl auch nicht immer günstig, da schon geringe Abweichungen (ja nach Quelle und Gründlichkeit der Erfassung) im Inhalt wie Covergröße, Zeichensetzung etc. kaum noch Treffer erzeugen. Da wäre eine Liste nach Titeln gruppiert fuzzy genug. (Ja, ok, und wenn einer eben Mist im Tag geschrieben hat, findet man diese DUplikate auch nicht ...)

Ich entnehme der Diskussion allerdings, dass es keine Fix-und-Fertige Funktion gibt und ich nur zu blöd war, genug nachzudenken oder die Hilfe zu lesen. :wink:

Und das ist ein falscher Gedanke. mp3tag bietet dir die Möglichkeit, einen md5 hash nur für die Audiospur zu erstellen. Da kannst du Bilder und Text in unterschiedlichen Größen drin haben. Es funktioniert allerdings nur, wenn es sich um ein echtes Duplikat handelt. Ich habe jedenfalls auf diese Art und Weise bei mir alles doppelte gefunden und entfernt.

Ich lasse mich ja gerne belehren, auch, dass ich womöglich falsch denke.
Konkret habe ich meinen gesamten Schwung mal exportiert mit MD5 der Audiospur - und das Ergebnis ist ernüchternd: nur die ersten ca. 3000 Tracks werden in der Export-Datei abgelegt, die anderen gut 50000 fehlen bzw. im Feld steht nur noch - hinsichtlich dieser Angabe hätte ich jetzt ein paar 1000 Duplikate.
Auch ist bei einer geringfügig anderen Pauseneinstellung der Quelle oder anderen Bitrate kein Duplikattreffer mehr möglich, der sich über den Titelnamen aber sehr wohl erschließen würde.
Also ein Allheilmittel ist MD5 auch nicht... Schade, ich hätte mich drauf eingelassen.

Es gibt ein Plugin für foobar2000 foo_biometric das findet Duplikate anhand eines akustischen Fingerabdrucks.
Es ist also nicht nötig, dass die Audiodaten exakt gleich sind.
Der Fingerabdrucks muss aber zuerst berechnet (braucht Zeit) werden und wird dann im Tag gespeichert.
Danach kann man nach ähnlichen Stücken suchen lassen.

http://www.hydrogenaudio.org/forums/index....showtopic=65185

Es funktioniert nur im Sinne einer 1:1 Kopie. Dann erstellt md5 Hash auch die gleiche Zahl. Hast du 2 gleiche Titel jeweils von einer anderen Quelle gerippt, funktioniert dies natürlich nicht, da es 2 verschiedene Audiospuren sind. Dann nützt dir das nichts, das ist richtig

Danke für die Mühe des weiteren Suchens - aber es ging mir ja gerade darum, nicht MP3TAg verlassen zu müssen, sondern "einfach" eine Duplikatsuche wenigstens nach Titel und Artist oder - völlig komfortabel - nach frei wählbaren Kriterien samt gewisser Unschärfe auslösen zu können (z.B. Länge darf sich um bis zu 10 Sekunden unterscheiden, danach ist es kein Duplikat mehr).
(Duplikate gemäß HASH-Wert sucht z.B. auch Easycleaner. Ob eine Suche nach Fingerabdruck besser wird? Wie oft gibt es Maxis, die einen identischen Mittelteil wie die Single-Version haben - haben die dann denselben Fingerabdruck? Würden sich remasterte Versionen wie von den Beatles oder Kraftwerk unterscheiden?)
Da all dies wohl mit Maschinenmitteln nur sehr schwierig zu realisieren ist, man eine Menge Künstliche Intelligenz bräuchte, wäre für mich eine relativ "dumme" Funktion einer reinen Tag-Vergleichsliste und anschließender Bewertung mit menschlicher Intelligenz völlig ausreichend.
Diese Funktion gibt es (noch) nicht, ich war nicht zu blöd, sie zu finden, ich bin gut im Forum untrstützt worden. Danke an alle.
Ich glaube, das Thema wäre für mich jetzt abgeschlossen.