Ähnliche Tagfelder finden

Hallo,

wäre es nicht möglich, in MP3Tag keine Funktion einzubauen, die ähnliche Inhaltein Tagfeldern findet? Prinzipiell dürfte das doch nicht so komplex sein.
Meine Musiksammlung ist gewachsen - und nun habe ich das Problem, dass diverse Interpreten einfach doppelt vorhanden sind; bei Titeln das gleiche.
Ich habe es auch schon so gemacht (ist aber etwas unschön): Alles markiert und die Dropdown-Box des Tag-Feldes manuel surchgeschaut, ob man Einträge doppelt oder ähnlich findet. das ist ja in der Liste rechts relativ mühsam, wenn man z.B. 20x Amy McDonald da stehen hat und irgendwo dazwischen findet sich eine Mcdonald, eine MacDonald etc.
Wenn man quasi einen Filter hätte, der die Einträge durchgeht, evtl. noch online vergleicht, was passen könnte, dann wäre das sehr hilfreich bei großen Sammlungen.

Grüße vom Tschortsch

Gerade bei großen Sammlungen wirst du jede Menge Titel finden die fast 100% gleich sind, weil das eine die Maxi, das andere der Radio Edit, das dritte die extended version ist.

iTunes hat eine Funktion, Duplikate zu finden. Ähnliche Titel findet es nicht.

Könntest du noch ein bisschen genauer spezifizieren, wie du die Ähnlichkeit von Vielfalt, die auf die Einheit zurückzuführen ist, generell festmachen würdest? Wenn du konkrete Beispiele anführst, kannst du sie auch mit einem Filter finden.

Das Beispiel mit Amy MacDonald und Amy McDonald:
Filtern nach
%artist% HAS Amy
Sortieren,
alle Amy markieren und aus der Dropdownliste für ARTIST die richtige auswählen. Da stehen dann nicht 20, sondern vermutlich nur 2 oder 3 in der Liste.
Dann die Änderung speichern.

Naja, wenn du viele Alben / Sampler hast, sind Dupkikate zwangsläufig vorhanden.
Da musst du auch aufpassen, dass du dir keine hässlichen Löcher in die Sammlung reißt.
(-> wäre aber eher was für ne Grundsatzdebatte)

Wie du ja schon im anderen Forum geschrieben hast, gehts dir um unterschiedliche Schreibweise oder auch mal Tippfehler, deine alte Variante ist unnötig aufwendig, lieber Software nehmen die diese Funktion hat.

Das ist natürlich noch ein wichtiges Thema, deshalb vielleicht statt den Tags lieber einen Audiovergleich verwenden. (z.B. Mediapurge - Freeware, Deutsch/Englisch).
Der Audiovergleich ist zwar zeitintensiver als die suche nach ähnlichen tags, löst aber dieses Problem. Kannst ja beides einfach mal probieren, er löscht dir ja nix von selbst.

Gruß
Peter

Finde ich schon. Da Sprache gar nicht logisch ist, sind viele Abweichungen gewollt, so dass die falschen Positive immer wieder die Bearbeitung verstopfen.

Der DJ und seine Schreibweise war ja ein Auslöser. Und weil er mir gerade über den Weg gelaufen ist:
DJ Gee

der hat bei Discogs diese Liste von Aliassen:
D.J. Gee, D.J.Gee, DJ Gee M.P.

Also gibt es diese Schreibweisen alle, vermutlich verstreut über mehrere Werke dieses Herrn.

Wie will ich den nun benennen? Einheitlich, damit ich alle seine Stücke finde? Oder so, wie es auf den Werken erscheint?

Also: selbst wenn ich Ähnlichkeiten erkenne, können die dennoch als solche erhalten bleiben.
Noch so ein Beispiel:
Ziggi, Ziggy X und Ziggy Marley erscheinen bestimmt bei einer maschinellen Suche als ähnlich.
Inhaltlich sind sie aber eigene Personen. (Und der Unterschied zu Ziggy Marley & Sean Paul oder Ziggy Marley & the Melody Makers wird noch größer sein.

Sind Yass, Yazz und Yazoo Unterschiede oder falsche Schreibweisen?
Kurz und gut: ich bezweifele, dass eine Ähnlichkeitssuche wirklich weiterhilft, da die Menge der falschen Treffer vermutlich so ermüdet, dass man die wahren am Ende übersieht. Und bei jeder erneuten Suche, werden die falschen Treffer wieder gezeigt, man entwickelt sich also nicht wirklich weiter.

Wenn es externe Programme gibt, die bei so einer Suche helfen, dann passt das gut zum Konzept von MP3tag, dass sich nur um die Tags der aktuellen Datei kümmert und alle anderen Disziplinen anderen Programmen überlässt.

Hi,

auf die verschiedenen Argumente, warum man nciht vielleicht doch gleiche Schreibweisen zulässt oder nicht, will ich jetzt erst mal nicht eingehen, ich komme zum eigentlichen Thema zurück - den, meines Erachtens, sinnvollen Zusatz für ein tolles Tool.

  1. Warum würde ich mir das wünschen?
    Um mir Arbeit beim Einsortieren zu ersparen und doppelte Interpreten zu vermeiden. Ja, mir geht es hauptsächlich um die Interpreten. Vor allem eim Mergen verstiedener Sammlungen oder digitalisieren seiner eigenen ist es (finde ich jedenfalls) anstrengend.
    Um doppelte, anders geschriebene Interpreten herauszufischen, verwende ich MP3Tag ja schon - aber eben links die Tagfelder. Alles markieren, "Titel" aufklappen, Liste durchschauen, Augen zukneifen und korrigieren. Ist auf Dauer nur sehr anstrengend, deshalb die Frage.

  2. Woran würde ich Ähnlichkeiten festmachen?
    Na ja - naiv, wie ich bin, würde ich auf die Reihenfolge und die Übereinstimmung (also wieviel Zeichen kommen in Feld 1 vor, die in Feld 2 auch vorkommen) gehen. Beispiel: D.J. Quacksalber <> D.J. Quacksalber <> DJ Quicksilver; AHA <> A-Ha <> A- hA <> aha <> A-Ha;
    oder The Beatles <> Beatles, The; Amy McDonald <> McDonald, Amy (Beides wollte ich z.B. nicht in meiner Medialibrary stehen haben.
    Hier gibt es bestimmt noch einige Dinge, die man einfach ausarbeiten müsste.

  3. Wie stelle ich mir so eine Funktion vor?
    Nun ja - das ist - gebe ich ja zu - etwas schwieriger.
    Alternative 1: In der großen Liste, eine farbliche Hervorhebung, dass man beim Scrollen gleich sieht, die sind z.B. ähnlich aber doch nicht gleich. Dies als eine Art Filter, den man für die jeweiligen Tagfelder einschalten kann.
    Alternative 2: Einen Wizard - z.b. "Ähnliche Interpreten suchen". Dieser durchsucht dann den Datensatz, den man reingeladen hat und man kann die Interpreten dort anpassen.
    Wenn ich so recht überlege - würde mir Alternative 1 besser gefallen ...

  4. Diese Funktion sollte es natürlich dem Benutzer überlassen, WAS er korrigieren möchte:

  • Ziggi, Ziggy X und Ziggy Marley z.B. ...

BTW: Aliasse finde ich in einer größeren Sammlung eher störend - wenn man dann schnell nach dem Interpreten sucht, weiß man nicht wirklich, nach was man suchen soll:
D.J. Gee, D.J.Gee, DJ Gee M.P. würde ich dann sicherlich unter dem Namen abspeichern, unter dem der Künstler am bekanntesten ist.

Deshalb würde ich das auch eher für Interpreten nehmen wollen. Prinzipiell wäre das aber universell einsetzbar.

Viele Grüße vom Tschortsch

Zu naiv, sorry.
Die schon genannten Beispiele/Probleme, Anagramme, tagweise klappt nicht.
=> Tagbasierende Duplikatsuche funktioniert, aber nie 100%tig und nicht so einfach wie du es dir vorstellst, akustische Fingerabdrücke sind einfach besser geeignet.

Auf die Gefahr hin mich zu wiederholen:
http://www.chip.de/downloads/MediaPurge_55314842.html
Da kannst du es Tag basierend und auch afp basierend ausprobieren.
(wizard wie in deiner Alternative 2)

Das Hauptproblem: MP3tag kennt weiterhin nur die Daten der aktuellen Datei. Es findet kein Vergleich aller Felder mit allen anderen Dateien statt.
Selbst der Tracknummern-Assistent sucht sich nicht die Dateien mit demselben Album heraus, sondern vertraut auf eine passende Sortierung.

Eigentlich können wir die Diskussion hier beenden.

Rein vom Gedankenspiel her finde ich die Idee, dass mir ein Programm mal eben alles machen soll, schon faszinierend.

Ich vermisse jetzt etwas die Erwähnung von Sortierungen und FIltern - dies sind weiterhin die primären Instrumente, um Datensammlungen nach bestimmten Kriterien aufzubereiten.

Wir reden die ganze Zeit von einer bestehenden Sammlung.
Was aber passiert, wenn neue Titel dazu kommen? Werden die dann einfach mal übernommen? Dürfen die erst übernommen werden, wenn die übrige Sammlung geladen wurde, um dann die Abweichungen zu registrieren (wobei immer noch nicht geklärt ist, wie das sinnvoll geschehen soll)?
Muss im Hintergrund eine Tabelle gehalten werden mit Benennungen, die zugelassen sind?
Denn sonst kriegt man ja bei jedem erneuten Einlesen der Sammlung die schon längst als OK gefundenen vermeintlichen Ähnlichkeiten erneut präsentiert.
Muss jede Datei mindestens einmal gespeichert werden, selbst wenn es keine Änderungen gibt, um die Einträge in die Tabelle der zugelassenen Begriffe zu übernehmen?
Wie sollen Irrtümer aus der Tabelle entfernt werden?

Letztlich sind auch diese Überlegungen müßig: all diese FUnktionen gibt es schon mit Sortieren und FIltern.

Wenn es nur um die Vereinheitlichung von Metadaten geht und nicht um die Duplikatsuche, dann bietet MP3tag mit Sortierung, Filtern und Export eine Menge Möglichkeiten, um die eigene Sammlung auf Stand zu bringen.
Wenn man also filtert
ARTIST HAS "Beatles"
wird man die Dateien mit "The Beatles", "Beatles" und "Beatles, the"
gezeigt bekommen. (Und vielleicht noch Beatles & Tony Sheridan oder Beatles & Billy Preston)

Damit schnurrt die Menge der in der Klappliste für ARTIST gezeigten Einträge auf 3-5 zusammen.

(Die Verwendung des Tag-Panel für die Bearbeitung von TITLE unter Verwendung mehrerer ausgewählter Dateien erscheint mir ungeeignet, das sich die meisten Stücke gerade im TITLE unterscheiden, das Tag-Panel aber ideal dafür geeignet ist, mehreren Dateien die gleichen Daten zu verpassen, also primär ALBUMARTIST, ARTIST, YEAR, ALBUM).

Das Feature mit der farbigen Markierung interessiert mich auch noch: wie sollen denn die Zusammenhänge zwischen den Dateien deutlich werden? Ich stelle mir dieses Szenario vor
Ich habe meine ganze Sammlung geladen. Ich sehe eine farbige Markierung bei "The Beatles". Und nun? Wie finde ich jetzt raus, zu welcher anderen Datei Ähnlichkeit besteht? Denn im Zweifelsfall habe ich nach ARTIST sortiert und finde also Einträge bei "Beatles" ziemlich weit vorne in der Sammlung und bei "The Beatles", was wohl im letzten Drittel der Sammlung sein dürfte.
Und wenn das auch noch eine, wie angenommen, große Sammlung ist, werde ich doch jetzt nicht stundenlang durch die Sammlung blättern, sondern mehr oder weniger sofort einen Filter anwenden. Gleiches würde auch für Amy MacDonald und MacDonald, Amy gelten.

Das letzte Beispiel führt meiner Ansicht nach weiter:
Irgendwann muss ich mir Regeln für meine eigene Sammlung geben, wie ich was erfassen will: wo packe ich den "feat. Artist" hin? Wie halte ich das mit den Artikeln bei Gruppennamen? Wie benenne ich Künstler (so wie man es spricht oder womöglich Nachname, Vorname).
Und wenn diese Vereinheitlichung abgeschlossen ist, werden die Tippfehler und Groß-/Kleinschreibung sehr schön dicht beisammen zu sehen sein. Und dies Abweichungen sieht man dann sehr schön in den meisten Abspielern, weil es plötzlich 2 Einträge gibt. Oder man einen Titel nicht findet, obwohl man weiß, dass er doch da sein müsste. Das ist dann der Feinschliff.
Die grobe Vorarbeit ist das Anwenden der Regeln.

Hi zusammen,

ja - ich gebe Aschließend noch meinen Senf dazu, dann könnt ihr die Diskussion beenden.
Peter, ich denke nicht, dass das zu "naiv" ist. Ich habe selbst schon so etwas ähnliches in ein Tool eingebaut, meine Formulierungen sind sicher nicht bis ins kleinste Detail durchdacht gewesen; ich wollte lediglich eine Idee aufzeigen, die mir z.B. das Leben erheblich vereinfachen würde. Und ich denke, da bin ich nicht ganz alleine. Aber ich möchte auch nicht gegen Windmühlen kämpfen müssen, sorry.
Anstatt konstruktiv zu einer Lösung zu kommen, heißt es schon nach dem ersten Posting "nein, nein, nein, das bauen wir nicht ein" oder "kann das Tool nicht", "gehört nicht zur Philiosophie", etc., anstatt zu versuchen, zusammen zu einem Konsens oder einer Lösung zu kommen. Nehmt es bitte nicht persönlich, aber das finde ich schade. Und wie will denn so etwas neues, innovatives entstehen? Die Entwicklung soll doch weitergehen, oder nicht?

Aber nun noch zum eigentlichen Thema:
@ohrenkino:

Tut mir leid, hier meinte ich natürlich den ARTIST!
Wer redet den von einer kompletten Sammung, die mit MP3Tag bearbeitet werden soll? Ich MUSS bei der Größe zwangsläufig Teile daraus anschauen, korrigieren, neue hinzufügen. Und - mir ging es hier hauptsächlich um neuere, größere Teile, die dazu kommen.
Ich weiß zwar nicht, wie das Tool im Hintergrund arbeitet, jedoch denke ich, dass MP3Tag beim Einlesen im Hintergrund irgendeine Datenstruktur aufbauen muss, oder täusche ich mich da? Denn wie sollten sonst die Filter funktionieren?

OK, evtl. ist das mit den Farbein etwas unverständlich - dann doch eher einen anderen Vorschlag (nur, um es noch mal gesagt zu haben):
Man KÖNNTE einen Dialog einbauen, der z.B. eine Liste mit allen Künstlern anzeigt. Daneben eine weitere, leere Listbox (editierbar), welches beim anklicken eines Eintrages links die Einträge rechts anzeigt, die ähnlich sind. Diese könnte man dann manuell korrigieren. Je nachdem, wie man es gerne möchte.

Ach ja, bevor ich's noch vergesse: genau diesen Fall, ohrenkino, den Du da zum schluss beschreibst, diesen "Feinschliff" möchte ich eigetnlich schon beim einsortieren vermeiden bzw. so gering wie möglich halten. Schon zu so oft sehe ich in meinem Player doppelte Einträge. die müsste ich mir dann notieren und merken, dann korrigieren.

Und ein Programm, welches einem alles abnimmt, wird es nicht gegen, das weiß ich auch. Aber selbst MIT dieser Funktion gibt es noch genug zu tun, meint ihr nicht?

Viele Grüße vom Tschortsch

Hi Tschortsch,

ich kämpfe seit Jahren mit meiner Sammlung. Und immer wieder stellen sich Uneinheitlichkeiten erst im Laufe der Zeit heraus.
Also hilft nichts anderes, als immer wieder zu sortieren und zu filtern.

Das Programm Similarity erlaubt einen statistischen Vergleich auch der tags - aber die Resultate sind enttäuschend. Genau die Fälle, die du schilderst mit kleinen Abweichungen in der Schreibweise werden so gut wie nicht sinnvoll erkannt oder man kriegt einfach so viele Treffer, dass die wahren Abweichungen im Wust der falschen Treffer versinken.

Ich bin am Ende über nichts anderes als den manuellen Vergleich und immer wieder durch die Sammlung gehen mit Sortieren und Filtern zu einer halbwegs bereinigten Sammlung gekommen bzw. bereinige sie immer wieder so.

Und gerade wenn neue Einträge dazu kommen sollen, hilft oft nichts, als jeden einzeln mit dem Rest zu vergleichen, um dann wegen der unlogischen Sprache, die sich kaum formal fassen lässt, festzulegen, ob es eine Abweichung ist oder nicht.

Große Vergleiche habe ich mit Excel und Access, iTunes und dem WMP durchgeführt. Jedes dieser Programme bringt eine Funktion mit, um einen Aspekt der möglichen Abweichungen zu finden.

Das ist mühsam aber ist so.

Wenn du nun eine Idee hast, wie man eine Art Weltformel anwendet, um doch nicht nach einzelnen Strings filtern zu müssen, dann würde das genau dieses Thema treffen.
ich kenne die Formel nicht.