MP3 Kollektion Struktur

Moonbase · December 25, 2007, 7:48pm

Das kann man mit "if" sogar soweit treiben, dass der brave MP3Tag mit ein und demselben Tag->Dateiname-Vorgang selbst zwschen Sampler und Normal-Album unterscheidet... (Tipp: "iTunesCompilation" mitspeichern und auswerten!)

Ich bin nur ein fauler Hund und hab' das in dem Beispiel nicht gemacht, um nicht noch mehr zu verwirren (Bei mir ist Picard für das Umbenennen und Verschieben in die Zielordner zuständig - DA stehen allerdings diese ganzen Sachen drin.)

Das Feld wird vom MusicBrainz Picard Tagger 0.9.0 (als TXXX) angelegt und bildet die in der MB-Datenbank gespeicherten "Artist Sortnames" ab, so erhältst Du also (für Sortierzwecke) z.B. darin "Collins, Phil" und das Feld "Artist" kann trotzdem "Phil Collins" heißen. Oder eben sowas wie "Kanno, Yoko" statt "菅野よう子", was in gängigen Dateisystem schlecht abbildbar ist (weil man immer nur eine gerade gültige Sortierung einstellen kann).

Das Problem ist, dass selbst in ID3v2.4 nur ein Feld (TSOP) "offiziell" für sowas definiert ist (was aber m. E. eher TPE2 als TPE1 referenziert), und in ID3v2.3 TSOP nicht definiert ist. Also bleibt bei einer - wie ich finde - sinnvollen Unterscheidung des Sortiernamens für "Album Artist" und "Track Artist" wieder nur ein "Quasi-Standard"... (sieht man auch daran, dass das Feld bis einschl. Picard 0.7.2 noch "MUSICBRAINZ ALBUM ARTIST SORTNAME" hieß.) Im Moment diskutieren wir bei MB, dass auch %artistsort% ja eigentlich offiziell mit in die Tags muss - sonst ist manche Art "automatisierter" Sortierung nicht möglich. Für die Zwischenzeit pflege ich halt - der Not gehorchend - %artistsort% manuell mit ein.

Das einzige Manko bisher... MusicBrainz' Web-Oberfläche ist (noch) nicht mehrsprachig.

anon40879270 · December 27, 2007, 2:26pm

MusicBrainz Picard Tagger Felder %albumartistsort% und %artistsort%

Übrigens: Deinen Tipp, "iTunesCompilation" mitspeichern und auswerten, werde ich bei noch eingebauen.

Ich habe mir den MusicBrainz Picard installiert, um damit zu experimentieren. Der MusicBrainz Picard findet erstaunlich viel - auch hoffnungslose Fälle! Die Feinheiten der Bedienung sind mir aber noch verborgen geblieben. Ich habe 3 Tests durchgeführt:

Das Einlesen von ca. 40 GB MP3s wurde leider mit einem Absturz beendet. Mein Rechner verfügt wohl nicht über ausreichende Ressourcen.
Das Einlesen von ca. 500 MP3s, die sehr unvollständig mit Tag-Metadaten versehen waren, konnten sehr häufig erkannt werden. Title, Album, Artist und Year wurden automatisch vervollständigt. Einige zusätzlichen Felder wie %albumartistsort% wurden angelegt (nicht aber %artistsort%). Wozu die vielen anderen Felder wie
MUSICIP PUID = 60ec11d-4034-0ec1-9ab3-9f9c36ee0de3 und
MUSICBRAINZ xxxx usw. dienen sei mal dahingestellt. Nützlich für mich ist auf jeden Fall MUSICBRAINZ ALBUM TYPE = compilation bzw. = album, weil ich in meiner Verzeichnisstruktur zwischen Samplern (Compilation-Alben) und Nichtsamplern (Interpreten-Alben)
unterscheide (s.u.). Die Variante MUSICBRAINZ ALBUM TYPE = live wird in meiner Verzeichnisstruktur nicht berücksichtigt.
Das Einlesen von 3 Interpreten-Alben brachte jedoch ein Überraschung. Diese Tag-Metadaten waren vorbildlich geordnet. Aus 3 Alben wurden von MusicBrainz Picard Tagger 4 Alben erkannt. Beim 3. Album fehlte ein Track. Das 4. Album enthielt nur diesen
fehlenden Track; der Albumname stimmte mit dem 3. Album überein mit dem Zusatz "remastered". Diesen Effekt finde ich fatal. Wenn ich eine grosse MP3-Sammlung mit MusicBrainz Picard "durchtaggern" lasse und mir werden dabei Alben "zerrissen", ist das natürlich keine wirkliche Hilfe.

Alles in allem ist der MusicBrainz Picard Tagger ein sehr intessanter Ansatz, grosse MP3-Sammlungen automatisch zu "vertaggen" und mit MP3tag zu ordnen. Ich weiss allerdings noch zu wenig über die Wirkungsmechanismen von MusicBrainz Picard, um einen sinnvollen Einsatz bewerkstelligen zu können. Beispiele:
Welche Mekmale gibt es bei MUSICBRAINZ ALBUM TYPE (vgl. oben Pkt. 2)?
Wie werden Doppelte gehandhabt?
u. v. a. m.

Ich bin in folgender Reihenfolge vorgegangen:
a) Add Folder
Scan
c) Save
Ist das so korrekt?

Konkret ist bei mir der Verzeichnispfad mit Dateiname OHNE Redundanz:

bei Nicht-Samplern (Interpreten-Alben) bzw. iTunesCompilation = 0
...\%language%\%partinset%\%artist%\%year% - %album%$num(%track%,2). %title%

Samplern (Compilation-Alben) bzw. iTunesCompilation = 1
...\%language%\%partinset%\%year%\%album%$num(%track%,2). %title% - %artist%

wobei ich die Felder %language% und %partinset%\ zweckentfrendet habe:
%language% Unterscheidung zwischen Interpreten-CD und Compilation-CD, z.B. CD_ und CDs
%partinset% Vorsortierung, z.B. A, B, C, D bzw. 197x, 198x, 199x, 200x usw.

Mit MusicBrainz Picard Tagger habe ich jetzt neue Möglixchkeiten der Automatisierung. Dazu muss ich mich jedoch noch mehr in das

Programm einarbeiten. Das automatisierte Einbinden der Cover-jpgs ist ein weiteres Thema.

SquallLeonhart38 · December 27, 2007, 3:22pm

Manfred Baack:

[...]
2. Das Einlesen von ca. 500 MP3s, die sehr unvollständig mit Tag-Metadaten versehen waren, konnten sehr häufig erkannt werden. Title, Album, Artist und Year wurden automatisch vervollständigt. Einige zusätzlichen Felder wie %albumartistsort% wurden angelegt (nicht aber %artistsort%). Wozu die vielen anderen Felder wie
MUSICIP PUID = 60ec11d-4034-0ec1-9ab3-9f9c36ee0de3 und
MUSICBRAINZ xxxx usw. dienen sei mal dahingestellt. Nützlich für mich ist auf jeden Fall MUSICBRAINZ ALBUM TYPE = compilation bzw. = album, weil ich in meiner Verzeichnisstruktur zwischen Samplern (Compilation-Alben) und Nichtsamplern (Interpreten-Alben)
unterscheide (s.u.). Die Variante MUSICBRAINZ ALBUM TYPE = live wird in meiner Verzeichnisstruktur nicht berücksichtigt.

Das Einlesen von 3 Interpreten-Alben brachte jedoch ein Überraschung. Diese Tag-Metadaten waren vorbildlich geordnet. Aus 3 Alben wurden von MusicBrainz Picard Tagger 4 Alben erkannt. Beim 3. Album fehlte ein Track. Das 4. Album enthielt nur diesen
fehlenden Track; der Albumname stimmte mit dem 3. Album überein mit dem Zusatz "remastered". Diesen Effekt finde ich fatal. Wenn ich eine grosse MP3-Sammlung mit MusicBrainz Picard "durchtaggern" lasse und mir werden dabei Alben "zerrissen", ist das natürlich keine wirkliche Hilfe.

Zu 2.)
Diese zusätzlichen Felder dienen der eindeutigen Identifikation der Alben, Interpreten bzw. Songs (alles was mit ID endet). Für normale Anwendungen er weniger nützlich, aber Webdienste wie Last.fm (Online Radiostation) nutzen diese, um Songs unabhängig von ihrer Metadatenbenennung (die Standardfelder meine ich hier), zu erkennen.

Zu 3.)
Es kann sein, das ein Album zerrissen wird, wenn die IDs der jeweiligen Songs noch nicht dem Album zugeordnet wurden. Ziehe einfach den einen Song in das andere Album, und klicke danach auf "Submit PUID" (falls dieser Button aktiv wird), und beim nächsten Mal wird der Song mit hoher Wahrscheinlichkeit auch dem anderen Album, wo die restlichen Songs sind, zugeordnet.

anon40879270 · December 31, 2007, 12:23pm

Zu 3.) Es kann sein, das ein Album zerrissen wird ...
Ich sehe ein, dass es nicht anders gehen kann, denn bestimmte Tracks sind nun mal auf verschiedenen Alben in identischer Form erschienen. Da ist für mich hilfreich zu wissen, wie ich das mit "Submit PUID" reparieren kann. Danke für die Info!
Ob ich MusicBrainz Picard aber auf eine 120 GB grosse Sammlung "loslassen" sollte, bin ich noch unsicher. Kann diese Menge überhaupt bewältigt werden, und wenn ja, ich welcher Zeit? Wieviel Alben werden "zerrissen", die vorher in Ordnung waren und nun wieder mit MP3TAG geflickt werden müssen. Wer hat praktische Erfahrung mit sehr grossen Sammlungen?

SquallLeonhart38 · December 31, 2007, 12:30pm

Es wäre rein theoretisch möglich mehrere tausend Songs in einem Rutsch durchlaufen zu lassen, Es werden pro Song glaube ich 2 Minuten zur Identifizierung benutzt, was je nach Rechenleistung ein bisschen dauern kann. Ich würde es immer in 200er Paketen oder so machen, da behält man dann noch einigermaßen die Übersicht. Das nervige ist nur das ich relativ viele Interpreten noch nachtragen muss (einige mache ich erst später)

Aber die "Nachbearbeitungsrate" schwankt je nach Inhalt der Sammlung. Da ich in meiner Sammlung sehr viele unbekannte Underground Metal Bands habe, komme ich nicht ums manuelle Nachpflegen drumherum. Und auch bei großen bekannten Bands gibt es noch einiges an "hässlichen" Tags.

anon40879270 · December 31, 2007, 12:42pm

theoretisch möglich mehrere tausend Songs ...
Danke für die Hinweise. Also 50000 Tracks NICHT auf einmal. Ich probiere mal um die 2000.

anon40879270 · December 31, 2007, 2:35pm

sowas wie einen offiziellen Standard zum Benennen von MP3-Dateien gibt es nicht. Aber es gibt "Üblichkeiten". Mindestens vorhanden sollten sein:
%artist%, %album%, %track% und %title%.
Wer es komfortabel will, auch noch %year% und ggf. %genre%.
In Deutschland üblich ist bei %artist% den Vornamen nach einem Komma hinten anzustellen, z.B. Clapton, Eric. Jethro Tull bleibt natürlich so, weil dies ein Bandname ist.

Üblich ist ...\%artist%\%album%$num(%track%,2). %title%,
weil jedes Album einen eigenen Ordner erhält und die Trackreihenfolge auch unter Windows erhalten bleibt. Bei Compilations muss man natürlich anders vorgehen
z. B. so ...\%genre%\%album%$num(%track%,2). %title% - %artist%.
Es ergeben sich dabei keine Redundanzen und die Anzahl der Verzeichnistife ist bei bei Sampler und Nichtsamplern gleich.

SquallLeonhart38 · December 31, 2007, 2:38pm

Worauf beziehst du dich jetzt?

anon40879270 · December 31, 2007, 2:52pm

Auf das, was ich sehr häufig vorfinde. Jedenfalls bei bei Interpreten-Alben (Nichtsampler). Die Voreinstellungen von Audiograbber sehen auch so aus. Die CDDB berücksichtigt allerdings NICHT die deutsche Konvention Name, Vorname.

SquallLeonhart38 · December 31, 2007, 2:54pm

Konvention? Na ja, habe von dieser Konvention noch nie was gehört, würde sie aber wahrscheinlich benutzen, wenn ich irgendeinen Interpreten auf meiner Festplatte hätte, der unter seinem wirklichen Namen Musik machen würde.

anon40879270 · December 31, 2007, 3:19pm

Natürlich Künstlername. Es handelt sich um eine Empfehlung des Deutschen Phonoverbandes e. V. für Printmedien. Danach werden ebenfalls vorangestellte Artikel in allen Sprachen hintenangestellt. Aus 'The Beatles' wird 'Beatles, The'. Ich würde die Beatles jedenfalls nicht unter 'T' suchen.

SquallLeonhart38 · December 31, 2007, 3:34pm

Alle Artikel? Das ist einfach gesagt, aber schwierig umzusetzen. Beispiel das Wort "die".
Im deutschen ist es ein Artikel, wie in "Die Ärzte", "Die Toten Hosen", "Die Kassierer". Somit würde man daraus "Ärzte, Die", "Toten Hosen, Die", "Kassierer, Die" machen. So weit so gut.

Aber wenn wir jetzt mal das englische Wort "die" nehmen, dann ist es kein Artikel mehr, sondern ein Verb!
Somit wird es schon mal schwieriger. Man muss so etwas wie Ursprungsland des Interpreten berücksichtigen, damit der Interpretenname nicht zerstückelt wird.
Dies ist aber auch nicht so leicht, da es z.B. Bands wie Die Happy gibt (die aus Deutschland kommt, aber einen englischen Namen hat). Wenn man eine kleine Sammlung hat, geht das ja alles noch, da kann man ja per Hand nachbessern. Aber bei größeren Sammlungen kann dieser Fall schon mal häufiger auftreten, wo es dann wiederum sehr nervig ist. Ich persönlich packe nur das "The" nach hinten, da dies der einzige Artikel zu sein scheitn, bei dem man sich wirklich sicher sein kann.
Zudem ist es sehr schwierig alle Artikel zu berücksichtigen, da es ja auch so etwas wie "À tout le monde" gibt, wo das normale A dürch einen Akzent erweitert wurde. Diese ganzen Dinge zu berücksichtigen, mag zwar in der Theorie laut Phonoverband schön und gut sein, ist aber aus Anwendersicht unpraktikabel, da nicht jeder vollste Kenntnis über alle Artikel hat.

anon40879270 · December 31, 2007, 3:42pm

das "The" nach hinten, da dies der einzige Artikel zu sein scheitn, bei dem man sich wirklich sicher sein kann... Das ist auf jedenfall richtig und m. E. sinnvoll. Es gibt sicherlich einige Grenzfälle außerhalb von 'The'. Ich wende es jedenfalls auch sinngemäß in deutsch, spanisch und französich an. Andere Sprachen habe ich nicht.

SquallLeonhart38 · December 31, 2007, 3:48pm

Da habe ich glaube ich ein paar mehr Sprachen, die ich berücksichtigen müsste:
-- polnisch
-- russisch (viele in kyrillisch geschriben)
-- griechisch
-- japanisch
-- ungarisch
...
Und das sind einige wenige. ^^

Hier mal eine Übersicht über die Länder und ihre Sprachen (falls Interpreten nicht auf englisch singen), die ich berücksichtigen müsste.

heisubo · January 6, 2008, 10:59pm

Aber die "Nachbearbeitungsrate" ...

... ist doch sehr hoch. Der Datenbestand (zu) oft uneinheitlich, auch unvollständig. Besser in MP3tag einzubinden ist FreeDB. Um die Tags zuordnen zu können, muss das Album allerdings komplett sein. FreeDB ist auch schneller. Interssant sind die Einträge für MUSICBRAINZ ALBUM TYPE wie album, compilation, spokenword, soundtrack, single, live, usw. Aber für meine Unterscheidung brauche ich nur album und compilation, so dass ich mich auf MusicBraiZ nicht verlassen kann. ALBUMARTISTSORT ist leider auch nicht so zuverlässig, dass ich dieses Feld in meiner Sammlung einführen möchte.

heisubo · January 6, 2008, 11:49pm

Die Abtrennung von Samplern im Verzeichnispfad finde ich wichtig und richtig.
Wer Album-konform MP3s sammeln will, kann darauf nicht verzichten. Wie ein "Zusammenhalt" per Playlist aussehen könnte, ist mir nicht ganz klar.

Aber es geht auch einfacher. Wer die "Buchstaben-Vorsortierung" nicht braucht und auch auf YEAR verzichten kann, hat dann nur noch:

bei Interpreten-Alben
...\Interpreten\%artist%\%album%$num(%track%,2). %title%

bei Compilation-Alben
...\Compilation\%genre%\%album%$num(%track%,2). %title% - %artist%

Gleiche Verzeichnistiefe, keine Redundanzen. Das lässt sich auch unmittelbar im Audiograbber abbilden.

heisubo · January 7, 2008, 1:19am

Mein Konverter-String sieht (fast) genauso aus. Allerdings nehme ich die Tracknummer mit, da ich dann die VOLLSTÄNDIGE Tag-Info auch im Pfad abbilde. Wie auch Du, finde ich die Kombination YEAR-ALBUM besonders praktisch.
...\%artist%\%year% - %album%\%track%. %title%
Ebenso, wie bei Dir werden dann die Alben dann nach Interpreten chronologisch geordnet. Eine Frage:
Warum hast Du %artist% zweimal in dem String? Das erhöht doch nur die Redundanz.

nikosch · January 16, 2008, 3:46pm

Ich versuche eine Struktur zu schaffen, die die wichtigsten Daten enthält (das sind für mich Artist, Album, Tracknummer, Titel), übersichtlich aber vor allem auch schnell im Zugriff bleibt (also nicht allzu viele Ordnerhierarchien aufweist)
Das ist dabei rausgekommen:

1/ Es bietet sich eine eigene Partition an, dann fällt schon mal ein Ordner ('Musik', 'mp3' oder dergl. weg)

2/ Vorsortierung für schnellen Zugriff:
\\Alben A-F
\\Alben G-L
\\Alben M-R
\\Alben S-T
\\Alben U-Z
\\Hörspiele
\\Sampler & Compilations\

S und T enthalten naturgemäß die meisten Alben, deshalb die unterschiedlichen Laufweiten
für Backups kann diese Hierarchiestufe vernachlässigt werden, sie enthält allenfalls bei den letztgenannten Zusatzinformationen

3/ Alben
\Hörspiele und \Sampler & Compilations werden direkt albenweise untergeordnet, Alben erhalten noch einen \Artist_Album\ Ordner. Sortierung nach Artist spare ich mir zugunsten einer flachen Ordnerhierarchie

4/ Tracks
\Tracknummer_Titel

Die Dateien sind ohnehin getaggt, enthalten also für meinen Player alle Informationen.
Stelle ich eigene Compliations zusammen, jage ich anschließend den mp3tag rüber und lasse die Files nach Tags umbenennen
Die Unterstiche in 3/ und 4/ dienen der automatischen Verarbeitung, bspw. Erstellen von Playlists etc. durch mp3tag oder Batchdateien/VBScript
Das Ganze ist meine Datenbasis. Im Prinzip könnte sogar die Alben-Vorsortierung noch wegfallen, wenn ich nicht öfter die Files direkt starten würde (was suche, den DJ mache oder dergl.).
Genre- oder sonstige alternative Sortierungen sollten meiner Meinung nach durch Verknüpfungen erfolgen. Hierfür bieten sich an:
- Playlists
- Softlinks (Windows Verknüpfungen)
- Hardlinks (NTFS Filesystem Verknüfungen)

Ich nutze:

eine automatisch generierte m3u für jedes Album/Compilation/Hörspiel
eine automatisch generierte Html Datei mit Links auf ebendiese m3u's und auch auf die Einzeltracks
Hardlinks für eigene Compilations
Ordner, die Kopien der m3u's nach Genre, Jahr oder dergl. sortieren.

@DJ D.D.D.: eben angesprochene Hardlinks wären auch für Dich etwas. Plattenplatz kann man nie genug haben. Und Hardlinks erzeugen für eine physisch vorhandene Datei mehrere Dateieinträge, zeigen also auf exakt die gleiche Speicherstelle. Es ist beim Arbeiten nicht zu unterscheiden, was Datei und Hardlink ist, es wird aber nur einmal Plattenplatz genutzt. Es gibt auch keine missing links wie bei Windows-Verknüpfungen, erst wenn der letzte Dateieintrag (oder Hardlink) gelöscht wird, wird auch der Speicherbereich freigegeben. Mal informieren... !

Ach ja, Formatdiskussion.

Phonoverband hin oder her: 'The' nach nach hinten fand ich schon immer sperrig, genauso Name, Vorname. 'Ärzte, Die' sieht nicht nur sch... aus, ich finde ein Artikel ist auch eine Aussage für den eigenen Bandnamen. Sei es, weil man sich als Tiel der angesagten 'The'-Bands sehen will, sei es als kleiner Gag: 'The The', 'The Band'. Und wenn sich 'Die Fabulösen Thekenschlampen' nicht einen Artikel gegeben hätten, hießen sie 'Fabulöse Thekenschlampen'.

Genauso, wie will man bei Namen unterscheiden etwa so:
Phillip Boa & The Voodooclub
Boa & The Voodooclub, Phillip
Boa, Phillip & The Voodooclub

Nö. Bandname ist Bandname. Groß- und Kleinschreibung läuft bei mir nach Sprache. Deutsche Bands nach Grammatik, englische nur im ersten Buchstaben groß, Personen-Eigennamen nach üblicher Schreibweise.

anon40879270 · January 17, 2008, 12:09pm

Deine Ordnerstruktur hat also nur 3 Ebenen und würde dann so aussehen:

x:\A-F,G-L,M-R\%artist_%album%$num(%track%,2)%title%
mit
x:\%partinset%\%artist%album%$num(%track%,2)_%title%
wobei das Feld %partinset% die Vorsortierung darstellen würde.

Was spricht dagegen, statt Buchstabengruppen für jeden Buchstaben einen Ordner zu vergeben? Das würde die jeweilige Menge an Einträgen in den Subordnern verringern. Wenn anstelle von 7 nun ca. 30 Ordner vorhanden wären, dürfte die Überscht nicht leiden. Oder hast Du nur so wenige MP3s,
dass dann in den Subordnern kaum noch Einträge wären?

Ein Rechenbeispiel für eine kleine Sammlung von 1000 CD-Alben mit je 10 Tracks (also 10000 MP3s): Es sind natürlich Durchscnittswerte (ich verwende Deine Nummerierung).

1 Partion
7 Ordner
143 Ordner
10 Dateien
Alternativ
1 Partion
29 Ordner
34 Ordner
10 Dateien

Bei diesem Mengenbeispiel würden sich die Anzahl der Order pro Ebene gleichmäßiger verteilen.

Ein anderes Rechenbeispiel für eine große Sammlung mit 100000 MP3s und 2 zusätzlichen Ebenen könnte folgerndermaßen aussehen:
1 Partion
Albumklassifikation: 2 Ordner
Vorsortierung: 27 Ordner
Artist: 46 Ordner
Album: 4 Ordner
Track_Title: 10 Dateien

anon40879270 · January 17, 2008, 12:26pm

Die Alben eines Interpreten chronologisch zu sortieren und danach die Titel des Albums in nummerischen Reihenfolge so wie diese auf CD erschienen sind, ist sicher die beste Alternative MP3s zu ordnen, wie man auch eine CD-Sammlung ordnen würde. Wenn Du allerdings nur mit 1 Ebene (A bis Z) die %artist% trennst, hast Du bei 100 GB ja ca. 500 bis 1000 Dateien pro Ordner.

Liege ich da richtig?