weil du mit der ersten Anweisung alles bis auf den ersten Buchstaben in Kleinbuchstaben setzt.
Die bleiben nicht, sondern die werden es mit der Anweisung $caps2() (mal Hilfe ansehen: Scripting Functions – Mp3tag Documentation), die sich nur auf den Klammerinhalt bezieht.
Ich würde die so lassen wie sie sind. Da wäre ggf. das Filtern nach deutschen Texten günstig und dann das Setzen des Feldes LANGUAGE.