Annons

Keywords i EXIF

Produkter
(logga in för att koppla)

Rumpelstiltskin

Aktiv medlem
Hoppas nån är mer hemma på hur Keywords lagras i EXIF än jag.

Jag använde ett katalogiseringsprogram (DAM är att säga för mycket), som jag gillade och som hade det jag behövde. Det var lite buggigt, men författare var väldigt snabb med att rätta till allt jag påpekade, så det kändes helt OK. Sen kom en ny och lätt omdöpt version till ett högre pris. Det gjorde slarvsylta av den gamla databasen när den importerades och slarvsyltan fortsatte med ny bilder. Författaren svarade inte längre på mail och programmet har inte uppdaterats sen jag köpte det, för 2½ år sen. Det utlovade stödet för OMs orf-filer uteblev.

Så jag gav upp och började leta nåt nytt. Kan inte motivera kostnaden av de proffessionella programmen och har inte heller behov av allt de erbjuder. Så hittar jag igen att lite mer okänt progam, antagligen en enskild kille bakom det också. Lite minde finesser än det förra men vettig pris och räcker för mina behov.

Det var förhistorien. Taggar/keywords fungerade fint i program A och de kunde läsas av andra program. I program B hände nåt konstigt som jag först trodde var en "feature" som författaren till program B gillade - men inte jag.

Om en bild hade fått flera taggar, alltså gamla bilder taggade av program A, säg Stockholm, Street och Hund så dyker de upp i listan över keywords. Så långt allt väl. Men, ett ytterligare keyword som består av samtliga taggar dyker också upp. Så här:

Hund
Stockholm
Stockholm, Street, Hund
Street


Och skulle jag ha rågat tagga andra bilder med samma keywords men gjort det i en annan ordning, så läggs det också till. Så här kan det se ut.

Hund
Hund, Street, Stockhom
Stockholm
Stockholm, Street, Hund
Street
Street, Hund, Stockholm


O.s.v. för varenda bild som har fler än en tagg. Nu fattar problemet! Det konsiga är att andra program jag har INTE visar de här "sammansatta" taggarna. T.ex. digiKam och FStop som jag har på telefonen.

När jag testade att tagga en bild med flera keywords med program B hände detta inte.

Jag grävde runt i EXIF och hittade följande, alltså skrivet av program A.


<dc:subject>
<rdf:Seq>
<rdf:li>Hus</rdf:li>
<rdf:li>Skugga</rdf:li>
<rdf:li>Street</rdf:li>
<rdf:li>Örebro</rdf:li>
<rdf:li>Örebro;Hus;Street;Skugga</rdf:li>
</rdf:Seq>
</dc:subject>

Den fetade raden, ska den vara där? Jag försöker alltså lista ut om det är program A eller program B det är fel på.

Ett ytterligare problem är att de taggar jag lägger till med program B inte läses alls av andra program. Jag hittar dem ingenstans i EXIF och det finns inga sidecar-filer heller, så vete fan hur det går till. Jag gillar programmet för övrigt, men det här funkar ju inte.

Tänkte jag skulle försöka ta reda på så mycket som möjligt om taggproblemet själv innan jag kontaktar författaren igen. Det är vissa kommunikationsproblem. Han förstår nog fortfarande inte vad jag menade med de där sammansatta taggarna...

Jag löste, tillfälligt, problemet med de sammansatta daggarna genom att helt enkelt deleta dem. De kom inte tillbaka. Men jag skulle vilja förstå...
 
Senast ändrad:
Inte svar på din frågeställning, men varför inte köra med digiKam som är gratis och bygger på öppen källkod, samt underhålls aktivt?

För din frågeställning om var det andra programmet lagrar datan kan det ske programmets bibliotek.
 
Vad jag kan se efter att ha kollat en .xmp fil skapad av Lightroom Classic så läggs det till en rad i filen där taggarna ligger i den ordning de har i hierarkin. i detta fall dock med " | " som separator.

Syftet med denna rad har jag dock ingen aning om.
 
Vad jag kan se efter att ha kollat en .xmp fil skapad av Lightroom Classic så läggs det till en rad i filen där taggarna ligger i den ordning de har i hierarkin. i detta fall dock med " | " som separator.

Syftet med denna rad har jag dock ingen aning om.
Exempel på ovanstående där det skapats två rader eftersom "löven" inte ligger på samma "grenar" i hierarkin.

<lr:weightedFlatSubject>
<rdf:Bag>
<rdf:li>Nattljus</rdf:li>
<rdf:li>Växt</rdf:li>
<rdf:li>2_Motiv</rdf:li>
<rdf:li>Örbyhus Slott</rdf:li>
<rdf:li>Örbyhus</rdf:li>
<rdf:li>1_Platser</rdf:li>
</rdf:Bag>
</lr:weightedFlatSubject>
<lr:hierarchicalSubject>
<rdf:Bag>
<rdf:li>1_Platser|Örbyhus|Örbyhus Slott</rdf:li>
<rdf:li>2_Motiv|Växt|Nattljus</rdf:li>
</rdf:Bag>
</lr:hierarchicalSubject>

Det verkar alltså inte vara något fel på dina program - förutsatt att Adobe gör rätt.. ;-)

Edit: I LrC så används de överordnade nyckelorden i sökningen i katalogen, möjligen är det samma syfte i .xmp filen
 
Senast ändrad:
Inte svar på din frågeställning, men varför inte köra med digiKam som är gratis och bygger på öppen källkod, samt underhålls aktivt?

Jag har försökt gilla det, men det gör jag alltså inte. Har ändå sparat det på hårddisken.
För din frågeställning om var det andra programmet lagrar datan kan det ske programmets bibliotek.

Ja, det måste ju vara nåt sånt. Men då innebär det ju att man blir helt låst till det programmet. Jag ska läsa manualen ordentligt innan jag kontaktar författaren igen. Men det finns inga såna val i inställningar.
 
Vad jag kan se efter att ha kollat en .xmp fil skapad av Lightroom Classic så läggs det till en rad i filen där taggarna ligger i den ordning de har i hierarkin. i detta fall dock med " | " som separator.

Syftet med denna rad har jag dock ingen aning om.
Tack! Då är det antagligen program B som gör fel.
 
Exempel på ovanstående där det skapats två rader eftersom "löven" inte ligger på samma "grenar" i hierarkin.

<lr:weightedFlatSubject>
<rdf:Bag>
<rdf:li>Nattljus</rdf:li>
<rdf:li>Växt</rdf:li>
<rdf:li>2_Motiv</rdf:li>
<rdf:li>Örbyhus Slott</rdf:li>
<rdf:li>Örbyhus</rdf:li>
<rdf:li>1_Platser</rdf:li>
</rdf:Bag>
</lr:weightedFlatSubject>
<lr:hierarchicalSubject>
<rdf:Bag>
<rdf:li>1_Platser|Örbyhus|Örbyhus Slott</rdf:li>
<rdf:li>2_Motiv|Växt|Nattljus</rdf:li>
</rdf:Bag>
</lr:hierarchicalSubject>

Det verkar alltså inte vara något fel på dina program - förutsatt att Adobe gör rätt.. ;-)

Edit: I LrC så används de överordnade nyckelorden i sökningen i katalogen, möjligen är det samma syfte i .xmp filen

Fast program A har inte hierarkiska keywords. Jag antar att du med hearkiska menar att de kan kategoriseras, typ...

+frukt
--- äpplen
---päron

Och det är väl inte meningen att den där raden ska dyka upp i listan över keywords man kan välja? Den blev ju enorm. Och dessutom händer det som sagt inte med keywords jag lagt till med program B, bara med de från program A. Och andra program visar dem inte heller. Så nåt knas måste det vara nånstans.

Föresten, program A är Phototheca och Program B heter fotoARRAY. Jag började skriva A och B för att jag inte orkade kolla hur det skulle skrivas och sen fick jag fortsätta. :p
 
Fast program A har inte hierarkiska keywords. Jag antar att du med hearkiska menar att de kan kategoriseras, typ...

+frukt
--- äpplen
---päron

Och det är väl inte meningen att den där raden ska dyka upp i listan över keywords man kan välja? Den blev ju enorm. Och dessutom händer det som sagt inte med keywords jag lagt till med program B, bara med de från program A. Och andra program visar dem inte heller. Så nåt knas måste det vara nånstans.

Föresten, program A är Phototheca och Program B heter fotoARRAY. Jag började skriva A och B för att jag inte orkade kolla hur det skulle skrivas och sen fick jag fortsätta. :p
Jag har bara valt nyckelorden på "lägsta" nivån d.v.s Nattljus och Örbyhus slott de övriga kommer med automatiskt och syns inte i gränssnittet när jag tittar på respektive fil.
 
Fast program A har inte hierarkiska keywords. Jag antar att du med hearkiska menar att de kan kategoriseras, typ...

+frukt
--- äpplen
---päron

Och det är väl inte meningen att den där raden ska dyka upp i listan över keywords man kan välja? Den blev ju enorm. Och dessutom händer det som sagt inte med keywords jag lagt till med program B, bara med de från program A. Och andra program visar dem inte heller. Så nåt knas måste det vara nånstans.

Föresten, program A är Phototheca och Program B heter fotoARRAY. Jag började skriva A och B för att jag inte orkade kolla hur det skulle skrivas och sen fick jag fortsätta. :p
Jag testade att göra en export från Lightroom Classic .

Då kommer de nyckelord med som jag markerat ska ingå vid export inklusive de synonymer jag ev. angett för ett visst nyckelord. Det sammansatta nyckelordet kommer inte med vad jag kan se.
 
I LR kan du välja att ta med hierarkin eller inte vid export.
Jag tror det är en missuppfattning från början här. Keywords lagras inte i EXIF utan i IPTC, det andra fältet för metadata. Kanske programmen döljer det men skriver ändå i IPTC.

"Unlike EXIF, IPTC is not recorded automatically by your camera but is optionally edited through the use of special software. A number of software programs designed for manipulation and editing of photos allow users to add text descriptions in IPTC standard"

Gunnar
 
Det verkar rörigt. Kollade på en annan bild. Enligt ExifPilot finns taggarna både i EXIF, IPTC och nåt som heter Dubling core.

Exporterade EXIF och mycket riktigt ligger de i alla tre. Men här ser jag inga enskilda värden alls, utan allt på samma rad. Fattar ingenting. Möjligen har jag lagt till dessa taggar igen med fotoARRAY. Jag råkade ta bort en del taggar och började om från början, så att säga. Men när jag la till taggar till en bild specifikt för att se vad fotoARRAY gjorde, så hittade jag ju inga alls. Så vete fan.

Källkod:
<ExifInfo>
   <Properties>
      <tag>/Exif/Image/XPKeywords</tag>
      <type>byte</type>
      <count>38</count>
      <value>Stockholm;Folk;Street</value>
   </Properties>
</ExifInfo>

<IptcInfo>
   <Properties>
      <tag>/Iptc/Application/Keywords</tag>
      <type>ascii</type>
      <count>1</count>
      <value>Stockholm;Folk;Street</value>
   </Properties>
</IptcInfo>

<XmpInfo>
   <Properties>
      <tag>/Xmp/DublinCore/Subject</tag>
      <type>xmparray</type>
      <count>3</count>
      <value>Stockholm; Folk; Street</value>
   </Properties>
</XmpInfo>
 
Taggade en tidigare otaggad bild med fotoARRAY. Absolut NADA i den inbäddade XML-blaffan. Så både de tidigare examplen måste komma från Phototheca.
 
Det finns inte EN standard för ”Nyckelord”.
Dublin core är en standard av flera.
Det finns flera organisationer inom olika områden och vissa har fått egna fält exif, itpc m.fl.
Så i brist på en enhetlig standard kommer program att lägga keywords i något eller några lämpliga fält. Sannolikheten att det skulle bli en standard för keyword/nyckelord är så gott som obefintlig.
I princip behöver metadatasystem anpassas efter användning så arkivering, beskrivning av innehåll, relationer etc. kräver egna strukturer.
 
som någon ironisk person sägs ha sagt: "fördelen med standarder är att det fins så många att välja på..."

Vill man fördjupa sig finns specifikationer mm för XMP att finna om man startat från Adobes XMP webb


Personligen är nyckelord något jag använder för min egen del och för att inte få med en massa onödig information när jag lägger upp bilder på nätet försöker jag komma ihåg att rensa bort alla nyckelord innan jag exporterar / publicerar en bild från Lightroom Classic.
 
Vet att det finna olika sätt att göra detta, men det fölklarar ju tyvärr inte varför programmen inte lirar med varandra.

Nu vet jag ivf tillräckligt för att skriva och fråga om man kan få taggarna sparade på ett sätt som kan läsas av andra program.
 
Ingen expert på hur standarderna fungerar på mer detaljerad nivå. Men EXIF är i grunden information om exponeringen. Datum, tid, kamera, objektiv, brännvidd, slutartid och bländare.
Bildtexter och nyckelord lagras i IPTC.
Sedan så lagras det olika beroende på filformat. I Jpeg-filer lagras det i/bäddas in i själva bildfilen. Gäller det RAW-filer så lagras det i en "side-car" fil. med .xmp som ändelse på filnamnet.
Hoppas att ovanstående kan vara till någon sorts hjälp.
 
EXIF - Exchangeable Image File Format ett anatal fält för teknisk information om bilden (hur, när, var, vem).

ITPC - International Press Telecommunications Council hanterar standarder för press och media. Så de har skapat ett antal fält för detta ändamål.

Så givet att det inte finns nån standard så har de två ovanstående fått ett stort gehör och hanteras av de festa bildhanteringsprogram. Utöver det så kan man skapa sitt eget eller leta efter nåt hos t ex dublin core eller inom den akademiska världen.
 
Problemet är väl att det är XMP som är den "nyaste" metadatastandarden. IPTC är halvdött men lever kvar därför att i exv. mina konverterare Capture One och Photolab samt i mitt gamla bildarkiv i Camerabits PhotoMechanic, så är det IPTC man stöder i granssnittet MEN samtliga dessa har egentligen XMP som huvudkälla vare sig det lagras inne i XMP-kompatibla filer såsom TIFF, JPEG och DNG. I RAW-fallet skrivs normalt dessa metadata inte in i filerna utan ligger parallellt lagrat i s.k. sidecar-filer. Heter filen 123.RAW så heter XMP-filen 123.XMP.

Det blir dock annu mer komplicerat för att IPTC kan lagras både under en egen header i filerna OCH som numera under en egen namnrymd eller "Name space" i XMP som heter just IPTC. Många mjukvaror försöker upprätthålla metadataintegritet genom att "gaffla" detta data parallellt till både det gamla IPTC samt IPTC i XMP. Sedan finns ju dessutom Adobe som inte ens lyckas hålla sig till sin egen standard utan hittar på egen fält ovanpå det.

Efter min resa via Lightroom, DXO Photolab, Capture One, Camerabits PhotoMechanic 6 Plus som varit så pass rörig att jag beslutade att sluta använda hierarkiska eller strukturerade keywords just för att dessa standards implementerats så olika under de årtionden de funnits och jag måste använda både Photolab, Capture One och även XnView, så har jag till slut landat i den enda lösning som funkat för mig för keywords-metadata underhåll m.m. och det har varit att integrera dessa med ett fristående DAM i form av Photools iMatch. Jag jobbade även under sju år med att utveckla och drifta Stockholms Digitala Stadsmuseum och det var där jag lärde mig att hantera XMP-metadata i det norska Fotoware som idag är ett generellt Corporate DAM som används över hela världen.

Visst kan man alltid kika på gratisalternativ men ibland som i TS fall så undrar jag om det verkligen blivit så billigt eller gratis alla gånger. Det brukar det bara bli i bästa fall om man värderar all strultid till Noll.

Det problematiska med hierarkiska keyword-strukturer är att de är våldsamt dyra och struliga att underhålla manuellt och det är av just det skälet som många då väljer att hålla sig till fördefinierade så kallade "controlled vocabularies" som är standardiserade. Privatpersoner upptäcker dock snart att det blir till en "tvångströja" man får svart att stå ut med. Jag kollade på flera och lade en del tid på att komplettera en Lightroom-vokabulär i PhotoMechnaic genom att exportera ut denna (i TAB-format) och redigera den i Excel innan jag återimporterade den. Det var verkligen öken så det ledde till att jag gick över till en mycket effektivare hantering av en platt struktur istället. PhotoMechanic och Photolab var helt enkelt inte kompatibla då i detta avseende.

Nu kör jag alltså iMatch och där har man verkligen tagit ett helhetsgrepp på keywords och underhåll av dessa och det programmet bara måste vara marknadens mest avancerade och heltäckande när det gäller underhåll av keyword-metadata. I iMatch ligger alla keywords i en s.k. Thesaurus som det är enkelt att redigera och underhålla MEN både all textning av bildbeskrivningar och keywords kan även automatiseras helt med en funktion som heter Autotagger efter att denna konfigurerats för att använda AI API-erna i Google Gemini, Open AI, franska Mistral, Microsoft Azure eller de gratis alternativ som kan hanteras via Ollama eller LM Studio.

Autotagger är extremt effektivt och kan styras via ett antal promptar så att man får de texter och keywords man vill ha och behöver och inget annat. Detta är extremt viktigt eftersom det annars lätt kan bli så att man fyller sin Thesaurus med en massa keywordsskräp man egentligen inte vill ha. Automatiken kan generera både hierarkiska och platta strukturer, styra hur många per bild och hur de ska vara formaterade. Om de ska tillåta fler än ett ord i ett sökbegrepp eller inte.

Man kan även efter att man skapat en Tesaurus man är nöjd med styra så att AI endast lägger in motsvarande det som redan finns i denna Tesaurus i bilderna och på det sättet kan man alltid om man vill se till att skydda integriteten av denna. Om den nu råkar bestå av en "controlled vocabulary" man importerat, så kommer systemet se till att integriteten i det datat inte komprometeras. En del låter AI generera strukturerade keywords som de sedan redigerar till en "controlled vocabulary" inna de skyddar den för automatisk uppdatering vidare. Som sagt, jag har inte sett något ens i närheten av detta någon annanstans.

Jag har testklockat Autotagger med den snabbaste OpenAI modellen GPT-4.1-mini som duger gott till generell bildtolkning och den klarade att processa lite drygt 1000 bilder på sju minuter där både text och sju keywords per bild automatiskt skrevs in. Kostnaden för den tjänsten var mindre än fem kronor. iMatch kostade mig 1700 kronor vilket kan ställas mot PhotoMechanic som idag kostar tre ggr mer. För mig var det en "no brainer" och det bästa jag köpt för digitalfoto på drygt 20 år.

Den promptning jag använder nu för keywords ser ut som nedan:

Keywords never in plural form
Use simple English, common words, factual language.
Preferably just one ord in each keyword.
Never write name of country or year in keywords
No words with only capital letters

If there is an animal, flower or plant in the image, write the animal’s, flower's or plant's ["Common name"]

If it is a Mammal write Animal and Mammal
If it is a Bird write Animal and Bird
If it is a Reptile write Animal and Reptile
If it is a Fish write Animal and Fish
If it is an Insect write Animal and Insect
If it is a Flower write Flower
If it is a Tree write Tree
If it is a Plant write Plant
If it is a Fruit write Fruit

Else nver write anything. Return nothing.

Som ni ser kan iMatch, Autotagger tillsammans med de av Open AI:s API-er som stöds av iMatch mycket väl ta över det mesta av det jobb en fotoantikvarie kan tänkas bidra med när det gäller både keywords men även de texter som skriva i Description-fälten.

För Descriptions finns följande:


Always priority for gepgrafic data, the year the picture is taken and peoples names.
{File.Persons.Label.Confirmed|hasvalue:These persons are shown in this image: {File.Persons.Label.Confirmed}.}
Always write text inside quotes but without the quote signs.
Always translate and write texts on signs into English.
Describe this image in a style to make it easily searchable.
Use simple English, common words, factual language, and simple sentences.
Write the geografic data and year in the beginning of the text together with names
Avoid describing anything not directly observable from the image.

NEVER write: "No plant or animal is seen." or "No people in the image."
NEVER write: "No sign or text present."
If there is an animal, flower or plant in the image, write the animal’s, flower's or plant's common name, family name, and scientific (Latin) name in this format:
Common name: [Common name]
Family: [Family name]
Scientific name: [Latin name]
Else never write anything. Return nothing.

Nedan ser ni exempel på resultaten:

This setup for addressing especially nature photography pictures has proven to work very well and leaves very little for me to add when I use it with the GPT-4.1 model. I know it costs more than the mini model but I think it is weel spent money since it is more reliable than the mini-models. Be aware though that this setup is just ment to be used with a flat keyword model. As you can se in the instructions above I also add that it IS an animal and what type of animal or plant it is etcetera.

Here a few examples (without pictures) of different type of animals

Lizzard: (Reptile example)

Serengeti Tanzania 2012 - A striking lizard rests on a rock. The reptile exhibits vibrant purple and blue scales, characteristic of the Chamaeleon species. This reptile showcases a beautiful color pattern. Common name: Agama lizard Family: Agamidae Scientific name: Agama agama

Agama Lizzard, Animal, Reptile


Zebra: (Mammal example)

Serengeti Tanzania 2012 - Young plains zebra stands near water. Black and white stripe on body. Light reflects from water. Earth tone background. Typical Serengeti view. Common name: plains zebra Family: Equidae Scientific name: Equus quagga

Animal, Mammal, Plains Zebra, Stripe, Water



Verreaux's Eagle: (Bird example)

Serengeti Tanzania 2012 - A large dark eagle sits on a rock with green grass in the background. The bird faces away, showing detailed feathers. Good light and natural setting. Useful for wildlife and bird search. Common name: Verreaux's eagle Family: Accipitridae Scientific name: Aquila verreauxii

Animal, Bird, Grass, Rock, Verreaux's Eagle


Frangipani flower: (Flower example)

Zanzibar Tanzania 2012 - White frangipani flower with yellow center and dark green leaves. Close-up photo of the flower in daylight. Common name: Frangipani Family: Apocynaceae Scientific name: Plumeria alba

Flower, Frangipani, Green, Leaf, Nature, Petal, White



Inorder to get a mandatory initial text I also always includes a text like the one below in the ad hoc prompt window. The last months I have found that in my case Open AI GPT 4.1 API has proven to be the most reliable when it comes to follow formal instructions on for example text formatting. I have found Googles models have had more problems with that and that is the reason I now stick with Open AI.

Mandatory text: Serengeti Tanzania 2012 -
 
Senast ändrad:
Problemet är väl att det är XMP som är den "nyaste" metadatastandarden. …-
xmp = Extensible Metadata Platform är ett xml baserat filformat för lagring av metadata. Ursprungligen framtaget av Adobe men nu ISO 16684-1:2019 part 1 & ISO 16684-2:2014 part 2.
Det finns idag namespaces för exif, itpc, dublincore och andra metadata standarder. Vem som helst kan skapa ett namespace och lägga med det i en xmp-fil eller inbäddad i bildfilen.
Xmp är formate och namespace är innehållsspecifikation vilka fält som finns och vad de innehåller.

Sen ska vi för tydligheten skilja på metadata och nyckelord, som är en delmängd av metadata.
 
ANNONS
Götaplatsens Foto