Som Plus-medlem får du: Tillgång till våra Plus-artiklar | Egen blogg och Portfolio | Fri uppladdning av dina bilder | Rabatt på kameraförsäkring och fotoresor | 20% rabatt på Leofoto-stativ och tillbehör | Köp till Sveriges mest lästa fototidning Fotosidan Magasin till extra bra pris.

Plusmedlemskap kostar 349 kr per år

Annons

iMatch – erfarenheter från några AI-providers i iMatch

Produkter
(logga in för att koppla)

Sten-Åke Sändh

Aktiv medlem

iMatch – erfarenheter från några AI-providers i iMatch​



Måste börja med att säga att AI-stödet i iMatch DAM-system är mer omfattande och genomarbetat än jag kunnat föreställa mig. Det är i princip helt enastående smart och effektivt. Jag har ju tidigare kört PhotoMechanic i över 4 år - en programvara som varit industristandard i decennier för fotografer och journalister över hela världen som arbetat med hårda dead-lines och varit glad åt den effektivitetsvinst det givit i metadataunderhållet. Den effektivitetsnivån är dock trots allt ingenting generellt sett mot det steg både jag och andra nu kunnat ta sedan någon månad tillbaka med helt nya iMatch 2025.

iMatch AI - Autotagger​

Konfigurations-gränssnitt för denna ”Autotagger”-funktion låter användaren välja mellan ett antal olika välkända AI-tjänster såsom OpenAI, Google, Microsoft, Mistral (franskt) samt även gratis Open Source-lösningar som Ollama och LM Studio som låter användarna köra AI lokalt och gratis och det funkar generellt bra men kräver minst 12 GB på grafikkortet om man vill köra stora AI-modeller såsom Googles Gemma 3 -12. Dock finns en mindre hyfsat bra modell som klarar sig med 4GB som jag kör och testat parallellt själv.

1742950232182.png

Här Open AI-konfigurationen som jag kör själv. Som ni ser så krävs en privat API-nyckel i detta fall från OpenAI för att fungera. Notera att systemet ger möjligt att styra data för Description, Keywords och Landmarks (exv. byggnader m.m. i stadsmiljö som identifieras) med s.k. ”promptar” knutna till varje typ av data. Dessa tar det lite tid att experimentera fram för ”Prompt-engineering” är en hel vetenskap i sig om man verkligen vill kunna styra sin AI. På toppen av det kan man hjälpa AI via ett inmatningsformulär där man kan skicka med ad hoc data och styra om man vill lägga samma data på flera bilder eller inte.


1742950293109.png

Ett kostnadsexempel​

Överst till höger finns statisktik över hur mycket ”resurser” i OpenAI tokens jag använt. Kostnaden med deras s.k. ”mini model” är f.ö. mycket överkomlig. Jag lade in 10 $ och jag har väl gjort av med 3 av dessa på en månad och tusentals processade bilder.

En jämförelse - traditionella manuella system - PhotoMechanic​

I PhotoMechanic jobbar man främst med att massuppdatera (batch-uppdatera) olika XMP-metadataelement med hjälp av smarta och effektiva mallar och med användning av olika inbyggda variabler. Så kan ofta mycket tråkigt jobb automatiseras. Dessa kan även aktiveras när bilder läses in vilket är väldigt smart och effektivt. Mallarna gör att man kan fylla i mängder av element/fält väldigt effektivt MEN man står nästan alltid ändå där med minst två fält att hantera mer eller mindre manuellt och de är ”Description” (beskrivning) och ”Keywords” (sökord), eftersom dessa element/fält oftast har unika innehåll. Därför har det vuxit fram en hel undervegetation av företag i USA, som säljer sådan data exv. till sportjournalister. Den tekniken är dock långtifrån någon AI utan den bygger på ”Replace”-teknik där användaren skriver ”kort-ord” som sedan ersätts av programmet till ren text på bilderna.

En prisjämförelse: PhotoMechanic vs iMatch
Både iMatch och PhotoMechanic är över 20 år gamla program men där slutar likheterna. CameraBits är ett litet företag (kanske 15 personer) men PhoTools som gör iMatch är ännu mindre och är i princip ett enmansföretag där Mario Westphal är den som sköter precis allt men gör det oerhört bra. Båda har bra support men inget slår Mario av vad jag sett ända sedan 90-talet då jag jobbade med alla de stora IT-mjukvaruföretagen som produktchef. Skriver du något så svarar han inom 24 timmar eller mindre.

Efter att en risk-kapitalist tagit över CameraBits har man drastiskt höjt priserna både för "perpetual licenses" och infört prenumerations upplägg. För drygt 4 år sedan kostade PM Plus 6 ca 2000 SEK när jag köpte det och nu kostar en evighetslicens drygt 5300 SEK. Väldigt lite har egentligen utvecklats i PM de senaste 4 åren annat än att det blivit kompatibelt med C2PA. Det är f.ö. även iMatch.

iMatch däremot har utvecklats enormt i jämförelse med PM och ligger så långt i framkant det nog går när det gäller AI-drivna DAM som riktar sig till konsumentmarknaden och mindre företag. Min erfarenhet är att det är klart mycket mer effektivt som jag använder det än PM Plus men det saknar PM Plus specialiserade kommunikationslösningar för exv. sportfotograferna. Men priset! Det kostar ca 1/3 av vad PhotoMechanic nu kostar eller drygt 1700 SEK

Jag kan dock helt ärligt säga att jag inte främst migrerat till iMatch p.g.a. priserna - jag har ju en evighetslicens av PM Plus också. Det som istället varit helt avgörande för mig har varit att jag blivit mycket effektivare med iMatch än jag varit med PhotoMechanic främst för att PM inte klarar av att automatisera produktionen av "Description"-texterna och "Keywords". PM saknar idag fullständigt allt vad AI heter och känns plötsligt väldigt ålderdomligt.

Det har också spelat viss roll att iMatch är ett mer mångsidigt DAM som även kan knyta metadata till både PDF- och Office-dokument så det är ett DAM i sin riktiga betydelse då det inte enbart är byggt för bildhantering. iMatch står också på en modern och solid XMP-metadatagrund, vilket inte PM gör då det fortfarande som många konverterare såsom Capture One och Photolab och möjligen även Lightroom gör lutar sig helt på gamla IPTC internt även om de också sparar allt parallellt i XMP-data.


iMatch - Face Detection​

I iMatch finns sedan några år ett smart och effektivt AI-drivet ”Face Detection”-system som kan konfigureras för att jobba i bakgrunden med att märka upp bilder med namn på de som finns på bilderna. Dessa kan sedan automatiskt bekräftas av systemet eller så gör man det med fördel i ett effektivt delsystem som kallas ”People”.

1742950350138.png

OBS! Här kan man effektivt bekräftaidentiteterna” på folk och verifiera om automatiken ”gjort rätt” eller åtgärda eventuella missar automatiken gjort. Detta är extremt viktigt när man sedan kör AI-processningen med ”Autotagger”, eftersom man där enkelt kan skicka med lite kod i ”Description”-fält ”prompten” som göra att AI-systemet automatiskt kan skriva namnet på personerna i bild på ett intelligent sätt istället för att anonymt skriva exv. ”En man och en kvinna tittar på solnedgången”. De flesta uppskattar nog om det istället skulle stå ”Nisse Nilsson och Eva Persson tittar på solnedgången”. Vill man hellre ha bara förnamnen, så är även det enkelt ordnat. Hjälper man till med lite mer ad hoc-text så blir det oftast mycket bättre svar man får.

Imatch ”Autotagger” i arbete​


1742950388279.png

Här fyra bilder som jag hjälpt till att styra upp lite med Autotagger-prompten. Nedan resultaten i klartext:

” Moscow Soviet Union 1978 - Ingrid Agneta Sändh stands beside a train. She wears a red coat and blue pants. The train shows destinations to Helsinki. The scene captures a moment of travel and excitement.”

Keywords: Coat, Smile, Station, Train, Travel, Woman

Den “kod” som fixar att systemet automatiskt hittar min fru i bilderna och inte bara en anonym kvinna och skriver in min frus namn i bilden ser ut som nedan:

{File.Persons.Label.Confirmed|hasvalue:These persons are shown in this image: {File.Persons.Label.Confirmed}.}

mer behövs inte för det, vid sidan att personens bilder är ”bekräftade” för att ”Face Detection” AI och ”Autotaggers” AI ska samarbeta på bästa sätt


Mina "Prompt"-exempel:


När jag utan att överhuvudtaget styra annat än plats och årtal som ovan så får vi följande text för ”pionjär-marschen över Röda torget”-bilderna:

” Moscow Soviet Union 1978 - Soldiers march in formation on Red Square. The Kremlin wall stands in the background, along with notable historic buildings. People watch from a distance, observing the event.”

OpenAI identifierar ”Landmark” och skriver in både ”Kreml” och ”Red Square” automatiskt i ”Description”-fältet

Keywords: Building, Crowd, March, Sky, Soldiers, Square, Wall



Här skulle jag dock nog rättat ”Soldiers” för det är det ju inte fråga om här i strikt mening.


Hela prompningen av ”Description”- data​


{File.Persons.Label.Confirmed|hasvalue:These persons are shown in this image: {File.Persons.Label.Confirmed}.}

Describe this image in the style of a magazine caption. Use factual language.



Always priority for gepgrafic data, the year and peoples names.

Always write text inside quotes but without the quote signs.

Describe this image in a style to make it easily searchable.

Use simple English, common words, factual language, and simple sentences.

Avoid describing anything not directly observable from the image.

Write the geografic data and year in the beginning of the text together with names


Prompning av “Keywords”- data​


[[-c-]]

Keywords never in plural form

Return five to seven keywords describing this image.

Use simple English, common words, factual language.

Max one word in each keyword.

No geografic data or time info as keywords.

No words with only capital letters.


Promptningen av “Landmarks”-data​


[[-c-]] Return the names of known landmarks and tourist spots in this image to {File.MD.description}

If you cannot detect any landmarks or tourist spots, return ''.
 
Senast ändrad:
Stort tack för ett gediget arbete och fina analys av möjligheterna och utmaningarna.
Spännande att läsa.

Pröva gärna men var beredd på att det är en viss inlärningströskel. Det inbyggda hjälpsystemet är dock väldigt bra och som sagt, nu är nog även utvecklaren Mario som mest öppen för att ta emot feed back och hjälpa användarna till rätta då ju version 2025 är helt ny.

Han har varit helt fantastiskt bra och det har sparat mig väldigt mycket tid. Det känns nästan som man löst ett VIP-serviceavtal fast man inte betalt en enda spän extra för det.
 
Mer om Keywords och migration

Man kan ju bara skriva 10 000 tecken här på FS men jag känner att jag borde lägga till följande kring hur vad som gäller när det gäller migration av Keywords till och från iMatch :

Flat Keywords- struktur - svenskt eller engelskt?
På Internet gäller engelskt punkt. Keywords-skiljeteckn kommer annars i flera landsspecifika former. Antingen lägger man bara till dem på varje post och separerar med semikolon om man kör svenskt eller så använder man komma om man kör engelskt - allt enligt landsstandard. Kör man iMatch och AI så fixar AI dessa skiljetecken med automatik. Detta kallas för en "platt" eller "flat" struktur.

Hierarkiska Keywords
På min tidiga resa med PhotoMechanic, Photolab och Capture One har jag stött på en hel del med problem just kring keywords. Det har alltid varit relaterat till användning av s.k. hierarkiska keywords. Skälet har varit flera men i huvudsak har det man skickat från exv. PM Plus till Photolab och vise versa inte funkat utan blivit korrupt. Det andra skälet har varit att det är oerhört tungt att själv bygga hierarkiska strukturer på egen hand i exv. PM Plus. Jag försökte och utgick från en Lightroom-lista men gav upp.

Standardiserade vocabularies eller egna
Annars är det ju ofta så att man i många företag och organisationen använder hierarkisla s.k. "controlled vocabularies" som alltså är färdiggjorda keywordstrukturer som man väljer från i själva praktiska arbetet MEN med iMatch och AI så har detta plötsligt blivit ett helt realistiskt projekt att använda strukturerade keywords, även om man vill börja själv från grunden. Även om jag aldrig kommer göra det igen p.g.a. mina tidigare dåliga erfarenheter så kan iMatch och AI fixar allt detta galant vad jag kunnat se.

Skydd för standardiserade structurer
Om man är rädd för att AI ska grisa ned ens befintliga keyword struktur, så kan man även hantera detta då de AI-genererade orden även läggs i egna parallella fält och AI kan instrueras att bara använda ord från den befintliga standardiserade vokabulären. Jag har inte ens sett detta i större corporate DAM ens tidigare, så det är vad jag kan se väldigt kraftfullt och flexibelt.

Export- och Import av Theasaurus-listor vid migration
Ett tredje problem vid en migration från säg Photolab, kan vara att det programmet helt saknar både export- eller import-funktioner för keyword-listor eller s.k. Thesauruses, men det har nu iMatch löst på ett alldeles suveränt sätt. Dels kan man importera det man vill migrera men det är även så att alla de keywords som AI genererar och skriver in på bilderna lagras i iMatch databas och därifrån kan de enkelt importeras till Theasaurus-listan med ett simpelt val i en meny. Såna finesser har aldrig funnits i PhotoMechanic. Där sker allt manuellt. Det är även väldigt lätt att hyfsa en befintlig Thesaurus i iMatch om man nu känner för det.

Även PhotoMechanic och Capture One har bra import och exportfunktioner för export av keyword-listor, vilket alltså inte gäller DXO Photolab, vilket gör det programmet till ett mindre seriöst alternativ de övriga. Däremot är det väldigt enkelt att migrera till Photolab om man nöjer sig med att programmet vid indexeringen bygger en lista automatiskt av de keywords som redan finns i bilderna men att importera en standardiserad s.k. "controlled vocabulary" från exv. Lightroom eller PM Plus går helt enkelt inte och det är just därför seriösa användare av exv. Photolab bör fundera på att sköra sitt metadataunderhåll via iMatch eller något annat bättre alternativ.

Styrkan med XMP-baserade metadatalösningar är ju just annars att de är så framtidssäkra som de är därför just för att de till skillnad från Lightroom INTE lägger allt i en enda monolitisk databas utan att metadata ytterst ligger decentraliserat i varje enskild fil istället.

Min uppfattning är annars att man ska vara försiktig med att välja XMP-metadata verktyg som saknar heltäckande migrations-lösningar.

Om AI-generering av Keywords
Det ska dock påpekas att AI-genereringen av Keywords ofta måste styras hårt med hjälp av "promptarna" och ni kan ju se vad jag lagt till i exemplet ovan, så förstår ni. Det är också viktigt att få ordning på detta innan man går i produktion för slarvar man med detta så får man garanterat en massa onödiga problem. Man kan exv. få en blandning av hierarkiska och platta keywords. En del kan ha stor begynnelsebokstav och andra inte. Jag har t.o.m. sett AI ge en blandning av keywords med enbart versaler också. Detta kan vara viktigt, för i vissa program så behandlas sökord med bara gemener eller versaler eller för den delen med stor begynnelsebokstav som helt olika sökord.

Till sist: Keywords som del av sökbara parametrar
Både i iMatch och PhotoMechanic kan keywords användas för att filtrera fram bilder. I PM döljs detta under en rubrik som heter "Browse" där "Keywords" är en en bland många parametrar och i iMatch ligger de under begreppet "Categories". I det simpla Photolab PictureLibrary saknas en sådan funktion helt.

1743029706393.png

Här ett exempel i iMatch med drygt 1200-bilder med keyword "Transport". Ibland är detta högst användbart som ett alternativ till vanliga sökningar konstigt att DXO inte fattat det också.
 
Senast ändrad:
ANNONS
Götaplatsens Foto