Sten-Åke Sändh
Aktiv medlem
iMatch – erfarenheter från några AI-providers i iMatch
Måste börja med att säga att AI-stödet i iMatch DAM-system är mer omfattande och genomarbetat än jag kunnat föreställa mig. Det är i princip helt enastående smart och effektivt. Jag har ju tidigare kört PhotoMechanic i över 4 år - en programvara som varit industristandard i decennier för fotografer och journalister över hela världen som arbetat med hårda dead-lines och varit glad åt den effektivitetsvinst det givit i metadataunderhållet. Den effektivitetsnivån är dock trots allt ingenting generellt sett mot det steg både jag och andra nu kunnat ta sedan någon månad tillbaka med helt nya iMatch 2025.
iMatch AI - Autotagger
Konfigurations-gränssnitt för denna ”Autotagger”-funktion låter användaren välja mellan ett antal olika välkända AI-tjänster såsom OpenAI, Google, Microsoft, Mistral (franskt) samt även gratis Open Source-lösningar som Ollama och LM Studio som låter användarna köra AI lokalt och gratis och det funkar generellt bra men kräver minst 12 GB på grafikkortet om man vill köra stora AI-modeller såsom Googles Gemma 3 -12. Dock finns en mindre hyfsat bra modell som klarar sig med 4GB som jag kör och testat parallellt själv.
Här Open AI-konfigurationen som jag kör själv. Som ni ser så krävs en privat API-nyckel i detta fall från OpenAI för att fungera. Notera att systemet ger möjligt att styra data för Description, Keywords och Landmarks (exv. byggnader m.m. i stadsmiljö som identifieras) med s.k. ”promptar” knutna till varje typ av data. Dessa tar det lite tid att experimentera fram för ”Prompt-engineering” är en hel vetenskap i sig om man verkligen vill kunna styra sin AI. På toppen av det kan man hjälpa AI via ett inmatningsformulär där man kan skicka med ad hoc data och styra om man vill lägga samma data på flera bilder eller inte.

Ett kostnadsexempel
Överst till höger finns statisktik över hur mycket ”resurser” i OpenAI tokens jag använt. Kostnaden med deras s.k. ”mini model” är f.ö. mycket överkomlig. Jag lade in 10 $ och jag har väl gjort av med 3 av dessa på en månad och tusentals processade bilder.En jämförelse - traditionella manuella system - PhotoMechanic
I PhotoMechanic jobbar man främst med att massuppdatera (batch-uppdatera) olika XMP-metadataelement med hjälp av smarta och effektiva mallar och med användning av olika inbyggda variabler. Så kan ofta mycket tråkigt jobb automatiseras. Dessa kan även aktiveras när bilder läses in vilket är väldigt smart och effektivt. Mallarna gör att man kan fylla i mängder av element/fält väldigt effektivt MEN man står nästan alltid ändå där med minst två fält att hantera mer eller mindre manuellt och de är ”Description” (beskrivning) och ”Keywords” (sökord), eftersom dessa element/fält oftast har unika innehåll. Därför har det vuxit fram en hel undervegetation av företag i USA, som säljer sådan data exv. till sportjournalister. Den tekniken är dock långtifrån någon AI utan den bygger på ”Replace”-teknik där användaren skriver ”kort-ord” som sedan ersätts av programmet till ren text på bilderna.En prisjämförelse: PhotoMechanic vs iMatch
Både iMatch och PhotoMechanic är över 20 år gamla program men där slutar likheterna. CameraBits är ett litet företag (kanske 15 personer) men PhoTools som gör iMatch är ännu mindre och är i princip ett enmansföretag där Mario Westphal är den som sköter precis allt men gör det oerhört bra. Båda har bra support men inget slår Mario av vad jag sett ända sedan 90-talet då jag jobbade med alla de stora IT-mjukvaruföretagen som produktchef. Skriver du något så svarar han inom 24 timmar eller mindre.
Efter att en risk-kapitalist tagit över CameraBits har man drastiskt höjt priserna både för "perpetual licenses" och infört prenumerations upplägg. För drygt 4 år sedan kostade PM Plus 6 ca 2000 SEK när jag köpte det och nu kostar en evighetslicens drygt 5300 SEK. Väldigt lite har egentligen utvecklats i PM de senaste 4 åren annat än att det blivit kompatibelt med C2PA. Det är f.ö. även iMatch.
iMatch däremot har utvecklats enormt i jämförelse med PM och ligger så långt i framkant det nog går när det gäller AI-drivna DAM som riktar sig till konsumentmarknaden och mindre företag. Min erfarenhet är att det är klart mycket mer effektivt som jag använder det än PM Plus men det saknar PM Plus specialiserade kommunikationslösningar för exv. sportfotograferna. Men priset! Det kostar ca 1/3 av vad PhotoMechanic nu kostar eller drygt 1700 SEK
Jag kan dock helt ärligt säga att jag inte främst migrerat till iMatch p.g.a. priserna - jag har ju en evighetslicens av PM Plus också. Det som istället varit helt avgörande för mig har varit att jag blivit mycket effektivare med iMatch än jag varit med PhotoMechanic främst för att PM inte klarar av att automatisera produktionen av "Description"-texterna och "Keywords". PM saknar idag fullständigt allt vad AI heter och känns plötsligt väldigt ålderdomligt.
Det har också spelat viss roll att iMatch är ett mer mångsidigt DAM som även kan knyta metadata till både PDF- och Office-dokument så det är ett DAM i sin riktiga betydelse då det inte enbart är byggt för bildhantering. iMatch står också på en modern och solid XMP-metadatagrund, vilket inte PM gör då det fortfarande som många konverterare såsom Capture One och Photolab och möjligen även Lightroom gör lutar sig helt på gamla IPTC internt även om de också sparar allt parallellt i XMP-data.
iMatch - Face Detection
I iMatch finns sedan några år ett smart och effektivt AI-drivet ”Face Detection”-system som kan konfigureras för att jobba i bakgrunden med att märka upp bilder med namn på de som finns på bilderna. Dessa kan sedan automatiskt bekräftas av systemet eller så gör man det med fördel i ett effektivt delsystem som kallas ”People”.
OBS! Här kan man effektivt bekräfta ”identiteterna” på folk och verifiera om automatiken ”gjort rätt” eller åtgärda eventuella missar automatiken gjort. Detta är extremt viktigt när man sedan kör AI-processningen med ”Autotagger”, eftersom man där enkelt kan skicka med lite kod i ”Description”-fält ”prompten” som göra att AI-systemet automatiskt kan skriva namnet på personerna i bild på ett intelligent sätt istället för att anonymt skriva exv. ”En man och en kvinna tittar på solnedgången”. De flesta uppskattar nog om det istället skulle stå ”Nisse Nilsson och Eva Persson tittar på solnedgången”. Vill man hellre ha bara förnamnen, så är även det enkelt ordnat. Hjälper man till med lite mer ad hoc-text så blir det oftast mycket bättre svar man får.
Imatch ”Autotagger” i arbete

Här fyra bilder som jag hjälpt till att styra upp lite med Autotagger-prompten. Nedan resultaten i klartext:
” Moscow Soviet Union 1978 - Ingrid Agneta Sändh stands beside a train. She wears a red coat and blue pants. The train shows destinations to Helsinki. The scene captures a moment of travel and excitement.”
Keywords: Coat, Smile, Station, Train, Travel, Woman
Den “kod” som fixar att systemet automatiskt hittar min fru i bilderna och inte bara en anonym kvinna och skriver in min frus namn i bilden ser ut som nedan:
{File.Persons.Label.Confirmed|hasvalue:These persons are shown in this image: {File.Persons.Label.Confirmed}.}
… mer behövs inte för det, vid sidan att personens bilder är ”bekräftade” för att ”Face Detection” AI och ”Autotaggers” AI ska samarbeta på bästa sätt
Mina "Prompt"-exempel:
När jag utan att överhuvudtaget styra annat än plats och årtal som ovan så får vi följande text för ”pionjär-marschen över Röda torget”-bilderna:
” Moscow Soviet Union 1978 - Soldiers march in formation on Red Square. The Kremlin wall stands in the background, along with notable historic buildings. People watch from a distance, observing the event.”
OpenAI identifierar ”Landmark” och skriver in både ”Kreml” och ”Red Square” automatiskt i ”Description”-fältet
Keywords: Building, Crowd, March, Sky, Soldiers, Square, Wall
Här skulle jag dock nog rättat ”Soldiers” för det är det ju inte fråga om här i strikt mening.
Hela prompningen av ”Description”- data
{File.Persons.Label.Confirmed|hasvalue:These persons are shown in this image: {File.Persons.Label.Confirmed}.}
Describe this image in the style of a magazine caption. Use factual language.
Always priority for gepgrafic data, the year and peoples names.
Always write text inside quotes but without the quote signs.
Describe this image in a style to make it easily searchable.
Use simple English, common words, factual language, and simple sentences.
Avoid describing anything not directly observable from the image.
Write the geografic data and year in the beginning of the text together with names
Prompning av “Keywords”- data
[[-c-]]
Keywords never in plural form
Return five to seven keywords describing this image.
Use simple English, common words, factual language.
Max one word in each keyword.
No geografic data or time info as keywords.
No words with only capital letters.
Promptningen av “Landmarks”-data
[[-c-]] Return the names of known landmarks and tourist spots in this image to {File.MD.description}
If you cannot detect any landmarks or tourist spots, return ''.
Senast ändrad:







