Annons

Är maskininlärning snyltande?

Produkter
(logga in för att koppla)

PMD

Aktiv medlem
Trådrubrikens fråga inspirerades av nedanstående, men frågan är lite bredare eftersom maskininlärning inte bara handlar om bilder.

Det kommer nog även bli svårare för AI att snylta hej vilt på det material som de i dag tar för givet att de bara kan snylta på.

Är maskininlärning snyltande? Hur i så fall?
Är inte mänsklig inlärning lika mycket snyltande?
 

Falumas

Aktiv medlem
Att helt rakt av sno all data från forum, social media etc är väl ett slags snyltande. Tror att många fler än Twitter kommer dra åt kranen för hur det är möjligt att damsuga deras data på nätet.
Många tjänster lever på sin egen data och vill nog inte dela med sig hur som helst. Alternativt ha pengar för att dela med sig.
 

Falumas

Aktiv medlem
Har du ett par tusen brusiga bilder på olika motiv, så tror jag inte alls att det är dåligt. Det har nog många av oss.

Däremot är det säkerligen svårt att göra en chatbot som är speciellt bra utan att dammsuga wikipedia och x antal forum och dagstidningar etc.

Men du kan säkerligen köpa informationen du behöver, istället för att bara ta den.

Skänken slant (som flyttgubben sade) till Wikipedia och köp några tidningars arkiv, så har du nog en rätt bra grund till din chatbot.

Men att bara "ta" allt man hittar på nätet och använda det är billigare än att köpa det. Vilket givetvis gäller våra bilder också.
 

Falumas

Aktiv medlem
Måste dock säga att rubriken på denna tråd är mycket märklig. Maskininlärning sköts helt utan snyltande på egen eller köpt data i många fall.

Det är väl mer dammsugande av allt man kommer över på nätet som är snyltande. Vilket givetvis är det mest effektiva sättet att bygga upp sin databas.
 

PMD

Aktiv medlem
Att helt rakt av sno all data från forum, social media etc är väl ett slags snyltande. Tror att många fler än Twitter kommer dra åt kranen för hur det är möjligt att damsuga deras data på nätet.
Ungefär som när du lär dig nya saker genom att läsa webbsidor, alltså?
Många tjänster lever på sin egen data och vill nog inte dela med sig hur som helst. Alternativt ha pengar för att dela med sig.
Jag utgår från att de som kör ML på webbdata inte använder data som de har krakkat sig till.
Annars är det förstås snyltande.
 

PMD

Aktiv medlem
Måste dock säga att rubriken på denna tråd är mycket märklig. Maskininlärning sköts helt utan snyltande på egen eller köpt data i många fall.

Det är väl mer dammsugande av allt man kommer över på nätet som är snyltande. Vilket givetvis är det mest effektiva sättet att bygga upp sin databas.
Varför är det snyltande? Som jag skrev i inlägg #7 så förutsätter jag att de som kör ML-system inte gör olagligheter utan använder öppna data. Dataintrång är givetvis olagligt och därmed snyltande, så det kan vi lämna därhän.

Förutom att foruminlägget som refereras i denna tråds urinlägg triggade en önskan om en diskussion om det här ämnet så har jag sett en del på nätet som ifrågasätter hur ML använder data. Det senaste var nog denna Fotosidanartikel:
Se föreläsning 3, "Appropriation or Theft? AI-Generated Images in the Context of Art History"
 

Falumas

Aktiv medlem
Nu är ju dammsugning av data inte något nytt utan många t.ex. Google har gjort det länge. Där har det dock funnits sätt att säga till Google att inte dammsuga din data eller delar av den.

Så dammsugning av data är inte lika med maskininlärning.

Många t.ex fotosidan har sin hemsida som del av sitt levebröd. Om folk inte konsumerar deras data genom deras reklamfinansierad webbsida utan via en chatbot så kommer dom gå under.
 

Tonyeagle

Aktiv medlem
Och dammsugning av nätet torde vara en riktigt dålig strategi för faktainhämtning om den sker generellt och inte bara dammsuger faktakontrollerade sidor eller korsjämför med algoritmer som kan statistiskt säkerställa materialet i någon grad.
 

Gamle

Aktiv medlem
Att träna e ett AI-program är väl att göra som så många gör på sociala medier? Använda andras bilder. Som regel utan tillstånd.
 

Ibis

Aktiv medlem
Jag tycker själv att det är på ett sätt att snylta.

Låt oss säga att en målande konstnär med en väldigt tydlig stil får sin stil kopierad på följande sätt:

Av en människa.
Denna människa har själv behövt sitta ner otaliga timmar och lärt sig hur man drar en pensel, lärt sig hantera färg och förståelsen av hur tidigare nämnda konstnär jobbar med form, färg och komposition etc. Denna lär sig troligtvis samtidigt att också uttrycka sig själv, eller får verktygen för det.

Tidigare nämnda konstnär kan troligtvis relatera till denna människa sett till hantverket de båda genomför och allt däromkring; doften av färg, ljudet av pensel mot duk etc.

Samt att det är tja, en tänkande, kännande människa vi pratar om.

Fortfarande snyltande på ett vis men ändå inte utan en rejäl ansträngning i botten.

Av ett neuralt nätverk
Ett bolag eller individ laddar in ett rejält bibliotek bilder av tidigare nämnda konstnärs verk (samt hundratusentals andras) och matar dem till ett neuralt nätverk som tränas på allas stilar.
Inte någonstans kämpar en tänkande, kännande människa i detta, ingen inblandad kan sägas ha några konstnärliga anspråk i vad de gör.

När nätverket är tränat kan vem som helst med några skrivna ord "skapa" verk som liknar tidigare nämnda konstnärs verk utan någon som helst ansträngning, förståelse eller känsla för skapandet.

Jag kan inte låta bli att se det senare som mycket mer snyltande än det tidigare exemplet. Ett sorts omänsklig-görande av själva processen. Jag premierar alla gånger människors engagemang högre än tränad kod. Det finns så mycket mer att fundera över än endast själva slutresultatet eller produkten, så mycket i hur man tar sig dit och mellanmänskliga relationer.

Mina fem öre.
 
Senast ändrad:

PMD

Aktiv medlem
Många t.ex fotosidan har sin hemsida som del av sitt levebröd. Om folk inte konsumerar deras data genom deras reklamfinansierad webbsida utan via en chatbot så kommer dom gå under.
Ja, kanske, men klick som klick, liksom.

Risken att "folk" i stor utsträckning skulle "konsumera" data via en chatbot torde vara försvinnande liten. Hur skulle det gå till f.ö? Det är ju inte så att en chatbot speglar innehållet i websidor.
 

PMD

Aktiv medlem
Att träna e ett AI-program är väl att göra som så många gör på sociala medier? Använda andras bilder. Som regel utan tillstånd.
Nej, det handlar inte om att klippa och klistra.

Analogt med att du lär dig att fotografera genom att titta på andras bilder lär sig en generativ AI att skapa bilder genom att titta på andras bilder.
 

Erik Schalin

Aktiv medlem
Spelar egentligen ingen roll vad vi tycker. Tekniken är här o den kommer inte att backa.
Stora frågan är väl vad det gör med modell och fotografyrkena.
Kommer de försvinna helt i reklambranchen, troligtvis inte.
Kommer de påverkas, garanterat!
Kan en drone ersätta bröllopsfotografen?
Eller kör en fotograf 10 bröllop parallellt samtidigt?
 

Falumas

Aktiv medlem
Ja, kanske, men klick som klick, liksom.

Risken att "folk" i stor utsträckning skulle "konsumera" data via en chatbot torde vara försvinnande liten. Hur skulle det gå till f.ö? Det är ju inte så att en chatbot speglar innehållet i websidor.
Nej,1 klick om dammsugaren är dålig 0 om den är bra stället för tusentals.

Det sker redan med ChatGPT. Många fotorelaterade frågar svarar den med information från dpreview och andra forum.
 

REPPER

Aktiv medlem
Spelar egentligen ingen roll vad vi tycker. Tekniken är här o den kommer inte att backa.
Stora frågan är väl vad det gör med modell och fotografyrkena.
Kommer de försvinna helt i reklambranchen, troligtvis inte.
Kommer de påverkas, garanterat!
Kan en drone ersätta bröllopsfotografen?
Eller kör en fotograf 10 bröllop parallellt samtidigt?
Endast en tagen stillbild, men flera olika poser i efterhand med hjälp av AI. Nya Photoshop ger stora möjligheter – men bidrar också till urvattnandet av "den äkta bilden".
 

hampusm

Aktiv medlem
Jag tycker själv att det är på ett sätt att snylta.

Låt oss säga att en målande konstnär med en väldigt tydlig stil får sin stil kopierad på följande sätt:

Av en människa.
Denna människa har själv behövt sitta ner otaliga timmar och lärt sig hur man drar en pensel, lärt sig hantera färg och förståelsen av hur tidigare nämnda konstnär jobbar med form, färg och komposition etc. Denna lär sig troligtvis samtidigt att också uttrycka sig själv, eller får verktygen för det.

Tidigare nämnda konstnär kan troligtvis relatera till denna människa sett till hantverket de båda genomför och allt däromkring; doften av färg, ljudet av pensel mot duk etc.

Samt att det är tja, en tänkande, kännande människa vi pratar om.

Fortfarande snyltande på ett vis men ändå inte utan en rejäl ansträngning i botten.

Av ett neuralt nätverk
Ett bolag eller individ laddar in ett rejält bibliotek bilder av tidigare nämnda konstnärs verk (samt hundratusentals andras) och matar dem till ett neuralt nätverk som tränas på allas stilar.
Inte någonstans kämpar en tänkande, kännande människa i detta, ingen inblandad kan sägas ha några konstnärliga anspråk i vad de gör.

När nätverket är tränat kan vem som helst med några skrivna ord "skapa" verk som liknar tidigare nämnda konstnärs verk utan någon som helst ansträngning, förståelse eller känsla för skapandet.

Jag kan inte låta bli att se det senare som mycket mer snyltande än det tidigare exemplet. Ett sorts omänsklig-görande av själva processen. Jag premierar alla gånger människors engagemang högre än tränad kod. Det finns så mycket mer att fundera över än endast själva slutresultatet eller produkten, så mycket i hur man tar sig dit och mellanmänskliga relationer.

Mina fem öre.
I totalt antal timmar, och ansträngning, har det förmodligen investerats mer i koden än vad de båda konstnärerna lagt ner tillsammans under sina liv. Din liknelse är annars bra även om jag inte håller med om slutsatsen.
 
ANNONS