MYRIADER AF AI-VÆRKTØJER VÆLTER FREM
Helt parallelt med det har Microsoft integreret AI i Bing og Google har lanceret Bard, som er deres AI-værktøjer. Der er også opstået konkurrence, når det kommer til de underliggende sprogmodeller. Hen over sommeren har Meta frigivet Llama 2, som er deres bud på en open source Large Language Model (LLM), mens Anthropic har frigivet Claude.
Da konkurrencen er enorm, kan det altid betale sig, med jævne mellemrum at tjekke, om der er kommet nye og bedre værktøjer.
\ TEKSTGENERATORER / SØGEMASKINER
ChatGPT
Det værktøj, der først revolutionerede vores opfattelse af mulighederne med generativ AI, var ChatGPT, som man både kan sætte til at skrive stile, komme med opskrifter, lave idélister, tjekke computerkode eller svare på spørgsmål.
En af de helt store omvæltninger består i, at det bliver langt nemmere at stille spørgsmål på en naturlig måde og få svar i normal tekst. For nogle internetbrugere er det langt nemmere end det ret tunge arbejde, der kan ligge i at gennemsøge stribevis af Google-links for at finde et konkret svar på et simpelt spørgsmål.
Microsoft Bing
Microsoft har investeret 10 milliarder dollars i OpenAI, og er i gang med at integrere et AI-interface i Bing.
Google Bard
Google har selvfølgelig lanceret en konkurrent til ChatGPT. Og selv om mastodonten som udgangspunkt har været bagud på kvalitet, så ved man, at de har resurser og erfaring til at indhente konkurrenterne.
\ TEKST TIL FOTO
En hel stribe værktøjer til billedgenerering har skabt enorm opsigt, fordi de på meget kort tid er blevet i stand til at skabe illustrationer, der både er imponerende og i nogle tilfælde så realistiske, at man ikke kan skelne dem fra virkelige fotos. Hovedparten af værktøjerne tillader en håndfuld gratis forsøg, men hvis man vil skabe brugbare resultater, kræver det normalt betaling.
Midjourney
MidJourney har hidtil nok været det mest omtalte og imponerende tekst-til-foto værktøj. Tilgangen er pakket ind i chat-værktøjet Discord, hvor man stort set sidder og prompter og justerer, til, man har et passende resultat. Interfacet kræver lidt tilvænning, men når man kan de grundlæggende kommandoer er resultaterne imponerende.
Dall-E
Dall E2 er OpenAI’s eget værktøj, og som hos MidJourney er udgangspunktet prompt-baseret. Man har adgang til at skabe et mindre antal gratis billeder hver måned. Derefter må man købe ”credits”, som kan bruges til at skabe billeder.
Stable Diffusion
Stable Diffusion er som udgangspunkt også prompt-baseret, men giver også mulighed for, at elementer med drop-down menuer og kan derfor virke mere tilgængelig for første-gangs brugere. Det er muligt at downloade og installere din egen udgave.
Adobe Photoshop Generative Fill
Adobe er en mastodont inden for grafisk software, og har ret hurtigt integreret AI-værktøjer i deres software. I første omgang giver programmerne mulighed for at skifte dele af et foto eller en illustration ud med indhold genereret af AI-værktøjer.
KODEGENERATORER
Computerkode er simplere at forudsige end almindeligt sprog, fordi kodesprog har et begrænset ordforråd og er opbygget langt mere forudsigeligt.
GitHub Copilot
Programmet kan tjekke din computerkode for fejl og kan i et vist omfang foreslå kode ud fra, hvad du hidtil har skrevet. Hvis du har koden i et program, kan GitHub Copilot vise, hvordan det skrives i et andet programmeringssprog.
\ TALE TIL TEKST
Good Tape
Der har i mange år eksisteret transskriberingsværktøjer, men de fungerede som regel bedst på engelsk. Men danske Zetland har benyttet OpenAI til at bygge deres egen tale-til-tekst generator med navnet ”Good Tape”. Du kan transskribere tre optagelser gratis hver måned. Derefter koster programmet 15 € pr. måned.
\ TEKST TIL VIDEO
Vi har i et par år haft video-værktøjer, som kunne få et ansigt til at læse en tekst op. Det blev i længden lidt kedeligt. Nogle værktøjer skaber video på samme måde samme måde som Midjourney skaber still-fotos. En anden type af video-værktøjer trækker på et stort bibliotek af stock-video og grafik og er i stand til at tage dit video-manuskript og genere en video med voice-over. De fleste værktøjer i denne kategori koster penge men tillader, at man tester.
RunwayML
Her arbejder du med prompts på samme måde som tekst-til-billeder-værktøjer. Men i stedet for billeder får du video. Kvaliteten er endnu ikke på niveau med de fotos, man kan generere.
Pictory
Upload din artikel, manuskript eller billeder og udnyt programmets skabeloner til at skabe videoer ret hurtigt og med en god evne til at ramme de rette typer af videoklip.
Lumen5
Lumen er nok lidt mere ”corporate”. Vælg en skabelon og tilføj derefter dit eget manuskript og egne medier. Skulle AI-værktøjet skabe fejl, så er det nemt at rette. Du kan også bede om at få en automatisk voice-over stemme.
Pika Labs
Pika Labs benytter samme prompt-interface som Midjourney (Discord). Selv om det stiller en del krav til brugerne, så betyder det også, at man lynhurtigt lærer af andre brugeres prompts. Video-sekvenserne er blot på 3-4 sekunder og har relativt lidt bevægelse, men kvaliteten begynder at ligne den, mange kender fra Midjourney tidligere på året.
\ TEKST TIL MUSIK
Stable Audio
Hos Stable Audio kan du skabe din egen melodistump og selv styre lydbilledet alene ved at beskrive genrer, udtrykket og instrumenterne i tekst-form. Stable Audio skaber endnu ikke melodier, der går over i pophistorien, men resultatet fx bruges som underlægningsmusik til din næste video. Man skal dog betale (12$/md) for at måtte bruge musikken kommercielt.
\ TEKST TIL TALE
Eleven Labs
Eleven Labs gør det muligt at få læst tekster op på en hel stribe sprog og for en gangs skyld er den danske udgave ikke robot-agtig. Du kan tillige klone din egen stemme og bruge den som udgangspunkt på flere sprog. Kombineret med Google Translate og vil du pludseligt kunne lave video-speaks på en stribe sprog.