MYRIADER AF AI-VÆRKTØJER VÆLTER FREM

Da OpenAI gjorde deres AI-model tilgængelig for alle ved at tilbyde API’er og SDK’er, skabte det på ingen tid en underskov at værktøjer, der hver især egner sig til at løse forskellige opgaver. Derfor kan du i dag både bygge chatbots, generere billeder og video – og få tjekket din computerkode for fejl.

Helt parallelt med det har Microsoft integreret AI i Bing og Google har lanceret Bard, som er deres AI-værktøjer. Der er også opstået konkurrence, når det kommer til de underliggende sprogmodeller. Hen over sommeren har Meta frigivet Llama 2, som er deres bud på en open source Large Language Model (LLM), mens Anthropic har frigivet Claude.
Da konkurrencen er enorm, kan det altid betale sig, med jævne mellemrum at tjekke, om der er kommet nye og bedre værktøjer.

\ TEKSTGENERATORER / SØGEMASKINER

ChatGPT
Det værktøj, der først revolutionerede vores opfattelse af mulighederne med generativ AI, var ChatGPT, som man både kan sætte til at skrive stile, komme med opskrifter, lave idélister, tjekke computerkode eller svare på spørgsmål.
En af de helt store omvæltninger består i, at det bliver langt nemmere at stille spørgsmål på en naturlig måde og få svar i normal tekst. For nogle internetbrugere er det langt nemmere end det ret tunge arbejde, der kan ligge i at gennemsøge stribevis af Google-links for at finde et konkret svar på et simpelt spørgsmål.

Microsoft Bing
Microsoft har investeret 10 milliarder dollars i OpenAI, og er i gang med at integrere et AI-interface i Bing.
Google Bard
Google har selvfølgelig lanceret en konkurrent til ChatGPT. Og selv om mastodonten som udgangspunkt har været bagud på kvalitet, så ved man, at de har resurser og erfaring til at indhente konkurrenterne.

\ TEKST TIL FOTO

En hel stribe værktøjer til billedgenerering har skabt enorm opsigt, fordi de på meget kort tid er blevet i stand til at skabe illustrationer, der både er imponerende og i nogle tilfælde så realistiske, at man ikke kan skelne dem fra virkelige fotos. Hovedparten af værktøjerne tillader en håndfuld gratis forsøg, men hvis man vil skabe brugbare resultater, kræver det normalt betaling.

Midjourney
MidJourney har hidtil nok været det mest omtalte og imponerende tekst-til-foto værktøj. Tilgangen er pakket ind i chat-værktøjet Discord, hvor man stort set sidder og prompter og justerer, til, man har et passende resultat. Interfacet kræver lidt tilvænning, men når man kan de grundlæggende kommandoer er resultaterne imponerende.

Dall-E
Dall E2 er OpenAI’s eget værktøj, og som hos MidJourney er udgangspunktet prompt-baseret. Man har adgang til at skabe et mindre antal gratis billeder hver måned. Derefter må man købe ”credits”, som kan bruges til at skabe billeder.

Stable Diffusion
Stable Diffusion er som udgangspunkt også prompt-baseret, men giver også mulighed for, at elementer med drop-down menuer og kan derfor virke mere tilgængelig for første-gangs brugere. Det er muligt at downloade og installere din egen udgave.

Adobe Photoshop Generative Fill
Adobe er en mastodont inden for grafisk software, og har ret hurtigt integreret AI-værktøjer i deres software. I første omgang giver programmerne mulighed for at skifte dele af et foto eller en illustration ud med indhold genereret af AI-værktøjer.

KODEGENERATORER

Computerkode er simplere at forudsige end almindeligt sprog, fordi kodesprog har et begrænset ordforråd og er opbygget langt mere forudsigeligt.

GitHub Copilot
Programmet kan tjekke din computerkode for fejl og kan i et vist omfang foreslå kode ud fra, hvad du hidtil har skrevet. Hvis du har koden i et program, kan GitHub Copilot vise, hvordan det skrives i et andet programmeringssprog.

\ TALE TIL TEKST

Good Tape
Der har i mange år eksisteret transskriberingsværktøjer, men de fungerede som regel bedst på engelsk. Men danske Zetland har benyttet OpenAI til at bygge deres egen tale-til-tekst generator med navnet ”Good Tape”. Du kan transskribere tre optagelser gratis hver måned. Derefter koster programmet 15 € pr. måned.

\ TEKST TIL VIDEO

Vi har i et par år haft video-værktøjer, som kunne få et ansigt til at læse en tekst op. Det blev i længden lidt kedeligt. Nogle værktøjer skaber video på samme måde samme måde som Midjourney skaber still-fotos. En anden type af video-værktøjer trækker på et stort bibliotek af stock-video og grafik og er i stand til at tage dit video-manuskript og genere en video med voice-over. De fleste værktøjer i denne kategori koster penge men tillader, at man tester.

RunwayML
Her arbejder du med prompts på samme måde som tekst-til-billeder-værktøjer. Men i stedet for billeder får du video. Kvaliteten er endnu ikke på niveau med de fotos, man kan generere.

Pictory
Upload din artikel, manuskript eller billeder og udnyt programmets skabeloner til at skabe videoer ret hurtigt og med en god evne til at ramme de rette typer af videoklip.

Lumen5
Lumen er nok lidt mere ”corporate”. Vælg en skabelon og tilføj derefter dit eget manuskript og egne medier. Skulle AI-værktøjet skabe fejl, så er det nemt at rette. Du kan også bede om at få en automatisk voice-over stemme.

Pika Labs
Pika Labs benytter samme prompt-interface som Midjourney (Discord). Selv om det stiller en del krav til brugerne, så betyder det også, at man lynhurtigt lærer af andre brugeres prompts. Video-sekvenserne er blot på 3-4 sekunder og har relativt lidt bevægelse, men kvaliteten begynder at ligne den, mange kender fra Midjourney tidligere på året.

\ TEKST TIL MUSIK

Stable Audio
Hos Stable Audio kan du skabe din egen melodistump og selv styre lydbilledet alene ved at beskrive genrer, udtrykket og instrumenterne i tekst-form. Stable Audio skaber endnu ikke melodier, der går over i pophistorien, men resultatet fx bruges som underlægningsmusik til din næste video. Man skal dog betale (12$/md) for at måtte bruge musikken kommercielt.

\ TEKST TIL TALE

Eleven Labs
Eleven Labs gør det muligt at få læst tekster op på en hel stribe sprog og for en gangs skyld er den danske udgave ikke robot-agtig. Du kan tillige klone din egen stemme og bruge den som udgangspunkt på flere sprog. Kombineret med Google Translate og vil du pludseligt kunne lave video-speaks på en stribe sprog.

AI kunstig intelligens

Forfatteren Ernst Poulsen

Freelance-journalist. Skriver og fotograferer om IT / teknologi samt journalistik og digitale medier. Har en fortid som nyhedsredaktør i DR.dk chefredaktionen, webredaktør i Københavns Amt, jourhavende på jp.dk og IT-journalist på Politiken. Stikker gerne til skovs for at løbe orienteringsløb.
Mail: ernst@ernstpoulsen.com - Twitter: @ernstpoulsen

Skriv en kommentar Annuller svar

This site uses Akismet to reduce spam. Learn how your comment data is processed.