Forside * Nyheder

Anthropic’s Claude 3 tager AI-førertrøjen på

5. marts 2024 - 2

En af de mellemstore spillere i AI-kapløbet har netop annonceret en ny AI-model, der angiveligt kan mere og yder bedre end OpenAIs GPT-4 og Googles Gemini 1.0 Ultra

Anthropic er et af de firmaer, der forsøger at gøre OpenAIs førerposition rangen stridig, og svømmer dermed i det samme kølvand som Google og en række andre, mindre firmaer. Når Anthropic anses for at være en af de mellemstore spillere på AI-markedet, handler det ikke så meget om økonomisk størrelse, men teknologisk gennemslagskraft.

Anthropics svar på ChatGPT, LLM-botten Claude, har formået at holde sig i den forreste del af feltet, til trods for at Anthropics AI-produkter ikke er bundet op på en velstående techgigant, sådan som Googles eller OpenAIs. Sidstnvnte har siden 2019 har fået penge fra Microsoft. (Anthropic har dog modtaget investeringer fra Google, men mest fra venturekapital-firmaer i Silicon Valley)

Annonce:

Netop OpenAIs voksende partnerskab med Microsoft var grunden til at Anthropic blev stiftet. Selvom firmaet ikke er en non-profit-organisation ligesom OpenAI, har dets ledere og stiftere en klar mission, nemlig at bruge AI til at gøre verden til et bedre sted. Det er endda skrevet ind i virksomhedens vedtægter.

Anthropic blev stiftet af Dario Almodei, der var forskningschef hos OpenAI, indtil samarbejdet med Microsoft begyndte at stride mod de gode intentioner. I 2019 investerede Microsoft en milliard dollar i OpenAI, og det fik Almodei og hans søster Daniela (der også var i toppen af OpenAI) til at forlade selskabet.

Slår GPT-4 og Gemini på en række benchmarks

De stiftede Anthropic sammen med en række andre OpenAI-folk, der var bekymrede for udviklingen i OpenAI. Og det har altså nu ledt frem til annonceringen af Claude 3, der lige nu ser ud til at have førertrøjen på, når det gælder LLM-baserede AI-chatbots.

Sådan er det i hvert fald, hvis man skal stole på de benchmarks, Anthropic selv har kørt Claude 3 igennem, som du kan se herunder. Her sammenligner de med både OpenAIs og Googles modeller, og Claude slår dem alle på benchmarks som ”Almenviden på Bachelor-niveau”, ”Folkeskole-matematik”, samt genering af kode. Du kan læse mere om detaljerne her.

Især det sidste synes Claude 3 at være bedre til end konkurrenterne. Generering af kode er en særlig vigtig kategori for tech-branchen, fordi det forventes at spare mange kodetimer (og dermed programmørjobs) væk. Her er den højstydende og dyreste af de tre nye Claude 3-modeller, Claude 3 Opus, væsentligt bedre end både GPT-4 og Googles Gemini 1.0 Ultra. Claude 3 scorer 84.9% mod henholdsvis 67.0% og 74.4%.

Matematik er ikke AI’ernes stærke side

Det er dog interessant at se, at Claude 3 stadig kun scorer 60,1% når det gælder løsning af matematik-opgaver. Og det er endda væsentligt bedre end GPT-4 og Gemini 1.0 Ultra. Man skulle tro, at lige præcis matematik ville være en nem opgave for en AI, når man nu tager i betragtning, at en computer i princippet blot er en lommeregner på nogle meget stærke steroider.

Men som undertegnede fandt ud af, da jeg bad Claude 3s forgænger tælle antallet af celler med en bestemt værdi ud af i alt 44 celler i et Excel-dokument, så har det der med tal ikke været LLM’ernes stærke side endnu. Claude 2 kunne simpelthen ikke løse denne simple opgave med et korrekt resultat. Måske kan Claude 3 gøre det bedre.

De tre niveauer, man kan bruge Claude 3 på (efter ydelsesbehov og betalingsevne) hedder Opus, Sonnet og Haiku, hvor Opus som nævnt er den kraftigste. Du kan prøve Claude 3 Haiku nu i en gratisversion her.

Annonce:

Anthropic’s Claude 3 tager AI-førertrøjen på

En af de mellemstore spillere i AI-kapløbet har netop annonceret en ny AI-model, der angiveligt kan mere og yder bedre end OpenAIs GPT-4 og Googles Gemini 1.0 Ultra

Slår GPT-4 og Gemini på en række benchmarks

Matematik er ikke AI’ernes stærke side

Seneste nyt

Regeringen vil sænke elafgiften til EU’s minimumssats over de næste år

Danmark får første anlæg til produktion af mikrochips i topklasse

Sennheiser lancerer stor opdatering til AMBEO Soundbar | Max

Google lancerer ny Pixel 10-serie med indbygget AI og mange forbedringer

Google præsenterer nyt Pixel-udstyr i dag – Sådan ser du med

Seneste fokus

TEST: Shokz OpenDots ONE – Til aktive uden at få propper...

Fastspeed politianmeldt for vildledende reklame

Test: Vi udfordrer ‘kongen’ Sony WH-1000XM6 med 3 billigere konkurrenter

Ny Matter forbedrer smart home

Test: Dxracer Master XL gaming/kontorstol