Er du interessert i dem TILBUD? Spar med våre kuponger på WHATSAPP o telegram!

Llama 3 utfordrer gigantene: her er Metas nye AI-modell

Meta har lagt til to nye språklige modeller til serien hans: Lama 3 8B e Lama 3 70B. Disse lover overlegen ytelse i en verden av kunstig intelligens. Den mest slående nyheten? Tilstedeværelsen av henholdsvis 8 milliarder og 70 milliarder parametere. Disse tallene representerer kompleksiteten og evnen til modellen til å håndtere og prosessere informazioni.

Llama 3 er ikke bare to modeller: mer materiale er på vei

Meta stopper ikke der; planlegger å slippe flere modeller i Llama 3-serien, men uten å spesifisere en dato. Denne strategien skaper forventning og viser også selskapets forpliktelse til å kontinuerlig forbedre sine tilbud.

I nye Llama-modeller de beskrives som et sprang fra tidligere modeller. Denne forbedringen skyldes delvis bruken av to tilpassede GPU-klynger, hver med 24.000 XNUMX enheter, noe som gjorde at modellene kunne trenes mer effektivt og nøyaktig. Meta hevder at disse modellene er det på grunn av antallet parametere de har blant de beste tilgjengelige i dag for generativ kunstig intelligens.

Llama 3s ytelse ble målt gjennom ulike AI-benchmarks, som er standardiserte tester som brukes til å evaluere egenskapene til AI-modeller. Disse inkluderer MMLU for kunnskap, ARC for tilegnelse av ferdigheter, f.eks DROP for resonnement om tekstblokker. Selv om det er ulike meninger om nytten av disse benchmarkene, er de fortsatt en vanlig metode for å evaluere og sammenligne egenskapene til AI-modeller.

Spesielt utkonkurrerte Llama 3 8B lignende åpen kildekode-modeller med færre parametere, som Mistral og Google Gemma, i minst ni forskjellige benchmarks. Dette inkluderer tester på generell kunnskap, resonnement og spesifikke ferdigheter innen områder som biologi, fysikk, kjemi, og til og med kodegenerering og matematikkproblemer. Noe GPT-4 for eksempel ikke kan gjøre særlig godt.

Den største modellen, Llama 3 70B, konkurrerer ikke bare, men overgår i noen tilfeller flaggskipmodeller som f.eks. Gemini 1.5 Pro fra Google i ulike tester, som viser at til tross for sterk konkurranse, kan den stå opp mot selv gigantene i sektoren. Det er imidlertid viktig å merke seg at mens den overgår noen flaggskipmodeller som f.eks Claude 3 Sonnet av Anthropic i flere tester når den ikke ytelsen til den mer avanserte Claude 3 Opus-modellen.

Tags:

Gianluca Cobucci
Gianluca Cobucci

Lidenskapelig opptatt av kode, språk og språk, menneske-maskin-grensesnitt. Alt som involverer teknologisk utvikling er av interesse for meg. Jeg prøver å spre lidenskapen min med den største klarhet, og stoler på pålitelige kilder og ikke "bare den første som kommer".

Abonner
Gi meg beskjed
gjest

0 kommentarer
Inline tilbakemeldinger
Se alle kommentarer
XiaomiToday.it
logo