Googles kunngjøring på sin nye språklige modell, Gemini, løftet et slør av nysgjerrighet og skepsis. Selv om reklamevideoen lovet ekstraordinær ytelse, har noen undersøkelser og observasjoner kastet lys betydelige avvik mellom det som vises og faktiske evner av systemet. I følge eminente kilder, veldig forsiktig, potensialet ville være lavere enn det som er beskrevet.
Sannheten bak Gemini-kampanjevideoen: all røyk og ild?
I løpet av de siste presentasjon av Gemini, Google traff publikum med en video som viser de antatt avanserte egenskapene til den nye AI-språkmodellen. Det tok imidlertid ikke lang tid før noen medier, bl.a Bloomberg, begynte de å tviler på ektheten til disse forestillingene.
I videoen så Gemini ut til å være i stand til å umiddelbart tolke en rekke bevegelser, inkludert stein, papir og saks. Men som senere dukket opp, for å få nøyaktige svar fra Gemini, du må vise alle tre bevegelsene og gi spesifikke veiledende spørsmål. Dette antyder at selve prosessen er mer komplisert og mindre intuitiv enn det som ble fremstilt i utgangspunktet.
Beskyldninger om å ha "pyntet" de virkelige egenskapene til det nevrale nettverket har reist tvil om Googles åpenhet og ærlighet i å presentere sine innovasjoner. I følge noen Google-ansatte, som foretrakk å være anonyme, gjenspeilte ikke demonstrasjonsvideoen Geminis virkelige evner. Dette synet ble ytterligere bekreftet av Eli Collins fra Google DeepMind, som innrømmet at noen av de demonstrerte funksjonene, for eksempel andetegningen, de er fortsatt på forskningsnivå og ikke fullt integrert i produktet.
Til tross for disse avsløringene, hevder Google at videoen var ment å være en forenklet representasjon av Geminis evner for underholdningens og klarhetens skyld. Beskrivelsen av videoen på YouTube innrømmer faktisk at presentasjonen ble forkortet for disse formålene.
Under en test utført med Gemini gjennom Google Bard chatbot, la journalister merke til at egenskapene til den nye AI-modellen skilte seg ikke vesentlig fra GPT-3.5. Dette reiser spørsmål om den faktiske teknologiske fremgangen Gemini representerer sammenlignet med eksisterende modeller.
De tre variantene av Gemini
Det er tre versjoner av det nevrale nettverket: Ultra, pro e Nano. Førstnevnte er designet for å fungere i datasentre og bedriftsapplikasjoner, sistnevnte er fokusert på Bard og andre Google-tjenester, og Nano er designet for offline arbeid på Android. Sistnevnte er allerede annonsert for Pixel 8Pro. Som et eksempel på bruken viste Google sammendraget av informasjon fra taleopptak.