Google a lansat Gemini 2.0, cea mai avansată suită a sa de modele de inteligenţă artificială de până acum.E disponibilă pentru toţi utilizatorii
Lansările continue făc parte dintr-o strategie mai amplă a Google de a investi masiv în ”agenţi AI”, pe măsură ce cursa înarmărilor în AI se intensifică atât printre giganţii din tehnologie, cât şi printre startupuri, relatează CNBC.
În decembrie, compania a oferit acces dezvoltatorilor şi testerilor de încredere, integrând unele funcţionalităţi în produsele sale, însă aceasta este prima lansare generală, potrivit Google.
Noua suită include mai multe modele
Noua suită include mai multe modele, printre care Gemini 2.0 Flash, descris ca un model optimizat pentru sarcini de mare volum şi frecvenţă, 2.0 Pro Experimental, axat în principal pe performanţa în programare, şi 2.0 Flash-Lite, promovat drept cel mai eficient model din punct de vedere al costurilor.
Costurile pentru dezvoltatori sunt de 10 cenţi pe milion de tokeni pentru intrări de text, imagine şi video în cazul modelului Flash, în timp ce versiunea mai economică, Flash-Lite, are un cost de 0,75 cenţi pentru aceeaşi utilizare.
Aceste lansări fac parte dintr-o strategie mai amplă a Google de a investi masiv în dezvoltarea agenţilor AI, într-un context în care competiţia dintre marile companii tehnologice şi startupuri în acest domeniu se intensifică.
Meta, Amazon, Microsoft, OpenAI şi Anthropic dezvoltă, de asemenea, modele AI capabile să finalizeze sarcini complexe în mai mulţi paşi, fără ca utilizatorul să fie nevoit să le ghideze la fiecare etapă.
Google a precizat într-o postare din decembrie că a investit în dezvoltarea unor modele care pot înţelege mai bine mediul înconjurător, anticipa paşii următori şi acţiona în locul utilizatorului, sub supravegherea acestuia.
Gemini 2.0 aduce progrese în multimodalitate, precum generarea nativă de imagini şi sunete, dar şi capacităţi avansate de utilizare a instrumentelor digitale, ceea ce va contribui la dezvoltarea unor noi agenţi AI care să apropie Google de viziunea sa privind un asistent universal.
Anthropic, startupul AI susţinut de Amazon şi fondat de foşti cercetători OpenAI, este un concurent important în această cursă.
În octombrie, compania a anunţat că agenţii săi AI pot utiliza computere asemenea oamenilor pentru a îndeplini sarcini complexe. Tehnologia lor poate interpreta conţinutul ecranului, selecta butoane, introduce text, naviga pe internet şi executa sarcini în orice software, inclusiv prin navigare în timp real.
Jared Kaplan, directorul ştiinţific al Anthropic, a declarat într-un interviu pentru CNBC că tehnologia poate îndeplini sarcini în zeci sau chiar sute de paşi.
OpenAI a lansat recent un instrument similar, numit Operator, capabil să automatizeze sarcini precum planificarea vacanţelor, completarea formularelor, rezervarea la restaurante şi comandarea produselor alimentare.
Microsoft, principalul investitor al OpenAI, susţine că Operator funcţionează ca un agent care poate accesa internetul pentru a îndeplini diverse sarcini în numele utilizatorului.
Săptămâna aceasta, OpenAI a mai anunţat un instrument numit Deep Research, care permite unui agent AI să compileze rapoarte complexe de cercetare şi să analizeze subiecte la cererea utilizatorului.
Google a lansat în decembrie un instrument cu acelaşi nume, destinat explorării unor teme complexe şi redactării de rapoarte personalizate.
CNBC a relatat încă din decembrie că Google intenţiona să introducă mai multe funcţionalităţi AI la începutul anului 2025.
Într-o întâlnire strategică de la sfârşitul anului trecut, Sundar Pichai, CEO-ul Google, a declarat că în istorie nu este întotdeauna necesar să fii primul, dar trebuie să execuţi bine şi să livrezi cel mai bun produs din clasă. Potrivit lui Pichai, anul 2025 va fi despre atingerea acestui obiectiv.
Articolul Google a lansat Gemini 2.0, cea mai avansată suită a sa de modele de inteligenţă artificială de până acum. E disponibilă pentru toţi utilizatorii apare prima dată în Monitorul Expres – Stiri Brasov.
Citeste mai mult