Gemma 4, un bug periculos în VSCode și cât costă cu adevărat AI-ul la scară: știrile săptămânii

Uneori o săptămână în tech îți oferă o imagine completă asupra momentului în care ne aflăm: progres rapid, riscuri noi și întrebări practice despre costuri și resurse. Iată ce merită atenția ta azi.

Gemma 4 12B: Google aduce multimodalitatea în open source

Google a lansat Gemma 4 12B, un model multimodal unificat, fără encoder separat — o arhitectură mai curată și mai eficientă decât abordările anterioare. Ce înseamnă asta în practică? Poți rula un model capabil să înțeleagă atât text, cât și imagini, pe hardware accesibil, fără să depinzi de servicii cloud. Pentru echipele care construiesc aplicații și vor control complet asupra datelor, acesta e un pas important. Citește mai mult →

Un bug în VSCode poate fura token-uri GitHub cu un singur click

Aceasta e știrea care ar trebui să ajungă urgent la echipele de securitate: un cercetător a descoperit o vulnerabilitate în VSCode prin care un atacator poate extrage token-ul tău GitHub cu o singură interacțiune malițioasă. Dacă folosești extensii sau deschizi proiecte din surse necunoscute, riscul este real. Actualizează VSCode imediat și verifică token-urile active din contul tău GitHub — mai bine revocate și regenerate decât compromise. Detalii tehnice →

Microsoft lansează MAI-Code-1-Flash: un model de coding rapid și eficient

Microsoft a introdus MAI-Code-1-Flash, un model specializat pentru generarea de cod, optimizat pentru viteză și cost redus per token. Vine într-un moment în care competiția în spațiul modelelor de coding este acerbă, dar diferențierea prin latență scăzută și prețuri competitive este o strategie solidă. Pentru companiile care integrează AI în fluxurile de CI/CD sau în tool-uri interne, un model „flash" poate face diferența între o soluție viabilă și una prea costisitoare. Anunțul oficial →

Uber plafonează cheltuielile AI la 1.500$/lună per angajat — și ce ne spune asta

Simon Willison analizează decizia Uber de a limita accesul la unelte AI la 1.500 de dolari pe lună per utilizator — o sumă care pare mare, dar care în contextul unor echipe întregi devine rapid semnificativă. Articolul ridică o întrebare esențială: cum stabilești valoarea reală a acestor unelte față de cost? E o lectură utilă pentru orice manager sau CTO care se confruntă cu aceleași dileme bugetare. Analiza completă →

VRAM-ul GPU-ului tău Nvidia, transformat în spațiu swap pe Linux

Un proiect interesant din comunitate propune o soluție ingenioasă: folosirea memoriei VRAM de pe plăcile Nvidia drept spațiu swap pe Linux, prin NBD (Network Block Device). Pentru cei care rulează modele mari local și se lovesc de limitele RAM-ului de sistem, aceasta e o alternativă creativă care merită explorată — cu precauțiile de rigoare. Proiectul pe GitHub →

Perspectiva mea: Săptămâna aceasta confirmă ceva ce văd și în proiectele cu clienții din Cluj: adoptarea AI devine tot mai matură, dar aduce cu ea responsabilități noi — de securitate, de cost și de alegere arhitecturală. Nu există scurtătură; trebuie să înțelegi uneltele pe care le folosești.

Gemma 4 12B: Google aduce multimodalitatea în open source

Un bug în VSCode poate fura token-uri GitHub cu un singur click

Microsoft lansează MAI-Code-1-Flash: un model de coding rapid și eficient

Uber plafonează cheltuielile AI la 1.500$/lună per angajat — și ce ne spune asta

VRAM-ul GPU-ului tău Nvidia, transformat în spațiu swap pe Linux