U posljednjih nekoliko godina, napredak u području umjetne inteligencije promijenio je način na koji pristupamo rješavanju problema i dolazimo do informacija. Među najnovijim dostignućima u ovom području je model nazvan DeepSeek, koji je već pokazao da ima potencijal ostaviti dubok trag na industriji. Iako je početni entuzijazam za DeepSeek možda blijedio, tri ključne promjene koje je ovaj model pokrenuo već su uspostavljene i osigurat će njegovo naslijeđe u razvijanju AI tehnologije.
Prvo, energijska efikasnost AI modela predstavlja ključnu temu za raspravu.
Jedna od najupečatljivijih karakteristika DeepSeeka je njegova kompleksna metoda zaključivanja koja koristi tehniku lančanih odgovora. Ova metoda omogućuje modelu da razbije složena pitanja i logički odgovori na svaki dio, čineći ga iznimno sposobnim za rješavanje matematičkih, logičkih i koderskih zadataka. Međutim, često zanemarivana posljedica ovog metoda su energetski troškovi koji nastaju tijekom procesa.
Za razliku od tradicionalnijih AI modela, DeepSeek zahtijeva znatno više električne energije tijekom faze zaključivanja, što dovodi do zabrinutosti među stručnjacima. Dok je trenutni doprinos AI modela globalnim emisijama relativno manji, postoji rastuća politička podrška koja bi mogla drastično povećati energiju potrebnu za rad ovakvih sustava. Bez sumnje, važno je razmotriti što znači koristiti AI – dok istraživanja koja se fokusiraju na liječenje teških bolesti mogu opravdati višu potrošnju energije, korištenje modela za banalne upite može biti neodgovorno.
Neki stručnjaci izražavaju zabrinutost da će uspjeh DeepSeeka dovesti do njegovog prekomjernog korištenja u aplikacijama koje se ne oslanjaju na njegove napredne sposobnosti. Na primjer, kada korisnici traže jednostavna objašnjenja kao što je Einsteinova teorija relativnosti, u takvim slučajevima bi jednostavniji modeli mogli biti podjednako učinkoviti uz znatno manju potrošnju energije.
Drugo, način na koji DeepSeek pristupa treniranju AI modela mogao bi postati novi standard u industriji.
Svijet napredne umjetne inteligencije ne prestaje sakupljati ogromne bazene podataka kao što su tekstovi, slike i videozapisi; ono se također oslanja na ljudski faktor koji igra ključnu ulogu u procesu filtriranja i obrade tih podataka. Ljudski evaluatori obično pomažu AI modelima kroz proces poznat kao učenje pojačanja s ljudskim povratnim informacijama (RLHF), gdje model generira odgovor koji zatim procjenjuju evaluatori, čime se unose potrebne korekcije za poboljšanje modela.
OpenAI je bio pionir u primjeni ove tehnike, no industrija je ubrzo preuzela izvanredne metode koje pruža. DeepSeek je dodatno unaprijedio ovu praksu, stvarajući još više interesa za uvođenje humano-intuitivnih pristupa u treniranju AI modela.
Takav napredak ne samo da osigurava veću pouzdanost u generirane odgovore, već i potencijalno smanjuje vrijeme potrebno za razvoj i treniranje AI sustava. Rastući interes za ove pristupe može potaknuti i druge tvrtke da istraže slične metode, što bi moglo dovesti do još učinkovitijih i održivijih AI rješenja.