DeepSeek-i mõju AI-maastikule
Selle aasta 20. jaanuaril lasi DeepSeek välja oma palju kõmu tekitanud uue vestlusroboti mudeli DeepSeek R1, mis on ehitatud nende V3 mudeli peale (väljastatud 2024 detsembris) ning on oma olemuselt väga sarnane ChatGPT-le. DeepSeek, Hiinas 2023. aastal Liang Wenfengi poolt asutatud tehisintellekti idufirma, on märkimisväärselt raputanud AI-tööstust, arendades tipptasemel AI-mudeleid murdosa tavapärasest maksumusest. Ettevõte väidab, et on koolitanud oma uusima mudeli, DeepSeek-V3, umbes 6 miljoni dollariga - märkimisväärselt vähem kui OpenAI hinnanguline üle 100 miljoni dollariline maksumus. Ettevõte on suutnud USA kiibiekspordi piirangutest mööda hiilida, varudes Nvidia A100 kiipe ja kasutades odavamaid alternatiive, et säilitada efektiivsus. DeepSeeki edu seadis kahtluse alla arusaama, et AI arendamine vajab tohutuid eelarveid ja tipptasemel kiipe. See ebakindlus põhjustas Nasdaqis 3% languse ja näiteks Nvidia aktsia kukkus korraga 17% ning ettevõtte turuväärtus langes 3,5 triljonilt dollarilt 2,9 triljonile, mis on päris ränk langus. [4]
DeepSeeki esiletõus on muutnud ülemaailmset AI-maastikku, seades kahtluse alla USA domineerimise ja tõstatades uusi küsimusi AI arenduse ja regulatsioonide tuleviku kohta. Siiski, on pisut kaheldav, et nad suutsid oma V3 mudeli nii madalate kuludega välja treenida. DeepSeek sai alguse High-Flyerist, Hiina riskifondist, mis integreeris AI-d oma kauplemisstrateegiatesse ning High-Flyer tegi strateegilisi investeeringuid 2021. aastal, ostes 10000 Nvidia A100 kiipi, enne kui USA ekspordipiirangud jõustusid. Praegu kuuluvad DeepSeekile ja High-Flyerile kokku umbes 50000 kiipi, sealhulgas H800 ja H20 mudelid, mis võimaldavad neil teha laialdasi tehisaruga seonduvaid arendustöid. See kindlasti seab kahtluse alla kas nad ikka treenisid oma V3 mudeli nii madalate kuludega välja. Pigem võiks arvata, et need kulutused kokku olid ikka palju suuremad, sest kui arvestada lisakulusid, nagu teadus- ja arendustegevus, andmete hankimine, infrastruktuur ja töötajad, siis tegelikud kulud olid oluliselt kõrgemad. Samas on DeepSeek lisanud ka mitu tehnoloogilist uuendust, et optimeerida treeningprotsessi, sealhulgas Multi-Token Prediction (MTP) ja "Mixture-of-experts" mudeli. [5]
Küsimuse all on muidugi ka turvalisuse teema. Ettevõte on ka globaalsete liidrite poolt suurenenud tähelepanu all. Austraalia on keelanud DeepSeeki valitsusseadmetes, väites, et see kujutab endast riikliku julgeoleku ohtu. Mitmed andmekaitseasutused üle kogu maailma on esitanud küsimusi, kuidas DeepSeek käsitleb isikuandmeid, mida hoitakse Hiinas asuvatel serveritel. Nende murede tõttu blokeeris Itaalia 30. jaanuaril DeepSeeki rakenduse ja käskis ettevõttel lõpetada oma kodanike isikuandmete töötlemine. [5] Ühesõnaga üsna ettevaatlik tasub DeepSeek-i kasutamisega hetkel olla. Igasugu isklikku infot või näiteks API võtmeid sinna kindlasti ei tasu kirjutada. Huvitav, kas Eesti võib samuti sellise asja ära keelata?
Kuna natuke sai ka ise DeepSeeki katsetatud, räägiks lähemalt siis DeepSeek R1 mudelist, mis on sarnase põhimõttega nagu OpenAI o1 mudel ChatGPT-l. See kujutab endas stiimulõpet ("reinforcement learning"), mis paistab silma oma struktureeritud arutluskäiguga. [2] Mida see tähendab, on see, et kui pärida midagi, siis kõigepealt ta mõtleb natuke ja seejärel kirjeldab, mida ta täpsemalt mõtleb ja kuidas ta plaanib päringut lahendada. Väga hästi sobib see sügavat loogilist analüüsi nõudvate ülesannete jaoks, nagu näiteks matemaatiline probleemide lahendamine, programmeerimine ja teadusuuringud. Stiimulõppes õpib mudel sisuliselt oma tegude tagajärgedest. [1] Standardina on muidu kasutusel juhendatud õpe ("supervised learning"), mis on ka kõige laialdasemalt kasutatud masinõppe tüüp, kus mudelit õpetatakse andmestikul, kus iga sisendi jaoks on juba õige väljund või silt ("label") olemas. [3] Isiklikult ütleks, et stiimulõppe mudel on päris hea vahend mõne keerulisema asja selgeks tegemisel, kuna see suudab tõesti väga põhjalikult ja "inimlikult" kõik lahti seletada. Mis mulle selle juures meeldib, on see, et see kirjeldab oma mõttekäikude juures mõtteid, mis on osutunud valeks ning püüab nende najal leida teisi lahendusi. Erinevalt juhendatud õppest, ei selgita see nii põhjalikult kõike lahti, mistõttu stiimulõppega mudeliga on reaalselt võimalik ka asju selgeks õppida, ilma, et annaks lihtsalt lõppvastuse kiirelt kätte. On võimalik aru saada, miks ja kuidas mingid otsused tehti ja sai tõesti targemaks ka.
Kokkuvõtteks võib öelda, DeepSeek-i tulek lõi AI-maailmas kaardid täiesti sassi. Samas on hea kui konkurents suureneb - hakatakse püüdlema veelgi paremate ja vähem resursse nõudvate mudelite poole. Saab olema põnev näha, mida siin lähi tulevik toob.
Viidatud kirjandus
1. https://www.analyticsvidhya.com/blog/2025/02/deepseek-r1-vs-deepseek-v3/
2. http://datasci.ee/masinoppe-sonastik/
3. https://medium.com/@bensalemh300/supervised-vs-unsupervised-vs-reinforcement-learning-a3e7bcf1dd23
4. https://www.bbc.com/news/articles/c5yv5976z9po
Kommentaarid
Postita kommentaar