Kas ir Google Gemini un ko tas ziemā ēd?

Kas ir Google Gemini mākslīgā intelekta rīks bez maksas un Gemini advanced

Google ik pa laikam izlaiž jaunus pārsteigumus un mērķtiecīgi dodas mākslīgā intelekta attīstības virzienā, dažkārt pārsteidzot ar saviem piedāvājumiem. Protams arī citi mākslīga intelekta milži nesnauž, bet šajā rakstā nedaudz ieskatīsimies google jau iepriekš izziņotajā MI atjauninājumā Gemini, jeb latviski tas būtu Dvīņi . Kopumā šajā rakstā tiks apskatīts Google Gemini, jauns multimodālais LLM, tā iespējas, potenciālie ieguvumi un ierobežojumi.

Šajā rakstā uzzināsiet:

  • Kas ir Multimodālais LLM?
  • Kas tad īsti ir Gemini?
  • Kādas ir šī uzlabojuma iespējas un kā to iespējams izmantot?
  • Kāds ir jaunais Google piedāvājums?
  • Kur palicis Bard?

    Kas tad ir tas MULTIMODĀLAIS LLM ?

    Iepriekš rakstā pieminēju tādu terminu, kā multimodālais LLM, turpinājumā mēģināšu iespējami paskaidrot kas tad tas īsti ir…

    Multimodālais LLM nozīmē multimodālu lielu valodas modeli. Tas ir mākslīgā intelekta (MI) modelis, kas spēj apstrādāt un ģenerēt datus no vairākiem avotiem, tostarp:

    • Teksts: vārdi, teikumi un rindkopas
    • Attēli: pikseļi, formas un krāsas
    • Skaņa: viļņi, frekvences un skaļums
    • Kods: programmēšanas valodas, komandas un funkcijas

    Multimodālie LLM atšķiras no tradicionālajiem LLM, kas apstrādā un ģenerē tikai tekstu. Pateicoties spējai apstrādāt datus no vairākiem avotiem, multimodālie LLM var veikt sarežģītākus uzdevumus, piemēram:

    • Attēlu aprakstu ģenerēšana: modelis var aprakstīt attēlā redzamo, izmantojot tekstu.
    • Teksta tulkošana attēlos: modelis var pārveidot tekstu attēlā, saglabājot tā nozīmi.
    • Koda ģenerēšana no dabiskās valodas: modelis var pārveidot instrukcijas dabiskā valodas kodā, ko var izmantot programmēšanā.

    Multimodālie LLM joprojām ir agrīnā attīstības stadijā, taču tiem ir liels potenciāls ietekmēt dažādas jomas, piemēram:

    • Izglītība: modeļus var izmantot, lai izveidotu interaktīvas mācību pieredzes, kas apvieno tekstu, attēlus un skaņu.
    • Veselības aprūpe: modeļus var izmantot, lai diagnosticētu slimības, analizējot medicīniskos attēlus un datus.
    • Bizness: modeļus var izmantot, lai uzlabotu klientu apkalpošanu, izveidojot personalizētus produktus un pakalpojumus.

    Pazīstamākie piemēri:

    • Google Gemini ir multimodālais LLM, kas var apstrādāt un ģenerēt tekstu, attēlus un kodu.
    • OpenAI DALL-E 2 ir multimodālais LLM, kas var ģenerēt attēlus no teksta aprakstiem.
    • Microsoft VALL-E ir multimodālais LLM, kas var ģenerēt video no teksta aprakstiem.

Ar ko tad Google Gemini atšķiras no Open AI Chat GPT OpenAi Chat GPT un Microsoft copilot bezmaksas mākslīgā intelekta rīks Microsoft Copilot?Pirmās ziņas par šo attīstības virzienu šķiet google izziņoja jau 2023. gada 6.decembrī, paziņojot pirmās vēsmas lietotnē ar publicētu video un tekstuālu ierakstu:

Aizraujamies ar #GeminiAI.

Mūsu jaunais AI modelis spēj loģiski domāt, ņemot vērā dažādus ieejas un izvades veidus – piemēram, attēlus un tekstu. Apskatiet Gemini daudzrežīmu domāšanas spējas darbībā pic.twitter.com/tikHjGJ5Xj

— Google (@Google) December 6, 2023

Tātad pirmās ziņas par Gemini parādījās 2023. gada 6. decembrī, kad Google publicēja video un teksta ierakstu savā “X” kontā, demonstrējot tā daudzrežīmu domāšanas spējas. Kopš 2024. gada 8. februāra Gemini ir pieejams plašākai lietošanai, ļaujot ikvienam izmēģināt šī jaudīgā rīka potenciālu.

Kas tad īsti ir GEMINI?

Gemini ir Google izstrādāts multimodālais LLM, kas spēj apstrādāt un ģenerēt dažāda veida datus, tostarp tekstu, attēlus un kodu. Tas nozīmē, ka Gemini var izmantot dažādiem uzdevumiem, piemēram:

  • Rakstu un tekstu ģenerēšanai;
  • Attēlu un video aprakstu veidošanai;
  • Koda rakstīšanai un programmēšanai;
  • Tulkošanai starp dažādām valodām;
  • Jaunu ideju un koncepciju radīšanai;

 Kopumā secinu, ka Gemini ir jaudīgs rīks, kas var ievērojami ietekmēt mākslīgā intelekta attīstību.


Tomēr…

Kā jau katram šādam rīkam pastāv arī ierobežojumi un savi negatīvie aspekti, par kuriem klusēt noteikti nevajadzētu…
Testējot Gemini, ātri vien kļūst skaidrs, ka tas var būt neobjektīvs un radīt nepareizu informāciju. Šī problēma izriet no tā, ka Gemini apmācībai tiek izmantoti milzīgi datu apjomi, kas var saturēt neobjektivitāti, viltus ziņas, aizspriedumus u.t.t… Tā rezultātā Gemini ģenerētais teksts vai attēli var atspoguļot neobjektivitāti un aizspriedumus, kas pastāv apmācības datos.

Savukārt Gemini var tikt izmantots ļaunprātīgiem nolūkiem, piemēram, dezinformācijas izplatīšanai vai “deepfake” video radīšanai, jo rīku pielietošanā cilvēku iztēlei nav robežu.

To var izmantot, lai izplatītu dezinformāciju, radot viltotus ziņu rakstus vai sociālo mediju ierakstus. To var izmantot arī, lai radītu “deepfake” video, kuros cilvēki saka vai dara lietas, ko patiesībā nav darījuši.

Piemēram:

  • Kāds varētu izmantot Gemini, lai izveidotu viltotu ziņu rakstu, kurā politiķis saka kaut ko skandalozu. Šis raksts varētu tikt izplatīts sociālajos medijos, lai kaitētu politiķa reputācijai.
  • Kāds varētu izmantot Gemini, lai izveidotu “deepfake” video, kurā slavenība saka kaut ko aizskarošu. Šis video varētu tikt izplatīts tiešsaistē, lai kaitētu slavenības reputācijai.

Ir svarīgi apzināties šos ierobežojumus un negatīvos aspektus, izmantojot Gemini. Ir jābūt kritiskam pret Gemini ģenerēto informāciju un jāpārbauda tā patiesums no citiem avotiem. Tāpat ir svarīgi izmantot Gemini atbildīgi un neizmantot to ļaunprātīgiem nolūkiem, jo kā mēs zinām –  internets negarantē anonimitāti!

Kas tiek darīts, lai mazinātu Gemini negatīvos aspektus?

Šajā ziņa ir vairāki pasākumi, kas tiek pielietoti

  • Izmanto dažādus datu avotus Gemini apmācībai: Tas palīdz mazināt neobjektivitāti un aizspriedumus, kas var rasties no datu kopas ar ierobežotu daudzveidību.
  • Izstrādā metodes Gemini ģenerētās informācijas pārbaudei: Tas palīdz identificēt un novērst nepareizu vai maldinošu informāciju.
  • Izglīto lietotājus par Gemini ierobežojumiem un negatīvajiem aspektiem: Tas palīdz lietotājiem kritiski izvērtēt Gemini ģenerēto informāciju un izmantot to atbildīgi.

Ko Google vēl varētu darīt?

  • Google varētu sadarboties ar dažādām organizācijām, lai iegūtu datu kopas Gemini apmācībai, kas atspoguļo dažādas kultūras un perspektīvas.
  • Pētnieki varētu izstrādāt rīkus, kas palīdzētu identificēt neobjektivitāti un aizspriedumus Gemini ģenerētajā tekstā vai attēlos.
  • Google varētu izveidot izglītības materiālus, kas palīdzētu lietotājiem saprast Gemini ierobežojumus un negatīvos aspektus.

Kāds ir jaunais Google piedāvājums?

Viens no labiem un manuprāt noderīgiem piedāvājumiem ir Google radītā iespēja izmantot gan maksas “Gemini Advanced“, gan arī bezmaksas Gemini versiju, turklāt maksas versiju katrs var izmantot un izmēģināt pilnīgi bez maksas necerēti ilgu izmēģinājuma perioda laiku, kas ir divi mēneši. Izmantojot Gemini Advanced, lietotāji iegūst piekļuvi dažādiem papildu Google maksas pakalpojumiem, ieskaitot 2 TB krātuvi un Google One Premium priekšrocības.

Google Gemini Advanced bezmaksas mākslīgais intelekts izmēģinājuma periods

Ko tad piedāvā “Gemini Advanced”?

✔ Ar mūsu spēcīgāko AI modeli, Ultra 1.0, ievērojami uzlabota loģiskā domāšana, norādījumu izpilde, programmēšana un radoša sadarbība

✔ Pasaules līmeņa veiktspēja – tas spēj saprast, izskaidrot un radīt augstas kvalitātes kodu daudzās programmēšanas valodās

✔ Izstrādāts sarežģītiem uzdevumiem – paredzēts, lai ātri saprastu un reaģētu uz dažādiem ievades veidiem, tai skaitā tekstā, attēlos un kodā Iekļauts arī šajā Google One abonementā

✔ 2 TB krātuves – 2 TB krātuve attēliem, e-pastam un diskam jums un līdz pat 5 citiem cilvēkiem

✔ Drīzumā pieejams: Gemini Gmail, Docs un vairāk

✔ Citi Google One Premium ieguvumi:

                 Papildu ieguvumi

           ✔ 10% atpakaļ no Google veikala pērkot ierīces (pieejams tikai dažos reģionos)

           ✔ Papildu Google Meet funkcijas piemēram, ilgākas grupas videozvani (bez abonēšanas ierobežojums ir 1 stunda)

           ✔ Papildu Google kalendāra funkcijas piemēram, uzlabota tikšanos ierakstīšana

 

Kur palicis Bard?

Godīgi sakot sākotnēji man arī radās šis jautājums, jo dažos informācijas avotos meklējot papildus faktus šim rakstam saskāros ar informāciju, ka Bard vēl aizvien būs pieejams, tomēr tas nav gluži tā. Kopumā Bard, kā tāds īsti arī nekur nepazudīs, jo tas vienkārši savā attīstības procesā tagad ir kļuvis par Gemini, turklāt ne vien mainījis nosaukumu, bet kļuvis gudrāks, spējīgāks, pieejamāks un spēcīgāks. Tas gan man nedaudz atgādina “pokemonu” evolūcijas procesu, kad piemēram Pikaču evolucionēja par Raiču u.t.t.  Kā jau zināms, tad Bard testa periodā ir bijis pieejams šaurākam izstrādātāju un izmēģinājumu lokam – es arī biju ieguvis šo pieeju un jāsaka, ka Gemini spējas atšķirībā no Bard ir nedaudz uzlabojušās. Protams jāsaprot, ka arī Gemini savā attīstības ceļā nav apstājies, un kā apgalvo Google ir vien attīstības sākuma stadijā, tāpēc es domāju, ka jauni pārsteigumi un iespējas arī turpmāk no šī mākslīgā intelekta milža neizpaliks.

Loading

Noderīgs raksts? Dalies ar citiem: