ChatGPT-4 salīdzinājumā ar ChatGPT-3.5 noklusējuma un ChatGPT-3.5 mantojums: pārbaudītas atšķirības

Paredzams, ka ChatGPT 4.0 radīs lielus viļņus tērzēšanas robotu visumā. Bet vai tas tiešām ir pārāks par savu priekšgājēju? Pārbaudīsim.

ChatGPT bija tikai gaidāmā automatizācijas aisberga virsotne, un Google, Microsoft un daudzi citi AI uzņēmumi sekoja šim piemēram.

Iesācējiem mēs esam atraduši dažus tērzēšanas robotus, piemēram, ChatGPT, no kuriem daudzi nepieder lielajām tehnoloģijām.

Bet sauc to par mārketinga spēku; ChatGPT joprojām ir visu šādu AI robotu valdošais karalis. Tas var darīt daudzas lietas, tostarp matemātiku, dzeju un emuāra ierakstus, un cilvēki to pat izmanto, lai iesniegtu tiesas prāvas.

DoNotPay strādā pie GPT-4 izmantošanas, lai radītu „viena klikšķa tiesas prāvas”, lai iesūdzētu robotu zvanītājus par 1500 USD. Iedomājieties, ka saņemat zvanu, noklikšķinot uz pogas, zvans tiek atšifrēts un tiek ģenerēta 1000 vārdu tiesas prāva. GPT-3.5 nebija pietiekami labs, taču GPT-4 lieliski tiek galā ar darbu: pic.twitter.com/gplf79kaqG

— Džošua Brauders (@jbrowder1) 2023. gada 14. marts

Tajā ir daudz profesionāļu, kas uztraucas par to, ka viņu prasmju kopums tuvākajā nākotnē kļūs bezjēdzīgs.

Tomēr esmu izlasījis Linkedin ziņu, kurā teikts:

AI neaizstās jūs, bet cilvēks, kas izmanto AI, to var.

Tāpēc, turot īkšķus, izglītosimies par jaunāko ChatGPT atjauninājumu un redzēsim, ar ko tas atšķiras no iepriekšējām versijām.

ChatGPT: mantotais, noklusējuma un atjauninājums

Tātad maksas lietotājiem ir pieejamas trīs versijas: Legacy (3.5), Default (3.5) un nesenais ChatGPT atjauninājums (4).

Lai gan mēs nedaudz padziļināsimies par viņu iespējām, tas ir tas, ko OpenAI saka par atšķirībām:

Avots: OpenAI

Tātad, lai gan bezmaksas lietotājiem var spēlēt tikai Legacy 3.5, premium abonements piedāvā visus trīs, lai mēģinātu samierināties ar to, ko lietotāji uzskata par labāko.

Apkopojot iepriekšējo attēlu, apmaksātie plāni ir paredzēti precīzāku rezultātu iegūšanai pienācīgā ātrumā. Tomēr atšķirības ir acīmredzamas tikai tad, ja norādījumi ir sarežģīti un tiem ir nepieciešams radošums.

ParameterChatGPT 4ChatGPT 3,5 bar eksāmena rezultātsTop 10%Bottom 10%AI2 Reasoning Challenge (ARC)96,3%85,2%Python kodēšanas rezultāts67%48,1%Vizuālā interpretācija Jā NēKonteksts Vairāk nekā 25 000 vārdu mazāk avota: OpenAI

Turklāt ChatGPT 4 var pieņemt vizuālo ievadi.

Nu, pietiek ar mācību grāmatu definīcijām. Sasmērēsim rokas un izvērtēsim šos kandidātus reālās dzīves kaujas laukā.

Turpmākās sadaļas ir pilnas ar attēliem, kas var šķist neskaidri. Šādā gadījumā ar peles labo pogu noklikšķiniet uz jebkura attēla un atlasiet Atvērt jaunā cilnē, lai to skatītu pareizi.

Matemātika

Tā kā esmu inženierzinātņu absolvents, es nevaru viņiem atrisināt dažas pamata problēmas. Sāksim vienkārši ar algebriskajiem vienādojumiem.

  Kā aizsargāt fotoattēlus ar paroli iPhone un iPad ierīcēs

I posms

Daudzi no mums ir redzējuši šos vienādojumus ax2+bx+c=0, kur mums ir jāatrisina X. Šeit es devu šo vienkāršo uzvedni Atrisināt x: x2 + x – 6 = 0

Lai gan visi sniedza vienādas saknes (X= -3,2), Legacy un Update bija līdzīgāki, izmantojot formulu tieši (kā to darīs jebkurš students), lai uzzinātu rezultātu.

Tomēr Default 3.5 izskaidro divas metodes, tostarp faktorizēšanu, ko parasti izmanto jebkurš prasmīgs students, ja viņam tiek doti šādi ikdienišķi vienādojumi.

II posms

Pēc tam es aicinu to atrisināt nedaudz sarežģītu kubiskā vienādojumu: x^3 -12x^2 + 48x – 64 = 0.

Tas patiešām pierādīja, kāpēc ChatGPT 4 ir “atjauninājums”.

Šeit ir atbildes:

Visa šī ažiotāža un ChatGPT Legacy un Default nevarēja atrisināt vispārēju kubiskā vienādojumu. Tomēr Legacy veicās nedaudz labāk un pareizi atrada divas saknes, savukārt Default neizdevās ar visām.

Atjauninājums bija nepārprotams uzvarētājs otrajā posmā un lieliski atrisināja vienādojumu, atrodot visas trīs saknes ar jauku skaidrojumu.

Loģiskais pamatojums

Mēs varam droši pieņemt, ka lielākajai daļai elementāru matemātikas problēmu ir vārdnīcas risinājumi. Ja zināt teorēmu vai formulu, ievadiet vērtības un iegūstiet rezultātus.

Un ChatGPT, kas ir AI, var ātri veikt šādus vaicājumus. Tomēr loģiskā spriešana ir cita teritorija, un pastāv liela iespēja, ka mākslīgais intelekts sabruks.

I posms

Es viņiem iedevu klasiku:

A ir vecāks par B.
C ir vecāks par A.
B ir vecāks par C.
Vai trešais apgalvojums ir patiess vai nepatiess, ja pirmie divi apgalvojumi ir patiesi?

Un visas ChatGPT versijas bija pareizas, norādot, ka trešais apgalvojums ir nepatiess.

Tālāk es izmantoju vārdus alfabēta vietā, un rezultāti varētu jūs pārsteigt:

Tātad Default 3.5 turpināja savu zemāko veiktspēju un tika sajaukts ar šo pieticīgo variantu. Tomēr Legacy un Update darbojās optimāli.

II posms

Iespējams, jau esat pamanījis, ka šī I un II posma mērķis ir atrast atšķirības punktu, kur dotās uzvednes sarežģītība atšķir atjauninājumu no pārējiem diviem.

Šeit uzvedne bija vienkārša loģiska mīkla:

Kādu rītu pēc saullēkta Rohits stāvēja ar seju pret stabu. Staba ēna krita tieši viņam pa labi. Uz kuru pusi viņš bija vērsts?
a. Ziemeļi
b. Rietumi
c. Dienvidi
d. Austrumi

Tas mudināja Legacy sniegt neprecīzu atbildi, savukārt Default atbildēja ar neskaidriem precizējumiem, kas noveda pie nepareiza secinājuma.

Tikai atjauninājums spīdēja ar pareizo atbildi ar viegli izpildāmiem apgalvojumiem.

Vēstules

Prasību iesniegšana tiesā var būt sarežģīta, taču dažreiz tas neizdodas, ja varat sagatavot pārsteidzošu pirmo paziņojumu.

Lūk, es devos uz šo uzvedni: uzrakstiet vēstuli Timam pavāram, lai viņš man nodotu ābolu par to, ka es neatbildēju uz vienu no maniem tvītiem.

  6 mirkļbirku izsekošanas rīki, lai analizētu jūsu uzņēmumu sociālajos saziņas līdzekļos

Smieklīgi, jā! Bet paskatīsimies, ko AI var no tā iegūt.

Legacy 3.5 uzreiz uztvēra uzvedni kā robo-vergs un izplatīja vēstuli, kas var padarīt mani par izcilu izsmieklu objektu, ja tas kādreiz sasniegs paredzēto galamērķi.

Arī Default nebija labs. Tomēr tas mani vienkārši izslēdza, kā kašķīgs vecs vīrietis darītu ar piecus gadus vecu bērnu.

Lai gan izteiktie argumenti bija precīzi, ar to jautrība beidzās ar nelielu mācību.

Lai gan tas bija pietiekami vienkāršs pamudinājums, tam bija nepieciešama pārdomāšana un radošums. Un šeit lielais brālis Update apliecināja savu argumentu:

Pirmkārt, tas tika izstrādāts gandrīz perfekti. Otrkārt, tas man ietaupīja Google meklēšanu, meklējot Apple galvenās mītnes adresi (lai gan vajadzētu pārbaudīt šādus ierakstus).

Treškārt, tas bija skaisti uzrakstīts ar oficiālu toni un humoristisku piesitienu. Turklāt nolūks bija skaidrs pašā tēmas rindiņā.

Un tomēr vēstule pauda neapmierināta Apple fana noskaņojumu.

Tādējādi ChatGPT 4 (pazīstams arī kā atjauninājums) ir par jūdzēm priekšā saviem vecajiem brālēniem. Tas ir šausmīgi inteliģents, un tajā ir dažas veselā saprāta pazīmes, kas padara to vairāk nekā blāvu, garlaicīgu tērzēšanas robotu.

Dzeja

Līdz ar ChatGPT palaišanu dzeja, manuprāt, varētu būt tās vājā vieta.

Galu galā ir vajadzīgas emocijas, radošums un daudz pūļu, lai cilvēks radītu kaut ko tādu, kas patiesi rezonē ar lasītājiem.

Vienkārši sakot, dzeja ir māksla tās labākajā izpausmē, un es klusībā vēlējos, lai mākslīgais intelekts neizdodas. Bet tas bija pirms mans kolēģis smagi skāra mūs visus pcdream.lt Slack kanālā ar ChatGPT izveidi, kas bija pirms šī 4.0 atjauninājuma.

I posms

Lūk, es pamudināju mūsu kandidātus: “poētiski izsakiet, kāpēc vai kāpēc burgeru pasniegšana kopā ar viņu pašreizējo ēdienkarti var sniegt labumu domino picu ķēdei. Saglabājiet to mazāk par 100 vārdiem.

Vai varat pamanīt atšķirību?

Noklusējuma versija bija ļoti īsa, tikai 32 vārdi, un nevarēja izmantot pieejamo joslas platumu, lai parādītu savu radošumu.

Lai gan The Legacy izmantoja maksimālo vārdu skaitu no trim, secina, ka mēģinājums pasniegt picas līdzās nav riskants un radīs drošus panākumus jebkurā gadījumā, kas nav pilnīgi taisnība.

Atjauninājuma dzejā bija tikai 53 vārdi, izšķērdējot gandrīz pusi no atvēlētā vārdu skaita. Tomēr bija skaidrs par atlīdzību un potenciālajām kļūmēm, un nevarēja nonākt pie nekāda rezultāta, kas, manuprāt, ir humānāks nekā pārējais.

II posms

Pēc tam es palūdzu viņiem visiem „izskaidrot dzeju piecus gadus vecam bērnam”.

Interesanti, ka Legacy nevarēja ņemt kontekstu no sarunas un skaidroja vārdu „dzeja” burtiski. Default izmantoja kontekstu un apkopoja to rindkopā, kas joprojām ir pienācīga.

  SCORM skaidrojums: izpratne par satura paketi

Turpinot tendenci, ChatGPT 4 vienkāršoja savu radošumu, vienlaikus saglabājot dzejas aromātu.

ChatGPT Premium salīdzinājumā ar ChatGPT bezmaksas

Bezmaksas, tas ir brīvs, tam trūkst ātruma un precizitātes, un tas nav līdzīgs ChatGPT 4, taču tas arī nav pilnīgi bezjēdzīgi.

Lai to salīdzinātu uz līdzenas virsmas, es tam sniedzu tās pašas uzvednes, ar kurām esam pārbaudījuši Legacy, Default un Update.

🔵 Matemātika: tas atrisināja kvadrātvienādojumus, bet sniedza nepareizas atbildes uz kubiku. (piemēram, Legacy un Default)

🔵 Loģiskais pamatojums: izturēja pirmo posmu ar alfabētu un vārdiem, bet neizdevās ar otro (piemēram, Legacy).

🔵 Vēstules: neuzrakstīja vēstuli un uzskatīja uzvedni par neētisku un nepiemērotu. (piemēram, noklusējuma)

🔵 Dzeja: ģenerēja dzeju vairāk nekā 30 vārdos un to pieklājīgi izskaidroja. (līdzīgi kā noklusējuma).

Tātad, mēs varam secināt, ka arī bezmaksas versija nav slikta. Patiesībā tas ir līdzvērtīgs Default 3.5 un dažos aspektos pat labāks.

Lasiet arī: Spēcīgi norādījumi, lai uzlabotu jūsu ChatGPT pieredzi

Ceļš uz priekšu

Baumas par mākslīgā intelekta aizstāšanu nākotnē nav pilnīgi nepareizas.

Pirmkārt, automatizācija to paveica apstrādes rūpniecībā, un tagad tā izpleš spārnus visur citur.

Personīgi tas ir daudz ātrāk nekā es, risinot kubiskos vienādojumus, veidojot dzeju vai rakstot vēstules. Tomēr fakts, ka tas reti saka NĒ uzvednei un gandrīz nemācās no savām kļūdām, atspēko mums, cilvēkiem.

Atkārtoti sakot, AI mūs neaizstās, taču kāds, kas izmanto AI, to var.

Vietnē pcdream.lt mūsu mārketinga komanda interesantos veidos izmanto ChatGPT. Piemēram, mēs nesen sasniegām 100 miljonu skatījumu robežvērtību, un mūsu izpilddirektors domāja to atdot auditorijai, izmantojot dāvanu.

Un es domāju, ka mārketinga puišiem vajadzēja nosaukumu, lai piesaistītu lasītāja uzmanību. Tātad viņi sniedza vienu uzvedni un lūdza ChatGPT ieteikt dažus variantus, piemēram:

Turklāt mēs to izmantojam satura apkopošanai, gramatikas pārbaudei, jaunu rakstu nosaukumu ierosināšanai un tamlīdzīgi.

Visbeidzot, ir daudz veidu, kā gūt labumu un cīnīties ar stereotipiem, kas AI uzskata par nederīgu atkritumu.

Vienīgais, kas jāatceras, ir jābūt kādam (cilvēkam), kas vērtēs AI darbu, jo tas var būt (rupji) neprecīzs un maldinošs.

Atjauninājums patiešām ir kaut kas!

Manā īsajā tikšanās laikā ChatGPT 4 jutās radošāks, saprotošāks un reālistiskāks. Tomēr šī ir mašīna un var droši sniegt nepareizas atbildes.

Taču satriecošais ir OpenAI jaunināšanas līmenis, ko šim projektam ir paveicis tikai dažu mēnešu laikā.

Un es nevaru sagaidīt, kad ieraudzīšu, ar kādu burvību nākamais atjauninājums var mūs apmulsināt!

PS: ne tikai tērzēšanas logs; izmantojiet tās spēku ar šiem labākajiem Chrome ChatGPT paplašinājumiem. Un vai esat kādreiz domājis par ChatGPT integrēšanu ar Siri?