MidJourney vs Stable Diffusion pret Bing Image Creator

Mākslīgais intelekts ievērojami maina mākslas pasauli. Viens no aizraujošajiem AI pielietojumiem mākslas segmentā ir aprakstošu mākslas ģeneratoru izmantošana. Šie ģeneratori spēj pārbaudīt un interpretēt attēlus un ģenerēt pilnīgi jaunus mākslas darbus, pamatojoties uz to analīzi.

Šajā rakstā mēs apspriežam trīs šādus AI mākslas ģeneratorus: MidJourney, Stable Diffusion un Microsoft Bing Image Creator, un kuri no tiem ir vislabākie, radot labākos rezultātus, pamatojoties uz uzvednēm.

MidJourney

MidJourney, ko dibināja Deivids Holcs, ir AI mākslas ģenerators, kas izmanto mašīnmācīšanos, lai identificētu modeļus un funkcijas esošajos mākslas darbos, ko pēc tam var izmantot jaunu darbu radīšanai.

  13 labākie WordPress pakalpojumi aģentūrām un ārštata darbiniekiem

MidJourney atvērtā beta versija tika uzsākta 2022. gada 12. jūlijā. Pirms MidJourney palaišanas Holcs līdzdibināja Leap Motion — jaunuzņēmumu, kas pārveidoja lietotāja saskarnes, izmantojot video uzņemšanu un roku žestus. 2019. gadā viņš pārdeva Leap Motion uzņēmumam Ultrahaptics.

Līdz ar MidJourney popularitāti Holcs ir dalījies savās atziņās par tehnoloģijām un to ietekmi uz mākslu un sabiedrību. Holcs māksliniekus uzskata par MidJourney klientiem, nevis konkurentiem, un uzskata, ka platforma var veicināt lielāku radošumu un eksperimentēšanu ideju fāzē.

Tomēr pastāv bažas par iespējamiem autortiesību pārkāpumiem, kas saistīti ar MidJourney apmācību komplektu, kurā var būt ietverti ar autortiesībām aizsargāti citu mākslinieku darbi.

Holcs uzsver, ka MidJourney ir paredzēts, lai uzlabotu cilvēka spējas, nevis tās aizstātu. Viņš to salīdzina ar automašīnām, skaidrojot, ka tikai tāpēc, ka automašīnas ir ātrākas par cilvēkiem, tas nenozīmē, ka mums vajadzētu nogriezt kājas.

Izmantojot MidJourney AI attēlu ģenerēšanu, mākslinieki var izpētīt jaunas iespējas un ģenerēt daudzas idejas pirms savu darbu radīšanas.

  Kā Python izveidot skaitļu uzminēšanas spēli?

Stabila difūzija

Stabilā difūzija ir atvērtā pirmkoda mašīnmācīšanās modelis, kas var ģenerēt attēlus no teksta, modificēt attēlus, pamatojoties uz tekstu, vai aizpildīt informāciju par zemas izšķirtspējas vai zemas detalizācijas attēliem. Tas ir apmācīts miljardiem attēlu, un tas var radīt rezultātus, kas ir salīdzināmi ar tiem, ko jūs varētu iegūt no DALL-E 2 un MidJourney.

Emad Mostaque, Stabilitātes AI dibinātājs un izpilddirektors, ir uzņēmums, kas ir atbildīgs par Stable Diffusion. Stable Diffusion ir latentās difūzijas modelis, ko izstrādājusi CompVis grupa LMU Minhenē, un to izstrādāja Patriks Esers un Robins Rombahs, kuri iepriekš izveidoja Stable Diffusion izmantoto latentās difūzijas modeļa arhitektūru.

Sadarbība starp Stability AI, CompVis LMU, Runway, EleutherAI un LAION ir padarījusi Stable Diffusion pieejamu sabiedrībai.

Stabilu difūziju var izvietot dažādās platformās, tostarp Windows un Apple ierīcēs. Ierīcē esošās izvietošanas izmantošana lietotnē var aizsargāt lietotāju konfidencialitāti, kas ir labāka nekā uz servera balstīta pieeja.

Microsoft Bing attēlu veidotājs

Microsoft atklāja jaunu rīku Bing Image Creator, kas lietotājiem ļauj izveidot savus attēlus tieši programmā Microsoft Edge. Uzņēmums ir izlaidis veidotāju rīku komplektu, kas paredzēts radošuma un pašizpausmes veicināšanai. Šis rīks ļauj lietotājiem izveidot personalizētus attēlus, lai kopīgotu savus dzīves atjauninājumus vai citiem nolūkiem, kas viņiem varētu būt nepieciešami.

  Kas ir par:blank un kā to noņemt?

Lietotāji var viegli piekļūt Image Creator no Microsoft Edge sānjoslas. Microsoft ir veikusi proaktīvus pasākumus, lai nodrošinātu, ka rīks tiek izmantots atbildīgi un neveicina aizskaroša satura izplatību.

Uzņēmums ir noteicis satura politiku, kas atsevišķos gadījumos aizliedz izmantot Image Creator, un lietotāji var ziņot par jebkādiem šīs politikas pārkāpumiem. Turklāt Microsoft ir ieviesusi tehnoloģiju, lai novērstu iespējamās novirzes, kas varētu rasties ģeneratīvo attēlu tehnoloģijā.

Šajā rakstā mēs sāksim ceļojumu, lai novērtētu katra aprakstošā AI attēlu ģeneratora rezultātus, kad tas tiks aicināts ar identiskiem teksta uzvednēm.

1. uzvedne. Modernais Ziemassvētku vecītis kamanās, kuru siltā, spilgti saulainā dienā uz šosejas velk ziemeļbrieži

2. uzvedne: tuvplāna kadrs ar dzīvnieku ar lielām acīm, tverot tā nevainību un jaukumu

3. uzvedne. Cilvēku astronautu, kurš spēlē nolaišanos uz jaunas planētas, sagaida naidīgas citplanētiešu radības, kas velk savus ieročus

4. uzvedne. Modernā abstraktā māksla no Ņujorkas romāna grāmatas vāka treknās spilgtās krāsās

5. uzvedne: vīrietis izšķiras starp diviem šķīvjiem — vienu ar picu un otru ar čīzburgeru

6. uzvedne: ievainots karavīrs jāj ar zirgu sniegotā kalnā ar zobenu rokā

7. uzvedne: abstrakts attēls, kurā izmantoti dažādi toņi, kas parāda ūdens kustību un plūsmu

8. uzvedne: lasis upē ar sulīgi zaļiem kokiem fonā

9. uzvedne: ūdens glāze uz galda, kurā ar roku tiek izspiests citrons

10. uzvedne: skats uz horizontu tuksnesī no cilvēku skata punkta, kas tajā jāj ar ziloni

11. uzvedne: mežs, kurā uz kokiem aug papīra nauda un putni ir izgatavoti no monētām

12. uzvedne. Ramen bļoda, ēnojums, vakara apgaismojums, fotoreālistisks

13. uzvedums: Īlons Masks ir nabadzīgs un bezdarbnieks

Spriedums

Novērtējot MidJourney, Stable Diffusion un Bing Image Creator rezultātus, ir skaidrs, ka nav galīga uzvarētāja.

Katrs ģenerators interpretē uzvednes raksturīgā veidā, un līdzības ir atrodamas Bing Image Creator un MidJourney izvados. Stabila difūzija ir efektīva, ja uzvednēs ir skaidri apraksti, bet bieži vien vārdi tiek uztverti pārāk burtiski. Lai gan MidJourney un Bing Image Creator parasti darbojas veiksmīgi, dažkārt tie rada rezultātus, kas neatbilst uzvednēm.

Konkrēti, Bing Image Creator piesardzīgi rada jebkādas ļaunprātīgas vai kūdošas ziņas, izdodot brīdinājuma ziņojumu, kad tiek piedāvāts izveidot nabadzīga un bezdarbnieka Elona Maska tēlu. Uzteicami ir tas, ka Microsoft ir pieņēmusi šādus aizsardzības pasākumus.

Tikmēr MidJourney neironu tīklu zināšanas radīja trūcīga un pamestā Elona Maska tēlu. Tādējādi var secināt, ka katrs ģenerators apmierinās savu attiecīgo lietotāju bāzi.