Ideje túllépni a chat-alapú modelleken


A mesterséges intelligencia (AI) eszközök folyamatosan változtatják meg az életünket. Szinte minden nap új eszközök jelennek meg, és bár sokan elsősorban felhasználók vagyunk, néhányan tervezni is fogjuk ezeket. Azok a tervezők fogják meghatározni, hogyan használjuk és valósítjuk meg az AI eszközöket. A tervezőknek ismét lehetőségük lesz arra, hogy alakítsák, hogyan változtatja meg életünket az új technológia.

Az AI egy új korszakot vezet be a felhasználói felület tervezésében. Elmozdulunk a hagyományos, parancsokon alapuló interakcióktól a szándékokon alapuló interakciók felé. Ez azt jelenti, hogy a felhasználóknak többé nem kell konkrét parancsokat kiadniuk a feladatok elvégzéséhez, hanem kifejezhetik a kívánt eredményt, és az AI kezeli a szükséges lépéseket. Hasonlóan az internet vagy a mobiltelefónia korai napjaihoz, most is ismeretlen területre lépünk. Közel két évtizede tervezek digitális élményeket, és ezek a pillanatok mindig megkövetelték tőlünk iparágként, hogy újraértékeljük a status quo-t. Ismét innoválnunk kell, újra kell gondolnunk a mentális modelleket, mintákat és irányelveket, hogy az AI eszközök ugyanolyan intuitívak legyenek, mint a weboldalak vagy a mobilalkalmazások.

A chat-alapú modellek kihívásai

Sok vezető AI eszköz, mint például a Chat GPT, az MS Copilot és a Midjourney, chat-alapú felületre támaszkodik. Ezek a felületek egy személyes beszélgetést tükröznek, ahol két ember ül egymással szemben, kérdezve és válaszolva. Ez jól működik egyszerű kérdéseknél, mint például egy kifejezés részleteinek kereséséhez. Ezzel szemben elmarad a kifinomultabb feladatok elvégzésétől. Még ha beszélünk is valakivel, nehéz néhány szóban leírni, amit akarunk. Gyakran hosszabb beszélgetésre van szükségünk, mielőtt összehangolódnánk.

Ezt a fajta összetettséget felismerhetjük a Midjourney használatakor. Hacsak nem tanulmányoztad a prompt engineering-et, sok próbálkozásba telik, mire a megfelelő stílusban, a megfelelő keretben ábrázol egy adott témát. Egy videó készítése a Sora-val valószínűleg megduplázza a kihívást. Ugyanez vonatkozik bármire, ami kifinomultabb a Chat GPT használatával. Lehet ez egy napi bontású nyaralási útiterv, weboldal kód, vagy akár más AI eszközökhöz szánt prompt. Nehéz egyetlen lekérdezésben elég konkrétnak lenni, különösen átgondoltabb eredmények esetén. Ezt tudjuk a parancssor feltalálása óta. És az elmúlt években újra láthattuk ezeket a kihívásokat az Alexa, a Google Assistant és a Siri esetében.

Egy együttműködésen alapuló modell

Ha ezt egy valós élethelyzethez hasonlítom, a felállás általában megváltozik. Ahelyett, hogy négyszemközt beszélgetnénk, megváltoztatjuk a helyzetet. Egymás mellett ülünk. Előttünk van egy papír, egy tábla vagy egy képernyő. Valami, amin együtt dolgozhatunk. Egyszerre többféle lehetőséget is megnézünk. Ha találunk egy jó irányt, finomítjuk a részleteket, és mindenki végez módosításokat.

Ahhoz, hogy a GenAI varázslatát a tömegek számára elérhetővé tegyük, meg kell változtatnunk a generatív AI eszközök mentális modelljét. Olyan felhasználói felületet kell létrehoznunk, amely tükrözi ezt a valós életbeli együttműködésen alapuló megközelítést. Ennek eléréséhez íme négy fő szempont:

1. Állandó vászon biztosítása

Ahogy fentebb említettem, egy megosztott, állandó vászon lenne az egyik legjelentősebb változás. Ez a vászon egy olyan terület lenne, amely frissíthető, és nem kell minden prompttal újrarenderelni. A felhasználóknak képesnek kell lenniük megérteni, mi változott, hogy értékelhessék, a frissítés megfelelt-e a szándéknak. A Microsoft már hasonló modell szerint pozicionálja a Copilot-ot. Az AI társ melletted ül, és a vászon (a Word vagy Excel dokumentumod) van a középpontban.

2. A felhasználó többféle lehetőséget hasonlíthasson össze

Ez a pont lehet, hogy személyes. Általában széleskörűen kezdem a kreatív folyamataimat. Szeretek különböző irányokat felfedezni - nem csak képernyők tervezésekor, hanem szöveges vázlatok vagy diagramok esetében is. A felfedezés ezen pillanatában össze kell hasonlítanom a különböző irányokat, hogy mérlegeljem előnyeiket és hátrányaikat. Hatalmas segítség lenne, ha ezt közvetlenül az eszközben megtehetném. A Midjourney már most is többféle lehetőséget kínál kérésenként. Ezek azonban jelenleg átmenetiek, és a következő prompttal többé-kevésbé feledésbe merülnek.

3. Lehetőség a kézi hozzáadásra vagy szerkesztésre

Gyakran egyszerűbb saját magunknak elvégezni néhány változtatást, mint az AI eszközt arra kérni, hogy végezze el a frissítést. A kimenet közvetlen manipulálásának lehetősége lehetővé teszi a felhasználók számára, hogy gyorsabbak és pontosabbak legyenek. A Grammarly remek példa erre. Bár képes a semmiből is szöveget generálni, többnyire arra használom, hogy javítsam a már megírt szövegemet. A frissítései után folytathatom a szerkesztést, ami gyakran több fordulónyi oda-vissza kommunikációhoz vezet.

4. A felhasználók finomíthassák a részleteket

Különösen, ha valami konkrét elképzelésünk van, a generatív AI bonyolulttá válik. Mindig vannak apró részletek, amelyek egyszerűen eltérnek attól, amit szerettünk volna. Egy újrarenderelés kijavíthatja az aktuális problémát, de újakat is létrehozhat. Ezeket utólag más alkalmazásokban is módosíthatjuk, de lehet, hogy folytatni szeretnénk az AI eszköz használatát, ami nehézkessé teszi a munkafolyamatot. Különösen a hozzáadás vagy szerkesztés lehetőségével kombinálva ez sokkal gördülékenyebbé és hatékonyabbá tenné számos AI eszköz használatát. A Photoshop AI Photo Editora lehetővé teszi, hogy egy kiválasztott területre új képet generáljunk. Ez segít a kompozíció egyes részeinek kezelésében, és ezáltal rétegenként hozhatjuk létre a kívánt képet.

Összefoglalás

Az AI eszközök készülnek arra, hogy alapjaiban változtassák meg, hogyan lépünk kapcsolatba a technológiával. Más új technológiákhoz hasonlóan a tervezők alakíthatják ezeket az eszközöket. Az AI eszközöknek vannak problémái, de megvan bennünk, ami a fejlesztésükhöz kell. Azt javaslom, változtassuk meg a mentális modellt az egyszemélyes chatekről az együttműködésen alapuló vászonra. Ez számos akadályt elháríthat, és lehetővé teheti a felhasználók számára, hogy pontosabbak és hatékonyabbak legyenek. Rázzuk fel a dolgokat, és hozzunk létre olyan eszközöket, amelyek lehetővé teszik a felhasználók és az AI zökkenőmentes együttműködését.

Eredeti cikk: uxplanet.org

Népszerű bejegyzések