Jeszcze do niedawna obrazy stanowiły jeden z najtrudniejszych problemów w rozwoju sztucznej inteligencji. O ile AI doskonale radziła sobie z pisaniem, tak rozpoznawanie i odwzorowywanie przedmiotów przez długi czas przynosiło mierne rezultaty.
Żyjemy jednak w czasach fascynujących przełomów, a aktualnie jesteśmy świadkami zapierającej dech rewolucji w procesie generowania obrazów. Warto było czekać, bo to co oferuje Laboratorium Midjourney i ich program sztucznej inteligencji przekracza najśmielsze oczekiwania.
Sprawdź: Jaki laptop do 3000 zł wybrać w 2022 roku?
Spis treści
Dlaczego AI miała problem z obrazami?
Ludzie postrzegają przedmioty nie tylko jako słowa czy symbole. Znają ich przeznaczenie i wiedzą jaką rolę pełnią w interakcjach z innymi przedmiotami. Potrafią wyobrazić sobie abstrakcyjne zastosowania tych przedmiotów, niezależnie od tego czy kiedykolwiek widzieli je na własne oczy.
Z kolei kiedy sztuczna inteligencja patrzy na obrazy, rozpoznaje wyłącznie dane. Wartości zawarte w danych mogą przedstawiać pewne wzorce, które AI może nauczyć się rozpoznawać, ale cały proces przebiega zupełnie inaczej niż w ludzkim mózgu.
AI musi najpierw odsiać „szum” z obrazu, żeby potem móc znaleźć tą wariację wzorów, którą potrafi rozpoznać, dzięki uprzedniemu przeszkoleniu. Każdy obiekt zidentyfikowany przez sztuczną inteligencję to tak naprawdę procentowy wynik zgodności danych, które AI rozpoznaje w obrazie, z danymi, które poznała w wyniku procesu nauczania.
Rozpoznawanie obrazów angażuje głębokie uczenie, które jest zaawansowaną formą uczenia maszynowego. Jest możliwe dzięki warstwowej sieci neuronowej, która umożliwia nieustanną naukę na podstawie nowych zbiorów danych.
Można powiedzieć, że głębokie uczenie naśladuje procesy logicznego rozumowania zachodzące w ludzkim mózgu. Czy to nie ekscytujące? Droga, która doprowadziła nas do tego miejsca jest sama w sobie porywająca, ale to aktualne możliwości AI w generowaniu obrazów wzbudzają największy zachwyt.
Kreatywna sztuczna inteligencja – Midjourney
DALL·E i Midjourney to pierwsze tak dobre programy AI wyszkolone do generowania obrazów z opisów tekstowych. Przewagą Midjourney jest fakt, że jest już dostępny dla każdego, podczas gdy DALL·E póki co oferuje wyłącznie zapis na listę oczekujących do testów w fazie beta.
Oba programy dostarczają nam wielu ciekawych informacji odnośnie tego jak odbywają się i jak ewoluują procesy twórcze AI. Sztuczna inteligencja potrafi już nie tylko rozpoznawać obiekty, ale też tworzyć ich antropomorficzne wersje i łączyć abstrakcyjne pojęcia. Czy można powiedzieć, że AI już nie tylko rozumie, ale i potrafi sobie coś wyobrazić?
Tworzenie obrazów za pomocą sztucznej inteligencji Midjourney odbywa się na Discordzie, poprzez użycie prostego polecenia: imagine (dosł. wyobraź sobie). Każdy użytkownik może się zarejestrować i za darmo stworzyć około 25 obrazów z użyciem dowolnie dobranych przez siebie słów. Więcej kreacji można stworzyć po wykupieniu miesięcznego lub rocznego pakietu, które obecnie dostępne są w cenach: 10, 30 i 600 dolarów.
Jedną z najciekawszych funkcji Midjourney AI jest łączenie zupełnie niepowiązanych ze sobą pojęć. Choć tu warto zaznaczyć, że sztuczna inteligencja w dalszym ciągu się uczy, również od nas, użytkowników. Każdy z wybranych przez użytkownika wariantów obrazów stworzonych poprzez polecenie imagine, stanowi dla AI informację zwrotną, że to jest to, czego oczekiwaliśmy. Im więcej użytkowników i im więcej obrazów adekwatnych do ich oczekiwań (lub znacznie je przekraczających), tym szybciej udoskonalany jest proces uczenia i sama umiejętność.
Przekazanie AI swojej wizji obrazu wymaga precyzji podobnej do tej, z jaką tłumaczy się świat małemu dziecku. Łączenie niepowiązanych pojęć może bowiem przynosić rezultaty wspaniałe albo.. dziwne. Wszystko zależy od tego czy opis pozwoli AI skutecznie wyobrazić sobie pożądane pojęcia. Mimo pewnych drobnych ograniczeń, poziom abstrakcji i nieskończoność możliwości oferowanych przez AI z pewnością zainspiruje wielu architektów, przedsiębiorców czy projektantów mody. Czy pozbawi również pracy artystów i grafików?
Sprawdź również: DALL-E Mini – internet oszalał na punkcie nowego AI
Czy AI zastąpi artystów i grafików?
Choć AI od dawna jest obecna w branży kreatywnej, do tej pory była używana raczej jako narzędzie, które wspomaga proces projektowania. Dlatego pojawienie się DALL·E i Midjourney wzbudziło mieszane reakcje i obawy. Ostatecznie danymi wejściowymi, których potrzebuje AI może być zaledwie kilka wybranych przez użytkownika słów, a wyniki mogą być dostarczane praktycznie natychmiast.
Dotychczas wyłącznie pracownicy produkcyjni mogli realnie obawiać się, że zostaną zastąpieni przez maszyny i roboty. Środowisko kreatywne miało jeszcze długo być chronione przed tym losem. Jednak jeśli weźmiemy pod uwagę koszty zatrudnienia pracownika i efektywność jego pracy (stworzenie grafiki do publikacji może trwać na przykład 5 godzin), AI okazuje się mieć miażdżącą przewagę.
Co się stanie z pracownikami kreatywnymi w tak rysującej się perspektywie przyszłości? Ci, którzy przez lata badali potencjał sztucznej inteligencji w dziedzinie twórczości sugerują, że ilustratorzy już teraz powinni zacząć korzystać z możliwości, które oferuje sztuczna inteligencja, by nie stracić źródła utrzymania.
Z drugiej strony, weźmy za przykład autora książki. Może łatwo stworzyć grafikę na okładkę swojego dzieła, ale przygotowanie jej do druku wraz ze współgrającą wizualnie czcionką w dalszym ciągu może wymagać pomocy projektanta.
Jak używać Midjourney AI?
- Jeśli nie masz konta Discord, utwórz go tutaj.
- Zarejestruj się na Midjourney i zaloguj się do wersji beta.
- Po automatycznym połączeniu konta Discord z serwerem Midjourney, możesz wejść na któryś z kanałów „newbies”.
- Na wybranym kanale „newbies” wpisz /imagine i opisz jaki obraz ma stworzyć bot.
- AI stworzy 4 warianty obrazów, które możesz ulepszyć klikając (U) lub zmodyfikować wybierając (V). Warianty obrazu są ponumerowane w intuicyjnej kolejności.
Przykład: jeśli chcesz stworzyć inny wariant drugiego obrazu, wybierasz V2
- Wybrany obraz możesz pobrać po pierwszym lub drugim ulepszeniu (upscale)
Istotne informacje dodatkowe:
Łatwo jest zgubić kreacje, które bot tworzy na Discordzie, dlatego polecamy przeglądać je w aplikacji Midjourney. W tym miejscu znajdziesz również twórczość innych użytkowników.
Pamiętaj, że obrazy, które tworzysz są widoczne dla wszystkich użytkowników. Hasła, które mogą obrazować rozlew krwi i tematykę dla dorosłych są odgórnie zablokowane. Zasady społeczności jasno zobowiązują użytkowników do tego, żeby nie wnosili do niej niczego, co może odrażać lub niepokoić innych.
Midjourney posiada prawa autorskie do stworzonych przez AI obrazów, ale przekazuje użytkownikowi prawa do dowolnego korzystania z jego kreacji, także w celach komercyjnych. Takie samo prawo mają inni użytkownicy, którzy wykupili którykolwiek z płatnych pakietów. Innymi słowy, nie możesz zabronić komukolwiek korzystania ze stworzonego przez Ciebie obrazu.
Sprawdź również: The Orville, czyli pozytywna wizja przyszłości