O co chodzi z tym całym AI?

Pan Redaktor

1 listopada, 2023

AI, SI, LLM, sztuczna inteligencja, modele językowe – nazw tego samego zjawiska i jego skrótów jest mnóstwo. Co ciekawe, ta najbardziej rozpowszechniona w popkulturze wcale nie oddaje najlepiej faktycznego charakteru tej klasy narzędzi. Sztuczna inteligencja ma dziś z faktyczną inteligencją tyle samo wspólnego, co konik polski i konik polny. Czyli niewiele. Dzisiaj spróbujemy trochę ją odczarować, żeby wiedzieć, jakie korzyści (ale i zagrożenia!) ze sobą niesie i jak korzystać z niej bezpiecznie. Skupimy się na najmodniejszej ostatnio, tak zwanej Generative AI, czyli generatywnej sztucznej inteligencji. (Brzydka kalka z angielskiego, w dodatku znaczy coś zupełnie innego. Ale wszyscy jej używają, więc nie będę się kłócił. Na razie.)

Generująca sztuczna inteligencja

No nie wytrzymałem, jednak nie dam rady z tą generatywną.

Ale ok, co taka SI (do tego też zaraz przejdziemy) potrafi wygenerować? No, w zasadzie wszystko. Tekst, obrazy, filmy (słynne już deepfake’i z prezydentami i innymi sławnymi osobami), raporty sprzedażowe, wykresy z działalności firmy… Czego dusza zapragnie i na co jest akurat zapotrzebowanie. Ja na przykład miałem zapotrzebowanie na nowe logo dla strony. 😉

Ostatnio olbrzymią popularność zdobył Chat GPT od OpenAI, potem LLMy (Large Language Models, wielkie modele językowe) zaczęły wyskakiwać na rynku jak grzyby po deszczu. Ale chociaż bez wątpienia są to bardzo dobre jakościowo i niezwykle złożone narzędzia, to przecież nie są nowością. Każda większa firma technologiczna zaprzęgała swoje własne modele językowe (albo sztuczną inteligencję, jak wolicie) do pracy już od lat. Wszelkiej maści czatboty pomagające nam w zakupach internetowych, czy niektóre tłumacze online opierają się na modelach językowych, które interpretują tekst, jaki im podajemy. W pewnym sensie więc wszyscy jesteśmy prompt engineerami. 😉

Jak to działa?

Tutaj wytłumaczę to tylko z grubsza – i są ku temu dwa dobre powody. Po pierwsze, gdybym miał to opisać szczegółowo, musiałbym napisać kilka książek, a lepsi fachowcy już to zrobili, więc nie będę dublował ich pracy. 😉 Po drugie, modeli jest cała masa i każdy trochę różni się w szczegółach działania. Więc ilość książek jeszcze by się zwiększyła. Ale zawsze możemy się umówić na jakieś szkolenie lub webinar, gdzie o tym porozmawiamy. 😉

Okej – jak wspomniałem, chociaż są pewne różnice w działaniu poszczególnych modeli, to jednak wszystkie opierają się na tych samych zasadach:

  1. Model taki musi zostać napisany przez inżynierów (programistów). Niewytrenowany model, czyli samo „rusztowanie” z kodu waży nie więcej, niż mały dokument tekstowy.
  2. Następnie trzeba ten model wstępnie przetrenować, aby spełniał swoje podstawowe zadania. W zależności od potrzeb dostarczane są mu różne ilości i rodzaje danych wejściowych. Na przykład ChatGPT od Microsoftu czy LLama od Mety (dawnego Facebooka) to paczki ważące od kilku do kilkudziesięciu gigabajtów. Dlaczego tyle? Dlatego, że zostały wytrenowane na kilku lub kilkudziesięciu miliardach (cyfra i dziewięć zer) danych, które są publicznie dostępne w internecie.
  3. Jeśli jesteś użytkownikiem końcowym, tj. chcesz usiąść sobie do tego dżipiti albo Dall-E i skorzystać z ich możliwości do pracy albo zabawy, to trzecim etapem jest dalsze trenowanie modelu. Tylko tym razem już na Tobie. To znaczy na danych, które dodasz, wpisując polecenie (prompt) lub dodając obrazy do czatu. Na przykład jeśli każesz takiemu Midjourney opisać konkretne zdjęcie, to po pierwsze to zdjęcie zostanie wykorzystane do uczenia ich modelu generacyjnego, a po drugie nie będziesz właścicielem opisu, ani żadnych obrazów wygenerowanych na bazie tego opisu. To znaczy możesz być, ale musisz zapłacić odpowiednio dużo. I tak działają licencje większości modeli – czy to tekstowych, czy graficznych.
  4. Jak wspomniałem w punkcie 3, możesz zapłacić i mieć spokojną głowę. To znaczy firmy takie jak Microsoft czy Meta pozwalają na komercyjne wykorzystanie ich modeli. Wówczas dają gwarancję, że model dalej nie uczy się na Twoich danych. Ale trzeba zapłacić dużą kasę i mieć własną infrastrukturę, więc w domowych warunkach i przy domowych budżetach najczęściej może się to nie udać.

No dobrze, ale przecież to jest po to, żeby z tego korzystać

Tak! Jak najbardziej! Tylko trzeba to robić z głową. Stosujmy się do kilku zasad, które pozwolą nam uniknąć wtopy:

  1. Przede wszystkim czytajmy licencje. Wiem, że większości może się to wydać śmieszne, bo przecież nikt nie czyta umów, ale w tym wypadku naprawdę warto. Przede wszystkim, jak już ustaliliśmy, prawie nigdy nie jesteśmy autorami „swojego” dzieła. Więc jeśli chcemy je dalej wykorzystywać, to warto wiedzieć, na jakich warunkach możemy to robić bez naruszania praw autorskich. Poza tym, ponieważ jest to młoda dziedzina i nie ma jeszcze zbyt wielu orzecznictw, firmy tworzące te modele stosują mnóstwo wyłączeń odpowiedzialności. Co za tym idzie, za prawie wszystkie błędy w działaniu lub szkody wynikające z nieprawidłowego użycia odpowiada użytkownik. Po ostatnie w tym punkcie, najczęściej są to amerykańskie firmy, więc (o ile nie chcemy się przelecieć na rozprawę do Kalifornii) wyroki będą wydawane zaocznie. A my w przypadku stwierdzenia naruszenia dostaniemy bardzo kosztowny polecony.
  2. Nie wrzucajmy danych, których nie chcemy upubliczniać. Ja wiem, klasyczne „ja się nie mam czego wstydzić” albo „moje dane nic nie są warte”. Ale to nie jest prawda. Tak naprawdę nikt poza twórcami modelu nie wie, w jaki sposób te dane są wykorzystywane. Papier wszystko przyjmie i w warunkach użytkowania można wszystko napisać.
  3. Jak przy każdym innym oprogramowaniu, sprawdzajmy wydawcę. Nie twierdzę, że miejsce rejestracji firmy przesądza o jakości produktu. Ale wciąż lepszym pomysłem będzie skorzystanie z usługi Microsoftu, niż z produktu pracy jednoosobowej działalności pana Radżesza w Dźalandharze w Pendżabie. Wówczas chociaż wiemy, że nasze dane są wykorzystywane wtórnie, to przynajmniej wiemy, gdzie i przez kogo.

Słowem podsumowania

W ramach podsumowania chciałbym jeszcze, żebyście pamiętali o tym, co napisałem we wstępie. Czyli że sztuczna inteligencja ma dziś z faktyczną inteligencją tyle samo wspólnego, co konik polski i konik polny. Czyli kawałek nazwy. Są to programy wytrenowane na naszych danych, ale niezdolne do myślenia twórczego. Są w stanie bardzo szybko skompilować odpowiedź z dostępnych danych, jednak nie myślą logicznie. Chociaż od lat trwają próby stworzenia tak zwanego General AI, to znaczy inteligencji zdolnej do myślenia podobnie jak ludzie, to jednak duża część badaczy skłania się ku opinii, że może to potrwać jeszcze całe dziesięciolecia. A to, co dziś próbują nam wmówić media, że żyjemy w przededniu buntu maszyn, możemy włożyć między bajki.


Odkryj więcej z Bezpieczny Blog

Zapisz się, aby otrzymywać najnowsze wpisy na swój adres e-mail.

Zostaw komentarz

Odkryj więcej z Bezpieczny Blog

Zasubskrybuj już teraz, aby czytać dalej i uzyskać dostęp do pełnego archiwum.

Czytaj dalej