Rozwój sztucznej inteligencji (AI) rewolucjonizuje nie tylko technologiczne sektory gospodarki, ale coraz śmielej wkracza w naszą codzienność, oferując narzędzia do tworzenia treści – od grafik po klonowanie głosu. Wraz z tymi możliwościami pojawiają się nieznane wcześniej źródła przychodu osób fizycznych. Jednak tam, gdzie pojawiają się nowe źródła przychodu, nieuchronnie rodzą się pytania o ich prawidłowe rozliczenie z fiskusem. Czy polski system podatkowy jest gotowy na monetyzację dzieł AI? Jak traktować przychody z subskrypcji na grafiki generowane przez algorytmy lub z komercyjnego udostępniania sklonowanego głosu?
Sklonowany głos i algorytmiczna grafika
Światło na podejście organów podatkowych do przychodów generowanych z wykorzystaniem AI rzuca jedna z niedawnych interpretacji indywidualnych dyrektora KIS z 29 kwietnia 2025 r.0115-KDIT1.4011.190.2025.1.MN. Podatnik, zatrudniony na umowę o pracę, uzyskiwał niewielkie, dodatkowe przychody z dwóch internetowych źródeł: oferowania subskrypcji na grafiki premium generowane przez modele AI oraz z komercyjnego udostępniania swojego głosu, sklonowanego również za pomocą sztucznej inteligencji. Działalność ta miała charakter pasywny – treści raz umieszczone na platformach generowały przychody bez konieczności regularnej aktualizacji czy systematycznego zaangażowania podatnika. Podatnik nie prowadził zatem żadnej zorganizowanej, ciągłej działalności w wydzielonym w tym celu miejscu, a przychody miały charakter uzupełniający do działalności wykonywanej w ramach umowy o pracę.
We wniosku o udzielenie interpretacji podatnik wnosił o ustalenie, czy opisane przychody należy kwalifikować jako pochodzące z pozarolniczej działalności gospodarczej, czy też jako przychody z „innych źródeł”? Co ciekawe, podatnik nie rozważał zakwalifikowania uzyskiwanych przez siebie przychodów do źródła „prawa majątkowe”, niemniej jednak organ podatkowy w uzasadnieniu swojego stanowiska taką ewentualność przeanalizował (i wykluczył). Tymczasem jest to okoliczność niebagatelna, jeżeli się zważy, że w odniesieniu do przychodów z niektórych praw majątkowych (takich jak: działalność twórcza w zakresie sztuk plastycznych, fotografiki, działalności artystycznej) uzyskiwanych na podstawie określonych stosunków prawnych (dla przykładu: umowy zlecenia, umowy o dzieło), podatnicy mają prawo zastosować podwyższone koszty uzyskania przychodu, co powoduje, że tylko 50 proc. przychodu podlega opodatkowaniu.
Działalność gospodarcza, prawa majątkowe czy „inne źródła”?
Polskie prawo podatkowe, w szczególności ustawa o podatku dochodowym od osób fizycznych (ustawa o PIT), wyróżnia kilka źródeł przychodów, do których mogłyby zostać przypisane dochody z działalności opartej na AI. Kluczowe staje się rozróżnienie pozarolniczej działalności gospodarczej, przychodów z praw majątkowych oraz, niejako rezydualnie przychodów z „innych źródeł”.
Zgodnie z art. 5a pkt 6 ustawy o PIT pozarolnicza działalność gospodarcza to działalność zarobkowa (wytwórcza, budowlana, handlowa, usługowa, etc.) prowadzona we własnym imieniu bez względu na jej rezultat, w sposób zorganizowany i ciągły, z której uzyskane przychody nie są zaliczane do innych przychodów ze źródeł wymienionych w art. 10 ust. 1 pkt 1, 2 i 4–9. Spełnienie łącznie tych przesłanek – zarobkowego celu, zorganizowania i ciągłości – jest konieczne do uznania danej aktywności za działalność gospodarczą.
Przychody z praw majątkowych, wymienione w art. 10 ust. 1 pkt 7 i uszczegółowione w art. 18 ustawy o PIT, obejmują w szczególności przychody z praw autorskich i praw pokrewnych, praw do projektów wynalazczych, znaków towarowych czy wzorów zdobniczych. Istotą tego źródła przychodu jest zatem komercjalizacja praw własności intelektualnej, w tym przede wszystkim „utworów” w rozumieniu ustawy o prawie autorskim i prawach pokrewnych .
Wreszcie, art. 10 ust. 1 pkt 9 w związku z art. 20 ustawy o PIT wskazuje na „inne źródła” jako kategorię obejmującą przychody nieznajdujące miejsca w pozostałych, bardziej szczegółowo zdefiniowanych źródłach.
Dyrektor KIS przychylił się do stanowiska wnioskodawcy, klasyfikując przychody uzyskiwane przez wnioskodawcę jako „przychody z innych źródeł” (zgodnie z art. 10 ust. 1 pkt 9 w zw. z art. 20 ust. 1 ustawy o PIT).
Uzasadnienie tego stanowiska opierało się na kilku podstawach. Po pierwsze, aktywność podatnika nie spełniała ustawowej definicji działalności gospodarczej z art. 5a pkt 6 ustawy o PIT, która wymaga, aby była to działalność zarobkowa prowadzona w sposób zorganizowany i ciągły. W opisanym przypadku brakowało przede wszystkim znamion zorganizowania i ciągłości.
Po drugie, co szczególnie istotne, organ stwierdził, że przychody te nie mogły być zaliczone do przychodów z praw majątkowych (art. 10 ust. 1 pkt 7 ustawy o PIT). W odniesieniu do sklonowanego głosu AI, wskazano, że syntetyczny obraz głosu, który nie pozwala na rozpoznanie konkretnej osoby, nie generuje przychodu z praw majątkowych. Co do grafik generowanych przez AI, stwierdzono, że nie są one „utworem” w rozumieniu ustawy o prawie autorskim i prawach pokrewnych, gdyż są efektem pracy sztucznej inteligencji, a nie człowieka. Tym samym, podatnik nie posiadał do nich praw podmiotowych, które mógłby komercjalizować w ramach tego źródła przychodów.
Czy treść wygenerowana przez AI może być utworem?
Kwestia, czy przychody z treści generowanych przez AI mogą być uznane za przychody z praw majątkowych, sprowadza się w dużej mierze do analizy, czy są one „utworem” w świetle prawa autorskiego.
Przedmiotem prawnoautorskiej ochrony są i mogą być wyłącznie dzieła człowieka. Aby określona aktywność mogła być uznana za „utwór”, musi stanowić przejaw działalności twórczej o indywidualnym charakterze, ustalony w jakiejkolwiek postaci.
W przypadku grafik generowanych przez AI, jak również sklonowanego głosu, pojawia się zatem fundamentalne pytanie o twórczy wkład człowieka. Organ podatkowy stwierdził, że grafiki są efektem pracy sztucznej inteligencji, a nie człowieka, który jedynie określa za pomocą komend słowa kluczowe czy reguły algorytmów. Stworzone w taki sposób grafiki, według organu, nie są utworem w rozumieniu odrębnych przepisów. Trzeba zastrzec, że teza ta, choć akurat przydatna do oceny analizowanego stanu faktycznego, nie jest tezą uniwersalną. Nie można bowiem wykluczyć, że produkt wygenerowany za pomocą AI nie stanie się utworem. Jeżeli twórca zna dane narzędzie, ma wystarczającą swobodę wyboru opcji w procesie generowania rezultatu, jest zaangażowany w przygotowanie promptu i dobór parametrów w sposób pozwalający świadomie uzyskać określony rezultat, to nie można z góry założyć, że treść wygenerowana „we współpracy” z AI nie będzie utworem (np. niektóre wizualizacje architektoniczne).
Z kolei w „modelowym” procesie klonowania głosu osoba fizyczna dostarcza próbki swojego głosu (nagrania konkretnych fraz lub dłuższych wypowiedzi), tworząc w ten sposób jego cyfrowy zapis. Następnie algorytmy AI analizują te próbki i „uczą się” unikalnych cech danego głosu: jego barwy, tonu, intonacji, tempa mowy, a nawet charakterystycznych manieryzmów. Wynikiem tej analizy jest stworzenie cyfrowego modelu głosowego. Taki model potrafi syntetyzować mowę, czyli generować nowe wypowiedzi, które brzmią jak głos konkretnej osoby, nawet jeżeli osoba ta nigdy wcześniej tych konkretnych słów nie wypowiedziała.
Skoro, jak wyżej wskazano, podstawową zasadą prawa autorskiego jest to, że utwór musi być rezultatem twórczej działalności człowieka o indywidualnym charakterze, to w takim „modelowym” procesie klonowania głosu, takiego twórczego wkładu nie dostrzeżemy. Głos jest klonowany przez algorytm sztucznej inteligencji, rola człowieka ogranicza się do dostarczenia próbek głosu, a tym samym wygenerowany (sklonowany) plik głosowy może nie stanowić „utworu” stworzonego przez człowieka. W takim przypadku proces „wytworzenia głosu” jest w dużej mierze dziełem maszyny (algorytmu AI).
Inaczej należałoby jednak ocenić sytuację, w której człowiek wnosiłby twórczy wkład w ostateczną formę sklonowanego głosu poprzez jego szczególne modelowanie, czy artystyczną edycję. Należy bowiem odróżnić samą „bazę” sklonowanego głosu od potencjalnego utworu stworzonego przy jego użyciu. W takim przypadku należałoby uznać, że sam proces generowania głosu byłby prowadzony lub modyfikowany przez człowieka, że jego indywidualne, twórcze decyzje miałyby decydujący wpływ na ostateczny, unikalny kształt sklonowanego głosu, który sam w sobie nosiłby znamiona oryginalności. Wówczas należałoby uznać, że na gruncie przepisów prawa autorskiego doszło do powstania „utworu”. Jest to jednak sytuacja technicznie bardziej skomplikowana i rzadko spotykana w prostym klonowaniu.
Oczywiście powstaje odrębne zagadnienie związane z tym, czy dobrem osobistym człowieka – elementem jego wizerunku – nadającym się do komercyjnego wykorzystania nie jest już sam głos posiadający określone cechy osobnicze i umożliwiający jego identyfikację. Wątpliwość ta sprowadza się do pytania – czy głos jest jedynie „narzędziem”, czy „surowcem” do stworzenia utworu, czy już utworem? W omawianej interpretacji indywidualnej organ podatkowy tych rozważań nie prowadził. Argumentował, że sklonowany głos nie pozwala na rozpoznanie i identyfikację osoby fizycznej. Co ciekawe, ten istotny argument (niemożność rozpoznania głosu) nie był elementem przedstawionego stanu faktycznego, ale elementem uzasadnienia prowadzącego do wniosku o niemożności zaliczenia przychodów z komercyjnego udostępnienia głosu do praw majątkowych.
Niewątpliwie głos jest dobrem osobistym człowieka, nadającym się do komercyjnego wykorzystania (co zresztą potwierdza omawiana interpretacja). Jednak jeżeli jego sklonowana wersja jest na tyle przetworzona lub ogólna, że traci indywidualne cechy pozwalające na identyfikację konkretnej osoby, to nie można uznać, że mamy do czynienia z komercyjnym wykorzystaniem rozpoznawalnego, unikalnego „utworu” tej osoby w sensie prawa autorskiego, które generowałoby przychód z praw majątkowych. Należy jednak podkreślić, że identyfikowalność głosu byłaby kluczowa bardziej dla ochrony dóbr osobistych niż dla samego istnienia prawa autorskiego do utworu (o ile utwór ten by powstał), chociaż niewątpliwie są to zagadnienia ściśle ze sobą powiązane. W rozumowaniu organu podatkowego, kwestia nierozpoznawalności głosu była argumentem kluczowym przeciwko tezie o „majątkowym prawie” związanym bezpośrednio z osobą podatnika. Rozumowanie organu podatkowego pozostawia jednak pewien niedosyt. Łatwo bowiem wyobrazić sobie sytuację, w której określona treść będzie korzystała z ochrony jako dobro osobiste, ale nie będzie utworem i odwrotnie. Nie jest zatem tak, jak chce organ, że wyłącznie z faktu nierozpoznawalności głosu wynikać ma to, że przychody z jego komercjalizacji nie będą znajdowały się w źródle „prawa majątkowe”. Nierozpoznawalny surowiec w postaci próby głosu może być bowiem twórczo wykorzystany i będąc komponentem utworu, stanowić przedmiot komercjalizowanego prawa majątkowego. Z kolei, odpłatne udostępnianie głosu Krystyny Czubówny, sklonowanego bez jej zgody, rozpoznawane powinno być jako naruszenie jej dobra osobistego, a nie zaliczane do przychodów z praw majątkowych.
Podsumowując, przyporządkowanie przychodów z komercyjnego wykorzystania sklonowanego głosu, jak również grafik generowanych przez AI, będzie wiązało się z przesądzeniem roli człowieka w wytworzeniu treści AI. Jeśli ta rola sprowadzi się do dostarczenia próbek (w przypadku głosu) lub wprowadzenia prostych komend (promptów w przypadku grafik), a cała reszta procesu generowania finalnego pliku audio czy obrazu jest realizowana przez algorytm AI, to trudno uznać taki plik za „utwór” stworzony przez tego człowieka, a tym samym kwalifikacja do źródła przychodów prawa majątkowe będzie niemożliwa.
Omawiana interpretacja indywidualna potwierdza ten kierunek myślenia. Organ uznał, że skoro grafiki są efektem pracy AI, a nie człowieka, to nie są one utworem. Podobnie syntetyczny, nieidentyfikowalny głos AI nie został zaliczony do przedmiotów praw majątkowych.
Podsumowanie i wnioski
Opodatkowanie przychodów generowanych z wykorzystaniem sztucznej inteligencji to wciąż stosunkowo nowy i dynamicznie kształtujący się obszar. Kluczowe dla kwalifikacji podatkowej są ocena indywidualnych okoliczności, w tym stopnia zorganizowania działalności, oraz rzeczywistego, twórczego wkładu człowieka w finalny produkt. Kwalifikacja przychodu do odpowiedniego źródła – czy to działalności gospodarczej, praw majątkowych, czy „innych źródeł” – ma bezpośredni wpływ na sposób jego opodatkowania. W miarę upowszechniania się tych technologii, można spodziewać się dalszego rozwoju praktyki interpretacyjnej, a być może w przyszłości także bardziej szczegółowych przepisów. Do tego czasu, podatnikom wkraczającym na te nowe pola zarobkowania zaleca się daleko posuniętą ostrożność i staranność.
Beata Krzyżagórska-Żurek
adwokat, partner zarządzająca w kancelarii Krzyżagórska Łoboda sp. p.
Małgorzata Dąbrowska
adwokat w tej kancelarii
Tekst powstał we współpracy z siecią Kancelarie RP