A Mesterséges Intelligencia forradalma: A ChatGPT-től a Sora videógenerátorig
Az elmúlt évtizedek leggyorsabb technológiai paradigmaváltásának lehetünk tanúi: a mesterséges intelligencia, és azon belül is a generatív nyelvi modellek (LLM) kiléptek a kutatólaborok falai közül, és megkezdték a mindennapi életünk, a gazdaság és a társadalom alapvető átalakítását. Ennek a forradalomnak a vitathatatlan éllovasa a Sam Altman által vezetett San Franciscó-i startup, az OpenAI. A ChatGPT negyedik generációjának (GPT-4) bemutatása bebizonyította, hogy az algoritmusok ma már nemcsak hibátlanul kommunikálnak, programkódokat írnak vagy bonyolult logikai feladatokat oldanak meg, hanem sok esetben az emberi szakértőket megközelítő vagy azokat meghaladó teljesítményt nyújtanak a jogi és orvosi szakvizsgákon is.
Az OpenAI innovációs gépezete azonban nem állt meg a szöveggenerálásnál. A cég bemutatta a Sorát, egy olyan text-to-video modellt, amely puszta szöveges utasítások (promptok) alapján képes akár 60 másodperces, hiperrealisztikus, lenyűgöző felbontású és fizikai törvényszerűségeket nagyrészt tiszteletben tartó videókat generálni. A Sora bemutatója szó szerint sokkolta a kreatív iparágakat, a hollywoodi filmstúdióktól kezdve a reklámügynökségeken át az animátorokig. Bár a technológia még nem hibátlan, nyilvánvalóvá vált, hogy éveken belül a filmkészítés, az effektezés és a tartalomgyártás költségei a töredékükre eshetnek, drasztikusan átrendezve a médiaipari munkaerőpiacot.
A mesterséges intelligencia dominanciájáért ádáz fegyverkezési verseny zajlik a technológiai óriások között. A Google hatalmas erőforrásokat mozgósított, és bemutatta a Gemini nevű multimodális modellcsaládját, amelyet közvetlenül a cég keresőjébe és felhőszolgáltatásaiba integrál, próbálva visszaszerezni az OpenAI-tól a kezdeményezést. Eközben a Mark Zuckerberg vezette Meta a nyílt forráskódú (open-source) stratégiát választotta a Llama modellek ingyenes közzétételével, ami demokratizálta az MI-kutatást a kisebb fejlesztők és egyetemek számára. A hardverpiacon az Nvidia lett a forradalom legnagyobb nyertese: a cég MI-gyorsító chipjei (GPU-i) iránti kielégíthetetlen kereslet a vállalat értékét csillagászati, több billió dolláros magasságokba repítette.
A lenyűgöző technológiai eredmények mellett egyre hangosabbak a technológia veszélyeire figyelmeztető hangok is. A szerzői jogi viták folyamatosak, a New York Timestól kezdve neves írókig sokan perlik az MI cégeket, amiért azok engedély és kompenzáció nélkül használták fel a műveiket a modellek betanítására. A politikai szférában a legnagyobb félelmet a deepfake videók és a generált dezinformáció tömeges terjedése okozza, ami a 2024-es amerikai és európai választások évében komoly nemzetbiztonsági kockázatot jelent, aláásva a demokratikus intézményekbe vetett amúgy is törékeny bizalmat.
Erre a fenyegetésre reagálva az Európai Unió a világon elsőként fogadta el az átfogó, mérföldkőnek számító Mesterséges Intelligencia Kódexet (AI Act). A jogszabály egy kockázatalapú megközelítést alkalmaz: szigorúan tiltja az embereket manipulatív módon befolyásoló vagy a társadalmi kreditrendszerhez hasonló alkalmazásokat, és szigorú átláthatósági, emberi felügyeleti kötelezettségeket ír elő a magas kockázatú (például egészségügyi, igazságszolgáltatási) MI-rendszerek fejlesztői számára. Bár az AI Act globális szabályozási etalon (arany standard) kíván lenni a GDPR-hoz hasonlóan, az amerikai tech-szektor arra figyelmeztet, hogy a túlzott európai szigor megfojthatja az innovációt, és behozhatatlan lemaradást okozhat a kontinensnek a globális versenyben.