L
upa

NLP (Natural language processing)

Piše: Mladen Barbarić
Foto: Pixabay

Obrada prirodnog jezika (NLP) je potpodručje računalne znanosti i umjetne inteligencije (AI) koje koristi strojno učenje kako bi omogućilo računalima da razumiju ljudski jezik i komuniciraju njime.

Ukratko, NLP omogućuje računalima i digitalnim uređajima da prepoznaju, razumiju i generiraju tekst i govor kombinirajući računalnu lingvistiku - modeliranje ljudskog jezika temeljeno na pravilima - zajedno sa statističkim modeliranjem, te nečim što zovemo strojno učenje (machine learning) i dubinsko učenje (deep learning).

„NLP istraživanje pomoglo je omogućiti eru generativne umjetne inteligencije, od komunikacijskih vještina velikih jezičnih modela (LLM) do sposobnosti modela generiranja fotografija. NLP je već dio svakodnevnog života za mnoge, on pokreće tražilice, potiče chatbotove za korisničku službu s govornim naredbama, glasovno upravljane GPS sustave i digitalne pomoćnike koji odgovaraju na pitanja na pametnim telefonima kao što su Amazonova Alexa, Appleova Siri i Microsoftova Cortana”, stoji u objašnjenju ovog termina koje daje tehnološki div IBM.

Unatoč značajnom napretku NLP tehnika za automatiziranu analizu teksta, umjetna inteligencija još uvijek zaostaje u razumijevanju temeljnih ljudskih koncepata kao što su sarkazam ili ironija. Sustavi koji se temelje na umjetnoj inteligenciji trenutno se bore s dezinformacijama koje se oslanjaju na suptilnije oblike izražavanja izvan eksplicitnog sadržaja. Osim toga, jezične barijere i specifično kulturno/političko okruženje u svakoj zemlji predstavljaju još veće izazove.

Uobičajeni pristup upravljanju ovim izazovima je uključivanje ljudi u proces analize teksta, posebno kada je u pitanju obuka algoritama za strojno učenje. Kako upozoravaju stručnjaci za medije s portugalskog Sveučilišta Beira Interior, „u projektu klasifikacije lažnih vijesti, ljudi mogu označiti vijest kao lažnu ili istinitu u prvoj fazi. Zatim, program može naučiti iz ovih indikacija za dodjelu karakteristika i donošenje odluka o klasifikaciji na temelju obrazaca identificiranih u vijestima. Ovaj pristup, koji se naziva polu-nadzirano učenje, nudi potencijal za povećanje točnosti automatizirane analize teksta kombiniranjem ljudske sposobnosti razumijevanja jezičnih nijansi s učinkovitošću automatizirane obrade teksta”.

ABCČĆDĐEFGHIJKLLjMNNjOPQRSŠTUVWXYZŽ

Verificirani član EFCSN-a (Europska mreža organizacija za provjeru činjenične točnosti)


Verified EFCSN member (European Fact-Checking Standards Network)

Izneseni stavovi i mišljenja samo su autorova i ne odražavaju nužno službena stajališta Europske unije ili Europske komisije. Ni Europska unija ni Europska komisija ne mogu se smatrati odgovornima za njih.
Izneseni stavovi i mišljenja samo su autorova i ne odražavaju nužno službena stajališta Agencije za elektroničke medije. Agencija za elektroničke medije ne može se smatrati odgovornima za njih.