žurnalistika

Roboti v českých médiích: Projekt VŠ a ČTK spojuje žurnalistiku s umělou inteligencí

Dnešní době se přezdívá plastová nebo postfaktická. Stejně dobře by na ni ale seděl přívlastek robotická. Fakt, že umělá inteligence nahradí do několika let řadu profesí, je častým námětem vášnivých debat. Mimo jiné se jedná o tom, jak může automatizace ovlivnit současnou žurnalistiku. Odpověď přináší tříletý projekt Českého vysokého učení technického (FEL ČVUT), Fakulty sociálních věd Univerzity Karlovy (FSV UK), Západočeské univerzity (FAV ZU) a České tiskové kanceláře (ČTK).

Společný počin výše zmiňovaných organizací má dost komplikovaný název Proměna etických aspektů s nástupem žurnalistiky umělé inteligence. Jedná se o vůbec první spolupráci technických a humanitních vysokých škol a veřejnoprávních médií. Hlavním cílem je propojit efektivně žurnalistiku s umělou inteligencí (UI). Neznamená to ale, že by experti z ČVUT vyvíjeli od rána do večera v laboratořích "robonovináře", kteří se jednoho krásného dne vzbouří a svrhnou všechny živé žurnalisty. Jde o to navrhnout a následně uvést do provozu systém, jenž by s pomocí UI dokázal vytvářet, analyzovat a ověřit zprávy. To zní samo o sobě docela jednoduše. Jak to ale funguje v praxi?

Alquist - březen 2019
work
Jak se rodí chatboti? Rozhovor s programovacími mágy z ČVUT
20. 3. 2019
3 minuty o chatbotech

Od algoritmu k textu

Proces propojování UI s novinařinou má několik fází. Nejdřív vznikne funkční vzorek algoritmu, na základě něhož bude možné generovat jednoduché české texty a dávat je na základě témat a dílčích faktů přímo do souvislosti se staršími články. "V současné chvíli analyzujeme databázi zpráv ČTK od roku 2000 a jejich kontextu," popisuje Luboš Král, který je jedním z pracovníků Centra umělé inteligence při FEL ČVUT a dodává, že aktuálně se zprávami ČTK, jichž se za necelých dvacet let nastřádalo kolem milionu, musí probrat jen se dvěma kolegy. V budoucnu ale plánují zapojit ještě několik studentů, kteří pak budou z poznatků těžit při psaní svých diplomek.

Výsledná data, která získají procházením databáze ČTK, pak poslouží jako podklad pro vytvoření algoritmu. Hotový vzorek bude "tréninkovým materiálem" pro neuronové sítě. Ty díky metodě strojového učení pochytí všechny poznatky, které jsou důležité při generování automatického textu. Král doplňuje, že celá příprava na proces učení musí být bezchybná a dokonale promyšlená. "V téhle fázi je naprosto klíčové předzpracování dat, kde používáme statistické metody, a dále volba vhodných metod trénování vlastních sítí a dalších možností zpracování přirozeného jazyka NLP." (NLP je zkratka pro Natural Language Processing a jde o propojení lingvistiky a IT, kdy stroj zpracovává přirozený jazyk a využívá ho k analýze a generování textu nebo mluveného slova, pozn. red.)

Foto: Unsplash.com

Počítá se s tím, že zpočátku vzniknou pravopisně bezchybné a srozumitelné, ale stylisticky neohrabané texty. Čtenář tedy pozná, že má před sebou článek od robota. Postupně by se ale díky neustálému vylepšování systému měla vypilovat i formální stránka textů a ve finále by měl být strojový text nerozeznatelný od článku psaného novinářem. Což je dost velká výzva, vzhledem k tomu, že čeština je plná výjimek, anomálií a unikátních slovních obratů.

V první fázi budou novou metodou tvořeny především souhrny zpráv daného dne. Možnost vygenerovat si automaticky výtah toho nejpodstatnějšího redaktorům výrazně usnadní práci. Konkrétně v ČTK, která v projektu hraje roli hlavního garanta a testovatele, se totiž souhrny vydávají zpravidla pětkrát denně a při jejich tvorbě nestačí jen zmáčknout Ctrl+C a Ctrl+V. Vždycky je potřeba vychytat některé nedostatky, aktualizovat informace, které neplatí nebo přidat nové souvislosti.

student žurnalistiky
work
Mladí novináři? Příležitostí k realizaci mají spoustu
4. 4. 2019
3 minuty o současné žurnalistice

Otestovat a vyladit

Než se systém dočká ostrého provozu, bude nutné vše pořádně otestovat v praxi. Během první fáze i po jejím dokončení budou proto probíhat terénní výzkumy v redakcích všech institucí, které jsou v projektu zapojené jako garanti, což je hlavně zmiňovaná ČTK, dále pak redakce zpravodajství ČT a Syndikát novinářů. Testovat se bude především rychlost vzniku zpravodajských sdělení, přesnost a proces ověřování textů, a to jak podle současných redakčních postupů na straně jedné, tak s pomocí prvků UI na té druhé. Problémy, které se během testování objeví - ať už půjde o potíže technické či etické -, budou sloužit pracovníkům z ČVUT jako důležitá zpětná vazba, která jim pomůže ve druhé fázi vývoje.

V rámci ní má vzniknout další vzorek algoritmu. Kromě pokročilého "robogenerátoru" by měl začít fungovat i nástroj na kontrolu jednotlivých tvrzení, která budou vyhodnocována na základě již dostupných textů nebo statistických údajů. To by mohlo pro žurnalistiku i pro veřejnost znamenat skutečnou revoluci. Představte si, že sledujete prezidentskou debatu, kde má její moderátor možnost průběžně potvrzovat jednotlivá tvrzení všech kandidátů. Nebo líp - že bude přímo na obrazovce u každého kandidáta vyskakovat informace, jestli mluví pravdu nebo jde jen o předvolební manipulativní tah.

Nově vyvinuté nástroje navíc poběží v rámci již hotových a skvěle zabezpečených interních redakčních systémů, ven už půjdou jen hotové texty. Není tedy nutné vymýšlet dodatečnou ochranu ani se bát, že by redakční systém někdo hacknul a začal do něj sypat nežádoucí zprávy.

Josef Šlerka
work
Josef Šlerka: Českou mediální scénu by měla čekat generační obměna, která nepřichází
7. 1. 2019
4 minuty o médiích

A novináři nebudou mít co…

Výstupy projektu ovlivní nejvíc ze všeho pochopitelně novináře a jejich pracovní náplň. Otázka je, jestli jim plánované změny uleví, nebo jim připraví neklidné spaní, protože se budou bát o svoje pracovní místo. I v tomhle bodě mají všichni zúčastnění jasno. ČVUT i FSV UK fungují ve vzájemné symbióze, připravují pro sebe workshopy, kde si vyměňují informace a názory na to, jak by spojení žurnalistiky a UI mělo v praxi ideálně fungovat.

Debat se účastní také pedagog FSV a přední český novinář Václav Moravec, jenž je připraven využít obou svých společenských rolí a stát se jednou z klíčových osob třetí fáze projektu, která se soustředí právě na etickou stránku věci.

Je tedy jasné, že novinářům nikdo brát práci nechce. Jde hlavně o to ušetřit čas a zařídit, aby jim odpadla činnost, která pro ně nemá žádnou přidanou hodnotu, a místo které by se mohli věnovat zajímavějším věcem. Nejdřív si ale přeci jen budou muset projít lehce otravnou testovací fází, kdy se po nich naopak bude chtít, aby systému věnovali čas navíc. Automaticky vygenerované texty totiž bude nutné kontrolovat, a to tak dlouho, dokud v dané redakci nevychytají chyby a nezískají stoprocentní jistotu, že systém zvládne fungovat sám bez dalších editací a kontrol.

Foto: Unsplash.com

Kromě dopadů na novináře v praxi bude nutné vyřešit i náležitou přípravu budoucích žurnalistů, legislativní změny, které budou s nástupem UI do žurnalistiky velmi potřebné nebo se zamyslet nad reakcemi čtenářů na automaticky generované texty a případně se na ně připravit.

Česká premiéra?

Je důležité zmínit, že možnost číst automaticky vygenerované texty není úplnou novinkou a Češi ji přeci jen už několikrát měli. Nikoho moc nepřekvapí, že automat využila jako první ČTK, a to například během voleb v říjnu 2018 - tehdy pomáhal editorům a redaktorům s přepisem dat z Českého statistického úřadu. Celkem se stal program spoluautorem více než dvou stovek automatických textů. Šlo především o headliny a krátké zprávy přinášející průběžné výsledky v různých okrscích. ČTK se kvůli zrychlení zpravodajského servisu snaží
o automatizaci některých procesů již dlouhodobě.

Právě skutečnost, že ČTK není v oboru automatizace žurnalistiky nováčkem, se stala hnacím motorem pro vývojáře z ČVUT, jejichž původním plánem bylo zůstat u vývoje obdobného systému, který již ČTK využila. Tak se z poněkud skromného cíle vyvinul ambiciózní projekt, který by mohl v budoucnu pořádně rozvířit stojaté vody české žurnalistiky.

Jan Pichl - květen 2018
life
„Chatbot může být náš nový kamarád." S Honzou Pichlem o vývoji konverzačních botů na globální úrovni
12. 6. 2018
3 minuty o umělé inteligenci

Využití UI v zahraničí

Zlepšováky založené na využití UI úspěšně používají při své práci redaktoři v zahraničí. Za všechny zmiňme jen pár případů. Deník The New York Times pracuje od roku 2015 se systémem Editor, který umožňuje novinářům označovat titulky, fráze i další části právě vytvářených článků a přiřazovat jim zvláštní tagy. Ty si Editor zapamatuje a roztřídí podle relevantních kategorií. Při psaní dalšího článku si novinář za použití správných tagů dokáže rychle vytahat informace, které třeba použije k dovysvětlení kontextu nebo ověření některých faktů.

Práci novinářů z agentury Reuters zase usnadňuje nástroj Reuters News Tracer, který se denně probírá všemi příspěvky na Twitteru a filtruje z nich aktuality, které by mohly být důležité. To umožňuje agentuře informovat o veškerém zásadním dění mezi prvními. V praxi se nástroj osvědčil už mnohokrát, mimo jiné při zemětřesení v Ekvádoru, nebo bombových útocích v Bruselu.

UI pak nachází skvělé uplatnění dokonce i na sociálních sítích. Facebook díky ní dokáže na základě určitých frází detekovat rychle a účinně fake news a snaží se tak bránit jejich šíření.

Mohlo by tě zajímat

Nejnovější