Érdekes hír mostanában, hogy a Thomson Financial élesben is bevezette a “gépi újságírást”. Azaz egyes cikkeket a rendelkezésre álló adatok alapján egy speciális program ír meg, nem hivatásos újságírók. A módszer előnye, hogy a gép jóval gyorsabb, mint egy ember, de persze sok dolog kérdéses a megbízhatósággal kapcsolatban.
Azaz kérdéses, hogy mennyire és milyen körülmények között megbízhatóak ezek a módszerek. A módszerrel ugyan nyilvánvalóan nem elemzéseket írnak, inkább csak kisebb híreket, mondjuk egy sajtóközlemény és más adatok (pl.: részvényárfolyam) alapján. Tény, hogy a számítógép képtelen megfelelő kontextusban vizsgálni az adatokat és csak nehézkesen képes összevetni azokat más korábbi adatokkal (”szaktudással”) bár ez a magyar újságírás zömére is igaz.
A számítógép ilyen hibáira a legjobban a “mindentudó gép” tanmeséje városi legendája története mutat rá.
Ez egy olyan szoftver volt, amit arra tervezett néhány magyar hobbiprogramozó, hogy a lehető legtöbb kérdésre tudja a választ. A módszerük meglepően egyszerű volt: A szoftver természetesen nem értette a szöveget, de felismert egyszerűbb kifejezéseket (számok, kötőszavak) és nyelvtani szerkezeteket. Amikor feltettek neki egy “kérdést” ez alapján elemezte a megadott referenciaanyagot és abból megpróbált válaszokat szerezni, majd a találatokat összevonta.
A tesztek során persze feltöltöttek minden elérhető anyagot az adatbázisába (az összes elérhető könyv és lexikon). A gép sokszor a legextrémebb kérdésekre is válaszolni tudott. A legtipikusabb hibája azonban annál az egyszerű kérdésnél látszott a legnyilvánvalóbban, amikor megkérdezték tőle, hogy “hány nap alatt teremtette Isten a világot?”. A gép ugyanis magabiztosan válaszolta, hogy 6,8. A válasz nyilvánvalóan hülyeség, de a módszer alapján érthető. A köznyelvben ugyanis Isten a világot hét nap alatt teremtette, a biblia szerint azonban ez csak hat nap volt (ti. a hetedik napon “megpihent”). A szoftverek nem képesek arra, hogy a kettőt elkülönítsék és különböző szempontok alapján értékeljék.
A most kifejlesztett program elsősorban gazdasági adatok alapján ír “cikket”, de kérdésem, hogy mit ír majd, ha mondjuk előkerül az Enron teljesítménye 2000-ben…
Elküldés
Hozzászólás
Hozzászólás RSS
Az FT szerint earningekhez elég, és következtet is bevitt adatokból. Persze elég gáz lehet, ha kiküld valami hülyeséget, és egy profitéhes hedge fund ennek alapján süti el a lóvéját.
Lehet, hogy van még benne lehetősége, pl. sporthírek…
geri: nyílvánvaló, hogy vannak előnyei. Simán el bírom képzelni, hogy egy sajtóközlemény, vagy egy negyedéves jelentés alapján el tud egy gép készíteni egy száraz cikket. Bele lehet illeszteni mondjuk az árfolyam alakulását és hasonló adatokat. Nem hinném azonban, hogy ezt újságírásnak kéne nevezni… inkább csak néhány adat formába öntése.
Sporthíreknél és hasonlóknál a helyzet ugyanez… írhat valamit, de az messze nem lesz annyira értékes, mintha egy profi írná.
Azt el tudom mondjuk képzelni, hogy egy ilyen info alapján a gép összeállít egy cikket, azt publikálják de még ebben a pillanatban nekiáll egy hozzáértő újságíró (akit a rendszer mondjuk smsben értesített) és (mondjuk wikiszerűen) “életet lehel” bele.
A módszer helyett én mondjuk inkább a különálló (feldolgozás nélküli) kishíreket tudnám elképzelni… itt a gép csak közli a jelentést; sajtóközleményt ilyesmit. És ha az valóban fontos, akkor később (értsd: kb. fél óta múlva) kiegészítik egy igazi cikkel, amiben nem csak információ van, hanem annak kifejtése, kontextusba helyezése is. (pl.: itthon a Magyar Telekom éves jelentésénél mindenképpen meg kéne említeni mást is nem csak a tartalmat…)
a barátokközt már régóta számítógép írja, nem tudta?
Ez nem újságírás, csupán szoftveres szövegformázás.
Legalábbis egyelőre…
Ez viszont tecc:”…bár ez a magyar újságírás zömére is igaz.”