Bing

Microsoft Research stvara sustav koji može automatski generirati "pametne" titlove

Sadržaj:

Anonim

Sigurno ste naišli na natpis koji je zbunjujući, netočan ili govori malo o slici na koju se odnosi; a čak je moguće da će vam se, ako se posvetite objavljivanju vlastitih članaka, činiti zamornim ispunjavati ovaj odjeljak. Pa, ljudi iz Redmonda stvorili su alat koji vam želi olakšati stvari.

Djelo koje je objavilo Microsoftovo istraživanje koje sebe opisuje kao "sustav za generiranje opisa" sposoban oponašati narativne karakteristike ljudskog jezika, to jest, tehnologiju koja može opisati snimke zaslona kao da se radi o jednom od nas, s pripadajućim kontekstom.Nešto na čemu tvrtke poput Facebooka, Microsofta i Googlea rade već neko vrijeme, ali ovaj put premašuje očekivanja.

Od čega se sastoji

Super se proveo

Na ovaj način, sustav ima mogućnost čak ispričati cjelovitu priču iz nekoliko slika, opisujući je i pričajući je kao da to je bila knjiga. Uslužni program koji bi, prema mišljenju stručnjaka, mogao postati značajka koja pruža ljudski pristup određenim aplikacijama, aplikacijama za prepoznavanje glasa, automatsko generiranje opisa u drugim područjima i još mnogo toga.

Činjenica je da alat nije ograničen na kazivanje, ukratko, onoga što "vidi", već pruža širi kontekstu situacije koja se odražava na slici, postižući "narativni kontekst i jedinstveni stil pripovijedanja", objasnio je Frank Ferraro, jedan od autora ovog djela.Da bismo se doveli u situaciju, on nam daje jasan primjer

Njegova majka je bila ponosna na njega

Dakle, predlažemo sljedeći slučaj: “Zamislimo da imamo album s fotografijama nekih prijatelja koji su proslavili rođendan u Pub. Neke od prvih slika prikazuju ljude kako naručuju pivo i piju ga, dok posljednje prikazuju nekoga kako spava na sofi”, komentirao je.

Konvencionalni sustav “mogao bi jednostavno ukazati na nešto poput osobe koja leži na sofi, dok bi naš sustav mogao uključiti da je vjerojatno u toj situaciji jer je pijana nakon nekoliko pića” . Dodatak koji pruža razumijevanje i određeni emocionalni naboj koji se također odražava kroz slike i opise fotografija uključene u ovaj članak.

Preko | MIT Technology Review

U Xataka Windows | Microsoft lansira aplikaciju koja određuje pasminu vašeg psa

Bing

Izbor urednika

Back to top button