Il brevetto di Google sui ritagli di giornale

<%image(google scanner giornali riviste.jpg|462|580|google scanner giornali riviste)%>Segmenting Printed Media Pages Into Articles. E’ la richiesta di brevetto redatta da Google ad agosto 2008 e venuta a galla la scorsa settimana.

Si tratta di un processo automatico ed avanzato di scansione e riconoscimento testi per layout complessi come giornali e riviste.

Finora nel processo di riconoscimento testi la “segmentazione” è stata la fase più dispendiosa in termini di tempo (e quindi di denaro) perchè spesso richiede l’intervento umano.

Per farla più semplice ancora: prendere la pagina di un quotidiano e ricavarne automaticamente singoli articoli da archiviare. (vedere immagine a lato)

Insomma una specie di ritaglista digitale, la cui utilità ai tempi degli archivi online è difficile quantificare.

Potenzialmente però una di quelle piccole cose che fanno andare di trasverso il caffè a Rupert Murdoch la mattina.