Начал свою работу новый проект ТелеХаус новостной интегратор Digester

   Новостной интегратор Digester предназначен для получения актуальной новостной информации и проведения анализа информационного потока, получаемого из открытых источников. Основное назначение продукта - предоставить пользователям всесторонние возможности по поиску, отбору и анализу информации по разнообразным тематикам.

   Система Digester представляет собой базу данных новостных сообщений, поступающих из различных открытых новостных источников. Статьи, поступающие в систему, индексируются, а также проходят дополнительную обработку для выделения из них аналитической информации. Автоматическая обработка информации включает в себя: аннотирование текстов, кластеризацию текстов по сюжетам, классификацию текстов по рубрикам, выделение значимых информационных объектов.

   Система Digester оперативно индексирует предоставленные данные, после чего они становятся доступными для поиска пользователями. На страницах размещаются заголовки сообщений, ссылки с которых ведут на сайты изданий.

   В результате пользователь системы получает возможность проводить поиск по обработанным статьям, как средствами языка запросов полнотекстового поиска, так и с помощью дополнительных инструментов, основанных на извлеченной из массива статей информации. С помощью оригинальной технологии, основанной на применении Марковских цепей, происходит выделение значимых информационных объектов (персон, организаций, локаций и т.д) и последующее сведение в рейтинговую таблицу.

   Целью данного проекта является создание информационного продукта со свободным доступом для привлечения пользователей, заинтересованных как в получении текущей новостной информации, так и в проведении анализа новостного информационного потока, получаемого из открытых новостных источников.

 

www.digester.ru

© ТелеХаус, 2012