Рекомендуем: Грозди.Ру. Все о вине. Рекомендуем: Nag.Ru.
Ежедневное сетевое издание о телекоммуникациях. Издаётся с 1 декабря 1997 года






Технологии извлечения знаний из текста

Авторы: Ильин Николай, Киселев Сергей

Аннотация:
Основную часть знаний аналитики получают в результате сравнения, анализа и синтеза информации из разрозненных фактов, размещенных в текстах. При работе с большими потоками документов процесс автоматического структурирования текстовой информации заменяет экспертный процесс выделения фактов и объектов, выполняемый вручную. В статье рассматриваются примеры использования новых технологий извлечения знаний из текстов на русском языке, ориентированных на работу с большими хранилищами данных. До 85% новых знаний аналитики до сих пор получают, изучая тексты. В ближайшем будущем наиболее востребованными станут системы с максимально автоматизированными ETL-процессами структурирования контента (extract, transfer, load — «извлечение, преобразование, загрузка»). Важной чертой таких систем будет функция оперативного анализа информации, полученной по запросу для выбора дальнейшего направления исследования документов (автопилотирование направления исследования), выполняемой с помощью методов интеллектуального анализа текста.

Темы: Информационные технологии, Математические исследования, Анализ данных и управление информацией, Философия, концепции

источник — Открытые системы, дата первопубликации — 2006-06-00, оценка рецензента — 4/5, количество переходов — 29172


Поиск публикаций
Все темы
Телекоммуникации и Интернет
Информационные технологии
Компьютерный дизайн и верстка
Юмор
История
Философия, концепции
Руководства для начинающих
Программирование
Операционные системы

Выбрать статьи автора: ,
опубликованные в период с () по (),
отсортированные по .


Советы по поиску

В работе с рубрикатором действуют следующие правила:

  • при выборе раздела, содержащего другие подрубрики, будут выведены публикации на запрошенную тему или на любую из подрубрик выбранного раздела;
  • при выборе нескольких тем, будут выведены публикации, написанные одновременно на все эти темы. Например, при выборе тем Windows 95 и Windows 98, будут показаны только те публикации, которые написаны одновременно и на тему Windows 95, и на тему Windows 98, например, статьи, посвящённые сравнению этих двух операционных систем.

Статистика библиотеки
Статей: 1751 Авторов: 546 Тем: 266
Копирование и последующее коммерческое использование информации не допускается.
Мнение редакции может не совпадать с мнением авторов.
Редакция не несёт ответственности за содержание рекламных объявлений.
© Независимый обзор провайдеров (Provider Proof Review) 1997—2024.
Концепция: Андрей Васин, Sigent 1997—1998; Александр Милицкий 1999—2014.
  Rambler's Top100 LiveInternet: показано число просмотров за 24 часа, посетителей за 24 часа и за сегодня