Чтение онлайн

на главную - закладки

Жанры

Эксперт № 16 (2014)

Эксперт Эксперт Журнал

Шрифт:

Intelligent Tagger позволяет автоматически вычленять факты и связи между объектами. По запросу «Сноуден» система рисует легкочитаемую инфографику, отображающую ключевые факты: родился, учился, работал; разбивку событий по годам, ключевых лиц, с которыми он был связан, причем их система вычленяет из новостной базы не только по именам, но и по социальным ролям, например girlfriend.

Количество возможных применений Compreno ограничено лишь фантазией заказчика. Например, можно настроить анализ корпоративной переписки на поиск любых эвфемизмов для «откат» и «вознаграждение» или негативных отзывов о руководителе, причем система поймает не только прямые упоминания «Иван Иваныч» или «генеральный», но и «дражайший», «сам» и «наш козел».

Интеллектуальный поиск может работать не только с корпоративными документами. Запустив робота на индексацию интернета, можно отыскать все упоминания о каких-либо событиях, фактах или персонах в определенных контекстах и взаимосвязях. Например, можно использовать систему для поиска взаимосвязей между сотрудниками вашего отдела снабжения и руководителями поставщиков, и вполне возможно, что кто-то из них родственники или учился в одном классе. Сейчас министерство внутренней безопасности США публикует длинный перечень ключевых слов, по которым осуществляется мониторинг интернета: от «Аль-Каиды» и «теракта» до «исламистов» и «свинины». Использование поисковых решений на основе Compreno позволит более изощренно и эффективно подходить к контролю интернета, чем уже заинтересовались компетентные службы.

Как признался нам генеральный директор ABBYY Сергей Андреев , компания мечтала бы сосредоточиться на лицензировании технологий сторонним разработчикам. Но как стало очевидно на примере нынешней «дойной коровы» ABBYY — решений в области распознавания текстов и потокового ввода данных, только непосредственная работа с конечным потребителем дает понимание его нужд и возможность совершенствовать под них технологию.

Цены на Intelligent Search и Intelligent Tagger не называются, поскольку формируются в зависимости от объема задач в каждом конкретном случае и числа используемых процессоров. Но, по словам Антона Тюрина, средняя цена установки корпоративного поиска на рынке — 62,5 тыс. долларов, и решения ABBYY будут вполне конкурентоспособны по цене. Ключевой рынок, на который нацелена ABBYY, — Соединенные Штаты.

Плоды понимания

Однако поисковые решения — лишь первый шаг. Compreno — базовая технология, которая может быть использована в десятках различных приложений, предназначенных для работы с текстом. Уже на этапе финальной доработки находится eDiscovery — поиск информации в документах в рамках юридических разбирательств, аудита и расследований в США, Великобритании и других государствах. В них требуется обработка огромных массивов корпоративной информации для дальнейшего поиска и выявления фактов и доказательств.

В числе следующих решений — анализ тональности высказываний (отношения автора к предмету обсуждения) в текстах, обрабатываемых, например, в процессе мониторинга СМИ и социальных сетей. Охрана «информационного периметра» организации с выявлением фактов передачи несанкционированной информации и система прогнозирования и оповещения о наступлении событий. Настоящим переворотом может стать планируемый выход программы семантического перевода — ориентированного на передачу смысла с учетом контекста.

Пока ABBYY в своих решениях нацелена на корпоративный рынок, ввиду его готовности платить. Однако издержки, которые несет человечество из-за языковых барьеров, несопоставимо обширнее корпоративного спроса. Появление системы осмысленного перевода (коим не всегда могут похвастать даже переводчики из плоти и крови), особенно в сочетании с технологиями распознавания речи, может перевернуть нашу повседневную жизнь. Небольшой гаджет или приложение на мобильном позволят нам понимать все основные языки мира и общаться на них в режиме реального времени.

Но еще большие перемены сулит семантический анализ в применении к проблеме «больших данных». Сейчас маркетологи, госорганы, врачи, юристы, соцсети, спецслужбы и многие другие копят гигантские данные, количество которых в мире удваивается каждые 12–18 месяцев. Но проку от них пока немного: 80% накапливаемых данных являются неструктурированными, поэтому их поиск, анализ и обработка крайне затруднены. Использование семантического анализа радикально изменит ситуацию, сделав наш мир электронных данных тотально прозрачным и контролируемым.

Compreno ориентирована на понимание и передачу смысла текста. Художественных изысков она порой не понимает и уж точно не ориентирована на то, чтоб их синтезировать. Можно предположить, что массовое распространение семантического анализа повлияет и на наш язык, сделает его проще и строже. Иначе тех, кто выражается излишне затейливо, не поймет даже их собственный холодильник.

Впрочем, чуждость Compreno языковой эстетике имеет свой плюс. Любой художественный текст система интерпретирует и переводит лишь как набор информации, поэтому плоды ее работы вряд ли будут радовать утонченностью стиля. А значит, какие-то задачи для переводчиков и журналистов еще останутся. Осталась бы для них аудитория.

Причины для гнева Николай Пахомов

Кризис в российско-американских отношениях из-за ситуации на Украине вскрыл фундаментальные проблемы американской внутренней и внешней политики

section class="box-today"

Сюжеты

Россия vs США:

Гонка крылатых

Крым на Балтике

/section section class="tags"

Теги

Россия vs США

Долгосрочные прогнозы

Вокруг идеологии

/section

Резкое обострение отношений России и Запада из-за Украины, а также введение западных санкций против России дали повод для многочисленных разговоров о возобновлении холодной войны. Хотя с такими оценками согласиться трудно, нельзя не обратить внимания на исключительно резкую реакцию (если не всегда по содержанию, то уж точно по форме) западных государств, в особенности США, на российские действия. Каковы причины такой реакции?

Поделиться:
Популярные книги

Шайтан Иван 6

Тен Эдуард
6. Шайтан Иван
Фантастика:
попаданцы
альтернативная история
историческое фэнтези
7.00
рейтинг книги
Шайтан Иван 6

Лекарь Империи 5

Карелин Сергей Витальевич
5. Лекарь Империи
Фантастика:
городское фэнтези
аниме
героическая фантастика
попаданцы
5.00
рейтинг книги
Лекарь Империи 5

Курсант: Назад в СССР 7

Дамиров Рафаэль
7. Курсант
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Курсант: Назад в СССР 7

Хозяин Стужи

Петров Максим Николаевич
1. Злой Лед
Фантастика:
аниме
фэнтези
попаданцы
7.00
рейтинг книги
Хозяин Стужи

Чехов книга 3

Гоблин (MeXXanik)
3. Адвокат Чехов
Фантастика:
попаданцы
альтернативная история
аниме
6.00
рейтинг книги
Чехов книга 3

Седина в бороду, Босс… вразнос!

Трофимова Любовь
Юмор:
юмористическая проза
5.00
рейтинг книги
Седина в бороду, Босс… вразнос!

Ермак. Противостояние. Книга одиннадцатая

Валериев Игорь
11. Ермак
Фантастика:
попаданцы
альтернативная история
4.50
рейтинг книги
Ермак. Противостояние. Книга одиннадцатая

Метатель

Тарасов Ник
1. Метатель
Фантастика:
боевая фантастика
попаданцы
рпг
фэнтези
фантастика: прочее
постапокалипсис
5.00
рейтинг книги
Метатель

Мастер Трав III

Мордорский Ваня
3. Мастер Трав
Фантастика:
фэнтези
рпг
фантастика: прочее
попаданцы
5.75
рейтинг книги
Мастер Трав III

Шатун. Лесной гамбит

Трофимов Ерофей
2. Шатун
Фантастика:
боевая фантастика
7.43
рейтинг книги
Шатун. Лесной гамбит

Тыл-фронт

Головин Андрей
Проза:
военная проза
проза прочее
5.00
рейтинг книги
Тыл-фронт

Газлайтер. Том 2

Володин Григорий
2. История Телепата
Фантастика:
попаданцы
альтернативная история
аниме
5.00
рейтинг книги
Газлайтер. Том 2

Цикл "Идеальный мир для Лекаря". Компиляция. Книги 1-30

Сапфир Олег
Лекарь
Фантастика:
боевая фантастика
юмористическое фэнтези
аниме
фэнтези
5.00
рейтинг книги
Цикл Идеальный мир для Лекаря. Компиляция. Книги 1-30

Афганский рубеж 4

Дорин Михаил
4. Рубеж
Фантастика:
попаданцы
альтернативная история
6.00
рейтинг книги
Афганский рубеж 4