Блеск и нищета MT systems

Подвергай все сомнению

 

Не без почтения, однако, следуя девизу отверженного ныне классика, возьмусь прокомментировать "PC Expert", который провел 5 1 сравнительное тестирование самых известных систем машинного перевода...*

Известность —  продукт рекламы. Нужно чтобы оно переводило, а разные там навороты и даже скорость меня, пардон ... как это по-русски …

 

I have a dream, коллеги, по поводу открытого, проходящего на виду у болельщиков, чемпионата систем MT (Mashine Translation). Возьмем к примеру, on-line переводчики — системы, доступные через Internet : AltaVista , ПРОМТ  и  "засунем" в них хэлпы. О кей? Кто против?

Судить о результатах предоставим:
—  группе интеллектуалов
PC Expert, дипломированным переводчикам, сведущим в тематике,
—  а также
«толпе» голосующих пользователей.

 

Блеск дружественных наворотов —  easy in use

 

Подозреваю, все-таки, что чемпионат русскоязычных машинных переводчиков был бы для нас любопытнее. Промт, Сократ, Протон-С (в Москве продается ), ПАРС (созданный в нашей стране, в Киеве, а ныне «окопавшийся за бугром») все это реально пользуемый софт. ПРОМТ, пожалуй, наиболее «блестящяя», то есть рекламируемая и потому распространенная система перевода. А вот Протон-С с лету не освоишь. Однако после интерактивного обучения на текстах пользователя он работает точнее, чем ПРОМТ. Когда-то сотрудники одной питерской фирмы, не пожалевшей долларов на систему МТ, отдавали ей должное: пишешь письмо «импортному» партнеру и получаешь «документ» без единого русского слова.

 

Я такого добра много бачил. Покажите мне умный софт

 

Каким софтом пользуются при переводах многотомной документации международные корпорации? Xerox пишет инструкции по обслуживанию техники на исходном языке, так называемом Controlled Language (английском языке со значительными ограничениями в лексике и грамматике). Таким образом, письмо, написанное на искуственном (четко сформулированном языке) транслируется на другой язык.

 

Caterpillar финансировал систему машинного перевода KANT, использующую технологию CyCorp — базы знаний, связывающих объекты-понятия и действия над ними. Точность за счет этого увеличилась всего лишь на 1%. Итог — закрытие проекта, а разработчики (Carnegy Mellon University) вынуждены "пойти в люди", то есть самостоятельно торговать KANTом на рынке.

 

Документация BMW обрабатывается с помощью софта типа Translation Memory (запоминание переводов). Система отыскивает в базе данных и предлагает переводчику готовые переводы фраз похожих на переводимую. Это позволяет повысить производительность переводчиков и унифицировать фразеологию по всему проекту.

 

Блестящая (в вышеуказанном смысле) система тематических словарей Context используется разработчиками ПО питерского отделения Motorola. Context отлавливает в предложениях цепочки слов, которые содержатся в его базе и выдает их переводы. На мой взгляд, подобная концепция не всегда помогает, а иногда и вредит. Более надежной я считаю систему Poliglossum, составленную на основе традиционных бумажных словарей.

 

Postscriptum

 

Задача машинного перевода все еще не имеет блестящего решения, а ее концепции пребывают пока что в нищете.

 

----------

*

Библия и законы Мэрфи

СЕРГЕЙ ЛЕОНОВ

sleo@computerra.ru

 

Компьютерный журнал "PC Expert" (www.pcexpert.tm.fr) провел сравнительное тестирование самых известных систем машинного перевода

- Power Translator (компания Lernout&Haspie), Reverso/PROjectMT* (компания "ПроМТ"), Systran (компания Systran) и Transcend (компания Transparent Language) -

для двух языковых пар (англо-французской и франко-немецкой).

Оценки выставлялись по ряду параметров:

качество перевода,

состав и качество словарей,

способность систем к развитию и встраиванию в другие системы, а также

скорость работы.

 

В итоге система перевода Reverso/PROjectMT опередила конкурентов по сумме показателей практически на 30 процентов. За высокое качество перевода и, как было сказано в рецензии, "работоспособность, образованность и дипломатическую тонкость" система Reverso/PROjectMT была отмечена наградой "Выбор редакции" журнала "PC Expert". Интересно отметить, что при тестировании использовались тексты из Библии, любовные романы и законы Мэрфи.