Новости науки "Русского переплета"
TopList Яндекс цитирования
Русский переплет
Портал | Содержание | О нас | Авторам | Новости | Первая десятка | Дискуссионный клуб | Чат Научный форум
Первая десятка "Русского переплета"
Темы дня:

Мир собирается объявить бесполётную зону в нашей Vselennoy! | Президенту Путину о создании Института Истории Русского Народа. |Нас посетило 40 млн. человек | Чем занимались русские 4000 лет назад? | Кому давать гранты или сколько в России молодых ученых?


Rambler's Top100
Портал | Содержание | О нас | Пишите | Новости | Книжная лавка | Голосование | Топ-лист | Регистрация | Дискуссия
Лучшие молодые
ученые России

Подписаться на новости

АВТОРСКИЕ НАУЧНЫЕ ОБОЗРЕНИЯ

"Физические явления на небесах" | "Terra & Comp" (Геология и компьютеры) | "Неизбежность странного микромира"| "Научно-популярное ревю"| "Биология и жизнь" | Теорфизика для малышей
Семинары - Конференции - Симпозиумы - Конкурсы

НАУКА В "РУССКОМ ПЕРЕПЛЕТЕ"
Проект поддержан Международной Соросовской Программой образования в области точных наук.
Новости из мира науки и техники
The Best of Russian Science and Technology
Страницу курирует проф. В.М.Липунов
"Русский переплет" зарегистрирован как СМИ. Свидетельство о регистрации в Министерстве печати РФ: Эл. #77-4362 от
5 февраля 2001 года. При полном или частичном использовании
материалов ссылка на www.pereplet.ru обязательна.

Тип запроса: "И" "Или"

17.02.2016
12:55

Искусственный интеллект в переводе

    Когда мы говорим об искусственном интеллекте в области переводов, нам представляется «умная машина», которая самостоятельно переводит с одного языка на другой огромные массивы текста, не уставая и не ошибаясь. Именно эту цель ставили перед собой разработчики в середине ХХ века, но уже в XXI веке фокус сместился, и теперь они трудятся не над машиной, способной заменить человека, а над машиной, способной помочь человеку.

    Машина и человек: конкуренция или сотрудничество

    Еще в 50-е годы прошлого века разработчики машинного перевода ставили перед собой амбициозную цель создать переводческую систему, которая полностью заменила бы человека. Они верили, что благодаря компьютерной программе им удастся превратить перевод в быстрый и идеально отстроенный процесс. Ведь человеку свойственно ошибаться, а машине — нет.

    Возможно, именно с тех самых времен переводчики интуитивно опасаются всего, что связано с машинным переводом: большинство из них никогда не признается, что использует его в профессиональной деятельности.

    Несмотря на то, что движки машинного перевода сделали огромный шаг вперед по сравнению со своими прототипами, добиться от них идеального качества так и не удалось. Но они стали служить иным целям, о которых мы расскажем ниже.

    После неудачных попыток создать идеального «электронного переводчика» разработчики стали работать над новой задачей: не заменить живого человека, а помочь ему. Так появились первые программы автоматизированного перевода — CAT-инструменты.

    Главное отличие автоматизированного перевода от машинного — в том, что в его основе лежит технология сохранения и переиспользования выполненных ранее переводов — Translation Memory (TM). Она запоминает часть текста на одном языке и его перевод. Благодаря такому эффективному использованию память переводов повышает скорость работы переводчика и на 40% сокращает затраты на перевод. Кроме баз памяти ТМ также использует цифровые аналоги стандартных ресурсов переводчика — словари и глоссарии, к примеру. Гораздо удобнее искать нужный термин непосредственно в своем рабочем инструменте, чем доставать книгу с полки (или открывать новую вкладку в браузере).

    Главной целью использования подобных программ является ускорение процесса перевода и повышение его качества. Под качеством в данном случае мы имеем в виду в том числе сохранение единообразия текста. Никому не хочется, чтобы в переводе один и тот же документ называли то «договор», то «контакт».

    Переводчики и облака

    Переводческий процесс состоит из множества разных этапов, и непосредственно сам перевод — это лишь небольшая его часть, а переводчик — только один из участников. Но в переводе задействованы и другие специалисты: заказчики, редакторы, менеджеры, и их работа тоже отнимает время.

    До недавнего времени этапы переводческого процесса были изолированы друг от друга, и зачастую это приводило к не самым благоприятным результатам. И участники переводческой отрасли пришли к выводу, что в автоматизации нуждается не только перевод, но и все сопряженные с ним процессы.

    До 2012 г. все CAT-инструменты были десктопными. Помимо явных неудобств для переводчика — нужно скачивать и устанавливать на компьютер тяжеловесный софт — это доставляло проблемы и менеджерам, работающим с переводчиками. Они отправляли переводчикам файлы и до самого конца не были уверены в том, что получат на выходе. С появлением облачных технологий у менеджеров переводческих агентств появилась возможность наблюдать за работой переводчиков, редакторов и корректоров в онлайн-режиме и в случае необходимости корректировать сроки и качество их работы. Переводчики же выигрывали вдвойне: ночной кошмар любого переводчика — случайная неполадка в компьютере и полное исчезновение уже проделанной работы — ушел в прошлое. Облака гарантировали сохранение всего переведенного текста.

    Новому контенту — новые «фичи»

    Разумеется, у каждого развития есть предпосылки. Главной причиной стирания границ между этапами переводческого процесса стало изменение качества и количества контента, которому требуется перевод на другой язык.

    Во-первых, одновременно с глобализацией бизнеса объемы контента увеличиваются ежегодно. По некоторым прогнозам, чтобы покрыть потребности 90% интернет-пользователей в 2020 г. сайты придется локализовать на 48 языков. Объем контента, которому необходим перевод, с каждым годом удваивается, а переведено и локализовано, согласно исследованиям, всего 0,00000067% всей цифровой информации. Чем больше текстов на перевод, тем лучше должны быть автоматизированы рутинные процессы: отправка и получение файлов, назначение исполнителей и многое другое. Компании, работающие в собственных корпоративных системах, ищут кастомизированные переводческие решения, которые смогут легко встроиться в их бизнес-процессы, и такие решения уже существуют — они гибко интегрируются через API. Таким образом, материалы попадают на платформу автоматически, переводятся, затем готовый перевод возвращается в систему.

    Во-вторых, по мере того, как объемы контента увеличиваются, меняются и требования к ним. Конечно, когда заказчику нужно перевести всего две маркетинговые листовки, он будет заинтересован в том, чтобы качество было на высоте.

    Но бывают случаи, когда вам нужно перевести не две, а две тысячи листовок. Вы понятия не имеете, что именно написано в них, и нужно для начала просто уловить общий смысл, чтобы принять решение, каким из файлов требуется перевод высшего качества, а каким — нет. И мы вновь возвращаемся к теме машинного перевода, о котором говорили в самом начале, и услуге постредактирования (post-editing): после того, как система переведет текст, его посмотрит профессиональный редактор, который внесет правки и сделает текст читаемым и понятным.

    В-третьих, изменилась «динамика» контента. Для примера можно рассмотреть вариант перевода торговой онлайн-площадки вроде AliExpress или eBay. Ежедневно на нее «заливается» сотни мегабайтов нового контента: описание товаров, информация о поставщиках и многое другое (не говоря уже о том, что отзывы покупателей тоже нужно переводить на язык, понятный поставщику). Вручную искать и выгружать новые тексты крайне трудоемко, соответственно, систему будут настраивать таким образом, чтобы она самостоятельно следила за обновлениями и отправляла их на перевод.

    Командная работа

    Одна из самых важных функций, которые теперь предлагают новые переводческие решения — это возможность работать в команде. CAT трансформируется из переводческого инструмента в целую переводческую экосистему.

    Если необходимо перевести большой объем в короткие сроки, единственная возможность сделать это быстро и качественно — разделить документ между несколькими исполнителями. Разделение файла вручную отнимает время как менеджера, который распределяет заказ, так и самих переводчиков. Гораздо удобнее с самого начала назначить специалистов в один проект, создав своего рода переводческую среду, где переводчики, редакторы, корректоры и даже заказчики смогут общаться между собой и советоваться.

    Говоря о командной работе, невозможно не упомянуть еще один важный (может быть, самый важный) тренд индустрии — тенденцию к отказу от посреднических услуг бюро переводов и упрощению цепочки. Родилась новая модель маркетплейса, которая позволяет бизнесу взаимодействовать с подрядчиками напрямую. «Умная» система учитывает пожелания клиента и предлагает ему варианты переводчиков, которые отвечают всем критериям заказчика: языковой паре, желательному опыту и цене. При идеальном сценарии вся коммуникация между клиентом и исполнителями происходит через маркетплейс: начиная от подбора специалистов и заканчивая финансовыми расчетами.

    Безусловно, для успешной реализации этой модели необходима огромная база данных языковых специалистов со всего мира.

    По информации http://www.pcweek.ru/idea/article/detail.php?ID=182583

    Обозрение "Terra & Comp".

Помощь корреспонденту
Кнопка куратора
Добавить новость
Добавить новости
НАУКА В "РУССКОМ ПЕРЕПЛЕТЕ"

Если Вы хотите стать нашим корреспондентом напишите lipunov@sai.msu.ru

 

© 1999, 2000 "Русский переплет"
Дизайн - Алексей Комаров

Rambler's Top100


Rambler's Top100