Автор: Пользователь скрыл имя, 20 Апреля 2012 в 19:56, дипломная работа
Мы живем в мире информационных технологий, которые прочно вошли в нашу жизнь. Мы пользуемся современными средствами связи. Компьютер превратился в неотъемлемый элемент нашей жизни не только на рабочем месте, но и в повседневной жизни. Быстрое развитие новых информационных технологий свидетельствует о всевозрастающей роли компьютерной техники в мировом информационном пространстве.
Введение 5
1 К определению основных понятий лингвостилистики. 9
1.1 Основные понятия 14
1.2 Функциональные стили 17
1.3 Стилистическая характеристика научно-технического стиля 20
1.3.1 Общие особенности 20
1.3.2 Лексические особенности научно-технического стиля 21
1.3.3 Синтаксические особенности научно-технического стиля 25
1.3.4 Морфологические особенности научно-технического стиля 28
1.3.5 Подстили 31
2 К проблеме машинного перевода в современном языкознании 33
2.1 Основные понятия машинного перевода 35
2.1.1 Развитие машинного перевода 35
2.1.2 Степень реализации СМП 37
2.1.3 Принципы оценки СМП 38
2.1.4 Принцип действия СМП 39
2.2 Подходы к машинному переводу 39
2.2.1 СМП основанные на правилах 41
2.2.2 Системы машинного перевода основанные на примерах 49
2.2.3 Статистический машинный перевод 51
2.3 ТМ-системы 55
2.4 Сравнение различных типов СМП 56
3 Структурно-семантические трансформации в англоязычном научно техническом тексте при машинном переводе 62
3.1 Основные особенности 62
3.2 Лексические особенности 66
3.3 Синтаксические особенности 78
3.4 Морфологические особенности 88
Заключение 95
Библиография 99
Приложения 103
Схема 1: основные понятия стилистики 103
Схема 2: тропы и фигуры 104
Схема 3: функциональные стили языка 105
Схема 4: особенности научно-технического стиля 106
Образцы проанализированных текстов 107
Отрывок 1 107
Оригинал 107
Перевод, выполненный статистической СМП 109
Перевод, выполненный трансфертной СМП 111
Перевод, выполненный человеком 113
Отрывок 2 116
Оригинал 116
Перевод, выполненный статистической СМП 118
Перевод, выполненный трансфертной СМП 120
Перевод, выполненный человеком 122
Отрывок 3 125
Оригинал 125
Перевод, выполненный статистической СМП 127
Перевод, выполненный трансфертной СМП 129
Перевод, выполненный человеком 131
Таблицы анализа 133
Список сокращений 142
Условные обозначения 142
Формат выше иллюстрирует стиль, в котором все алгоритмы в этой книге будут представлены.
Для трансфертной СМП:
Формат выше иллюстрирует стиль, в котором будут представлены все алгоритмы всюду по этой книге..
Перевод выглядит примитивно, но в этом случае именно такой вариант перевода передает смысл более полно.
В первом
отрывке встречаются слова
... a process for finding the greatest common divisor of two numbers that
appears in Euclid’s Elements...
Given two positive integers m and
n, find their greatest common divisor, that is, the largest positive
integer that evenly divides both m and n.
Подобные термины, которые «выглядят как простые слова» очень характерны для английского языка. В русском языке, в данном случае могут быть иные формулировки, не похожие по структуре на английские. Важно заметит, что в данном случае positive integers это именно натуральные числа. Перевод сделанный машиной оказался более точным.
А вот, например, для наибольшего общего делителя трансфертная СМП допустила искажение термина.
чтобы найти самый большой общий делитель двух чисел,
Нельзя
квалифицировать фразу как
Во втором отрывке термины встречаются чаще.
As an example of the use of {{doubly linked lists}}, we will now consider the writing of a discrete simulation program.
Термин
в фигурных скобках в современной
литературе обычно переводится как
двунаправленные связанные
В качестве примера использования дважды связанных списков ….
Однако в этом же предложении есть термин
a discrete simulation program.
Только
человек корректно перевел
программу дискретного моделирования
В то время как СМП перевели фразу соответственно:
отдельной программы моделирования.
дискретной программы моделирования.
В контексте повествования это не является критичным, но термин использован неверно discrete относится именно к simulation. Подобная ситуация встречается несколько раз в этом отрывке. Явление можно объяснить тем, что СМП неверно разрешают препозитивную определительную группы discrete simulation program.
Верную интерпретацию можно изобразить как:
((discrete simulation) program)
В то время как СМП воспринимают это как:
(discrete (simulation program))
Например, в оригинале:
... illustrate typical implementation techniques used with discrete simulation programs.
Статистическая СМП перевела как:
... иллюстрируют типичные методы осуществления использоваться с дискретными программ моделирования.
Трансфертная СМП перевела как:
... иллюстрируют типичные методы реализации, используемые дискретными программами моделирования.
Человек перевел:
... типичные методики, которые используются в программах дискретного моделирования.
Ниже во втором отрывке обе СМП справились с подобной ситуацией, но очень вероятно, что это связано с положением термина в предложении.
Continuous simulation can often be satisfactorily approximated by discrete simulation.
Однако слово approximated было переведено точно только машинами. Человек позволил себе некоторую вольность
Непрерывное моделирование
часто можно вполне удовлетворительно
имитировать с помощью
Всего скорее, в данном случае это не сильно важно, однако при таком употреблении немного исчезает точность изложения. Непрерывное моделирование именно аппроксимируется, приближается.
Интересно так же рассмотреть иную ситуацию из второго отрывка
Оригинал:
On floor 2 in NEUTRAL state, the doors will eventually close and the machine {{will wait silently for another command}}.
Статистическая СМП:
На этаже 2 в нейтральном состоянии, двери, в конечном счете закроются и машина {{будет ждать молча для другой команды}}.
Трансфертная СМП:
На полу 2 в нейтральном состоянии, в конечном счете закроются двери, и машина {{будет ожидать тихо другой команды}}.
Переводчик человек:
Если лифт находится на этаже 2 в состоянии NEUTRAL, двери со временем закроются и лифт будет {{ожидать следующей команды}}.
Вообще
ожидать следующей команды (wait another command)
является термином. Автор в данном случае
решил сгладить сухой термин, добавив
слово silently. Однако, переводчик решил не
передавать шутки автора. Трудно сказать,
верно ли он поступил, но СМП передать
эту шутку удалось, хотя термин был искажен
и повествование получилось не столь строгим.
К сожалению,
обе СМП коверкают термины
причем там где это имеет значение
для правильного понимания
The elevator {{takes a certain amount of time}}
Трансфертная СМП перевела как
Лифт {{берет определенное количество времени}} …
Может
показаться, что это не важно, однако,
в контексте повествования
Очень
интересно рассмотреть
В то время, как СМП перевели ее шаблонно на уровне эквивалентных трансформации домашний пол, домашний этаж.
Третий отрывок с точки зрения терминологии является наиболее сложным. Важно отметить, что он является сложным не только для перевода, но и для восприятия. Такие термины как связывающие автоматы (linking automata), и машины графов (graph machines) были переведены неверно СМП, и без оригинала сложно понять о чем идет речь. Вообще слово linking, на протяжении всего третьего отрывка, СМП перевели как общеупотребительное слово, но ни как термин.
С другой стороны сложные фразы типа
Turing machines having multiple tapes and read/write heads
были переведены СМП как
статистическая СМП:
машин Тьюринга,
имеющих несколько лент и головок
чтения / записи
трансфертная СМП:
машин Тьюринга, имеющих многократные ленты и комбинированные головки
Причем человек перевел
машин Тьюринга с множеством лент и головок чтения/записи
Интересно заметить, что для трансфертной СМП оказалась известна фраза комбинированные головки. Это говорит о применении вариантных трансформаций в трансфертной СМП – перевод происходит не так примитивно, как это могло бы показаться. С другой стороны примененное обобщение может повлиять на качество восприятия.
Однако, ниже фраза multitape Turing machine (многоленточная машина Тьюринга) была переведена достаточно странно и верно термин был переведен только человеком.
Статистическая СМП поступает очень интересно с таким термином. И фразу multitape Turing machine, и one-tape Turing machine она переводит просто как машина Тьюринга. (Понимая принципы работы статистических машин легко объяснить природу этого эффекта.) С точки зрения научно-технической литературы это совсем не верно, но в рамках иных стилей подобный подход мог быть оправдан.
Так же, достаточно сложным термином является выражение pointer machines. Учитывая, то что переводчик указал в скобках ориганальный термин (на английском языке), можно утверждать что русского устойчивого аналога выражения просто не существует. Не удивительно, что обе СМП не справились с этим термином.
Вариант статистической СМП:
… сейчас он называется указатель машин …
Вариант трансфертной СМП:
… теперь названным машинами указателя …
Вариант переводчика:
… сегодня называемых машинами указателей (pointer machines) …
В тексте можно заметить использование устойчивых выражений, характерных для научной прозы.
Finally, historians of mathematics found the true origin of the word algorism:
Of course, Euclid did not present his algorithm in just this manner.
For example, we are now in Section 1.1
Conversely, however, it is unlikely that
Подобные, слова являются обособленными, потому с ними может справится даже самая простейшая система машинного перевода.
Важно,
что общелингвистическое и
The methods to be discussed below …
Были переведены СМП как
Методы, которые будут обсуждаться ниже …
Однако переводчик перевел фразу так же усточивой для русского языка фразой
Рассматриваемые ниже методы…
В большинстве случаем перевод сделанный СМП и человеком таких устойчивых фраз совпадает.
В тексте можно так же заметить логическое подчеркивание. Благодаря своей шаблонности, такие маркеры так же весьма удачно переводятся машиной. В третьем отрывке:
Some of the most interesting problems …
Статистическая СМП:
Некоторые из наиболее интересных задач …
Трансфертная СМП:
Некоторые из самых интересных проблем …
Переводчик:
Самыми интересными проблемами …
Переводчик
опять позволил себе вольность, однако
это не является критическим в данном
случае. Но, это несколько искажает смысл
фразы. Переводчик ограничивает круг жестче
интересных проблем, в то время как автор
этого не делает. Эту же фразу можно классифицировать,
как и выражение количественной экспрессивности.
Можно утверждать, что переводчик умышленно
ее усиливает.
Логическое подчеркивание видно на примере предложения
So far we have described the elevator from a user's point of view; the situation is more interesting as viewed by the elevator.
В данном случае противопоставляются две точки зрения, и на вторую автор хочет обратить особое внимание, потому что далее речь пойдет именно о ней. Статистическая СМП перевела это предложение как:
До сих пор мы описали лифт с точки зрения пользователя, ситуация более интересная, если смотреть на лифте.
Вариант трансфертной системы и вариант переводчика не сильно стилистически отличаются, хотя обе СМП сильно исказили текст, следующий за подчеркиванием
До сих пор
мы описали лифт с точки зрения
пользователя; ситуация более интересна
как просматривающийся лифтом.
До сих пор
работа лифта описывалась с точки
зрения пользователя, но ситуация станет
более интересной, если рассмотреть
ее с точки зрения лифта.