Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке

Автор: Пользователь скрыл имя, 20 Апреля 2012 в 19:56, дипломная работа

Краткое описание

Мы живем в мире информационных технологий, которые прочно вошли в нашу жизнь. Мы пользуемся современными средствами связи. Компьютер превратился в неотъемлемый элемент нашей жизни не только на рабочем месте, но и в повседневной жизни. Быстрое развитие новых информационных технологий свидетельствует о всевозрастающей роли компьютерной техники в мировом информационном пространстве.

Оглавление

Введение 5
1 К определению основных понятий лингвостилистики. 9
1.1 Основные понятия 14
1.2 Функциональные стили 17
1.3 Стилистическая характеристика научно-технического стиля 20
1.3.1 Общие особенности 20
1.3.2 Лексические особенности научно-технического стиля 21
1.3.3 Синтаксические особенности научно-технического стиля 25
1.3.4 Морфологические особенности научно-технического стиля 28
1.3.5 Подстили 31
2 К проблеме машинного перевода в современном языкознании 33
2.1 Основные понятия машинного перевода 35
2.1.1 Развитие машинного перевода 35
2.1.2 Степень реализации СМП 37
2.1.3 Принципы оценки СМП 38
2.1.4 Принцип действия СМП 39
2.2 Подходы к машинному переводу 39
2.2.1 СМП основанные на правилах 41
2.2.2 Системы машинного перевода основанные на примерах 49
2.2.3 Статистический машинный перевод 51
2.3 ТМ-системы 55
2.4 Сравнение различных типов СМП 56
3 Структурно-семантические трансформации в англоязычном научно техническом тексте при машинном переводе 62
3.1 Основные особенности 62
3.2 Лексические особенности 66
3.3 Синтаксические особенности 78
3.4 Морфологические особенности 88
Заключение 95
Библиография 99
Приложения 103
Схема 1: основные понятия стилистики 103
Схема 2: тропы и фигуры 104
Схема 3: функциональные стили языка 105
Схема 4: особенности научно-технического стиля 106
Образцы проанализированных текстов 107
Отрывок 1 107
Оригинал 107
Перевод, выполненный статистической СМП 109
Перевод, выполненный трансфертной СМП 111
Перевод, выполненный человеком 113
Отрывок 2 116
Оригинал 116
Перевод, выполненный статистической СМП 118
Перевод, выполненный трансфертной СМП 120
Перевод, выполненный человеком 122
Отрывок 3 125
Оригинал 125
Перевод, выполненный статистической СМП 127
Перевод, выполненный трансфертной СМП 129
Перевод, выполненный человеком 131
Таблицы анализа 133
Список сокращений 142
Условные обозначения 142

Файлы: 1 файл

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ.doc

— 3.23 Мб (Скачать)

В тексте встречается количественная экспрессивность

    В конце первого отрывка:

      ... most frequently associated with Euclid's algorithm,

    Статистическая  СМП:

      ... чаще всего связаны с алгоритмом Евклида ...

    Трансфертная  СМП:

      ... наиболее часто связывался с алгоритмом Евклида ...

    Переводчик:

      ... чаще всего ассоциировалось с алгоритмом Евклида ...

Интересно заметить, что различные СМП перевели фразы по-разному.

Варианты, сделанные переводчиком и машиной, являются верными и те и другие отражают экспрессивность, но различными средствами. Отдельное внимание стоит обратить на тот факт, что варрант статистической СМП совпал с вариантом переводчика. Это говорит о том, что в русском техническом тексте используется именно этот вариант перевода. Трансфертная СМП действовала в данном случае по заложенным в нее правилам. Она выдала, тоже верный вариант, но он не является устойчивым и в процессе беглого прочтения может быть воспринят неверно.

Сходная ситуация наблюдается и в примере  ниже. Вариант трансфертной СМП больше отличается от вариант переводчика, чем вариант статистической. Все  три варианта перевода верны.

    В конце второго отрывка:

      … algorithm below, which is much more precise …

    Статистическая  СМП:

      алгоритм, который является гораздо более точным ….

    Трансфертная  СМП:

         в алгоритме ниже, который намного более точен …

    Переводчик:

      в алгоритме, который выглядит гораздо более строго …

В первом отрывке встречается большое  количество точных дат, которые так  же являются показателем научности. В научном тексте, обычно, вся числовая информация передается цифрами, и даты не являются исключением, потому и для машин и для переводчиков «перевод» подобных слов выполняется крайне просто.

Иначе дело обстоит с географическими  названиями и именами собственными. В рассматриваемом тексте правильное название городов и других объектов не критичны, но они показывают кругозор автора и его осведомленность. При переводе таких слов надо учитывать именование таких объектов принятое в русской литературе.

В седьмом предложении первого отрывка

     The Aral Sea in Central Asia was once known as Lake Khwarizm

Статистическая  СМП:

    Аральское море в  Центральной Азии когда-то называлось озером Хорезм

Трансфертная  СМП:

    Аральское море в  Средней Азии было когда-то известно как Озеро Хваризм, …

Переводчик:

    Аральское море в  Центральной Азии было когда-то называли озеро Хорезм

Здесь можно увидеть сразу два географических объекта регион Средней Азии и озеро Хорезм.

Именование  первого термина имеет различную  географическую и политическую трактовку. Анализируя перевод сделанный человеком, приходится учитывать текущие веяния и, возможно, оказываемое на переводчика давление. В случае СМП дело обстоит не намного проще, ибо ряд фраз мог быть жестко прописан в алгоритме перевода. Аналогичная ситуация касается не только географических объектов, но так же может проявиться при переводе любых названий и именований, особенно если объекты реального мира были названы в честь какого-либо ученого или общественного деятеля.

Еще более интересная ситуация складывается, если в момент написания оригинала  и в текущей момент объекты  назывались по-разному. В данном случае такая ситуация тоже имеет место быть. Мы считаем, что переводить термин Central Asia в этом предложении следует именно как Средняя Азия. Именно так назывался этот регион, когда Д. Кнут писал свой труд. Однако, в текущий момент регион называется Центральной Азии. Это название было закреплено за регионом, во время работы переводчика.  
Этим объясняется его вариант перевода.

В случае перевода статистической СМП, то вероятно, что название было переведено как  выражение общей лексики, без  осознания того, что это имя  собственное. Но точно утверждать нельзя. В трансфертную СМП перевод словосочетания был заложен жестко.

Для уменьшения разночтений переводов  научно-технической литературы, нам  кажется наиболее приемлемым обращаться к оригиналу и уже самостоятельно делать выводы на основе экстралингвистических знаний.

Рассмотрим  второй географический объект, который  встретился в этом предложении. Правильное русское название Lake Khwarizm  озеро  Хорезм. Однако, трансфертная СМП в  данном случае использовала транслитерацию. В данном случае – недопустимо, потому что это дает неверные представления и если указанного слово не оказалось в базе данных СМП, то его лучше оставить без перевода и привести оригинальное название из авторского текста. Такой подход был использован в этом же предложении.

В тексте:

    ... Amu River basin just south of that sea.

Статистическая  СМП:

    ... в бассейне реки Амударьи к югу от этого моря.

Трансфертная  СМП:

    ... в бассейне реки Amu только к югу от того моря.

Переводчик:

    ... в бассейне реки Амударьи южнее этого моря. 

Далее в тексте первого отрывка можно  найти (третье предложение):

    ... did not appear in Webster's New World Dictionary ...

Статистическая  СМП:

    ... не появится в Новом Свете Словарь Вебстера ...

Трансфертная  СМП:

    ... не появлялось в Новом Мировом Словаре Вебстера...

Вариант переводчика:

    ... не было в издании словаря Webster’s New World Dictionary

На  наш взгляд, более верным является второй вариант перевода. Перевод  был явно калькирован, но он не выглядит бессмысленно как в случае статистической СМП. Вариант, который предложил переводчик тоже верен, однако много слов на иностранном языке вызывает неприятное впечатление. Важно отметить, что официального русскоязычного перевода названия словаря до сих пор нет. 

3.3 Синтаксические особенности

Стоит сразу сказать, что СМП рассматриваемых типов не могут кардинальным образом влиять на синтаксические особенности текста. Они оставляют структуру сверхфразовых единств и предложений такой, какая она была в оригинальном тексте. Этот факт был нами проверен на исследуемых отрывках.

В некоторых  случаях статистическая СМП, в текущей  реализации, может менять порядок  слов. Но эти изменения маловероятны, и будут происходить только внутри пятерок слов. Нами подобное поведение  установлено не было, но это не говорит, о том, что оно не может быть обнаружено на других текстах или при другой исходной базе СМП.

Сохранение  оригинальной синтаксической структуры  является плюсом систем перевода. Но такой  подход не всегда возможен. В научных  текстах очень часто встречаются  распространенные сложные предложения. Если разбивать такие предложения, то текст будет легче для восприятия. Переводчик-человек может учесть этот факт и упростить авторский текст.

При этом будет потерян авторский  стиль. Подобную ситуацию можно наблюдать  в пятом и девятнадцатом предложении первого отрывка, во первой части двадцать пятого предложения второго отрывка.

СМП не обладает информацией о мысли, которую хотел донести автор. Она оперирует только лингвистическими знаниями и никакой разбивки предложений  не производит.

Возможна и обратная ситуация, когда мысль автора выражена не одним, а несколькими предложениями. В этом случае, переводчик имеет право соединить две части высказывания, чтобы нагляднее донести мысль автора. СМП переведет авторский текст так, как он есть, без каких либо изменений структуры. Подобная ситуация прослеживается в последнем предложении третьего отрывка.

В англоязычной научной прозе для сложносочиненных предложений часто используют знак препинания «точка с запятой». В отечественной литературе знак используется только для маркированных списков.

При анализе оригинального текста на английском языке (особенно математического), заранее не известно, какую функцию  несет «точка с запятой». Потому в этом случае, СМП не меняет структуры. Но человек, следуя отечественной традиции, может поменять знаки препинания.

Подобную  ситуацию можно наблюдать в третьем  и восьмом  предложениях первого  отрывка, в третьем, шестом, восьмом  предложении и в первой части  двадцать пятого предложения второго  отрывка, в седьмом предложении третьего отрывка.

Рассматриваемый текст имеет четкую структуру. Первый отрывок делится на шесть абзацев  и без учета алгоритма содержит двенадцать предложений. Второй отрывок  делится на семь абзацев и содержит двадцать восемь предложений. Третий отрывок содержит четыре абзаца и содержит тринадцать предложений.

В каждом абзаце выдвигается определенное предположение, которое в нем же и доказывается. Например, в начале второго отрывка

    By contrast, a "continuous simulation" would be simulation of activities that are under continuous changes, such as traffic moving on a highway, spaceships traveling to other planets, etc.

Ниже  до начала следующего абзаца рассказывается о непрерывном моделировании  и его отличиях от дискретного.

 В отрывке можно предложения с прямым порядком слов, которые можно считать определениями.

     ... algorithm is basic to all of computer programming...

    ... that [common divisor] is, the largest positive integer that

         evenly divides both m and n.

    ... n is the answer ...

В научно-техническом  тексте достаточно часто встречаются и обычные «настоящие» определения. В рассмотренных отрывках виде они в явном виде не встретились. Малое количество определений в отрывках еще раз подчеркивает, что реальные научные тексты обладают стилистической неоднородностью. Часто автору проще донести свою мысль косвенно, неприбегая к именованию. Последнее представляет значительную сложность для СМП, так как тут не всегда можно обойтись эквивалентными трансформациями.

Четвертое предложение второго отрывка:

    In a discrete simulation, we proceed by doing whatever is to be done at a certain instant of simulated time …

Переводчик  передал фразу как неявное  определение:

    При этом процесс моделирования заключается в выполнении определенных действий, предусмотренных для данного момента …

Что может быть передано в явном виде как

    Процесс моделирования – суть выполнение определенных действий, предусмотренных для данного момента …

Однако  СМП передали это предложение  с сильным искажением:

Статистическая  СМП:

    В дискретного  моделирования, мы проведем делать то, что должно быть сделано в определенный момент времени моделирования …

Трансфертная  СМП:

    На дискретном моделировании мы продолжаем, делая  независимо от того, что должно быть сделано в определенный момент моделируемого  времени …

Машины перевели максимально близко к тексту автора, однако основная идея высказывания была потеряна. Для научного текста – это серьезная проблема. На данном этапе развития технологий не представляется возможным автоматизировано, в общем случае, выделять дефидент и дефиницию для неявных определений.  

Существует  несколько вариантов решения  этой проблемы:

  • предобработка исходного текста, на предмет разрешения подобных смысловых групп, и их преобразования в явные;
  • чтение машинного перевода текста параллельно с оригиналом;

Информация о работе Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке