Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке

Автор: Пользователь скрыл имя, 20 Апреля 2012 в 19:56, дипломная работа

Краткое описание

Мы живем в мире информационных технологий, которые прочно вошли в нашу жизнь. Мы пользуемся современными средствами связи. Компьютер превратился в неотъемлемый элемент нашей жизни не только на рабочем месте, но и в повседневной жизни. Быстрое развитие новых информационных технологий свидетельствует о всевозрастающей роли компьютерной техники в мировом информационном пространстве.

Оглавление

Введение 5
1 К определению основных понятий лингвостилистики. 9
1.1 Основные понятия 14
1.2 Функциональные стили 17
1.3 Стилистическая характеристика научно-технического стиля 20
1.3.1 Общие особенности 20
1.3.2 Лексические особенности научно-технического стиля 21
1.3.3 Синтаксические особенности научно-технического стиля 25
1.3.4 Морфологические особенности научно-технического стиля 28
1.3.5 Подстили 31
2 К проблеме машинного перевода в современном языкознании 33
2.1 Основные понятия машинного перевода 35
2.1.1 Развитие машинного перевода 35
2.1.2 Степень реализации СМП 37
2.1.3 Принципы оценки СМП 38
2.1.4 Принцип действия СМП 39
2.2 Подходы к машинному переводу 39
2.2.1 СМП основанные на правилах 41
2.2.2 Системы машинного перевода основанные на примерах 49
2.2.3 Статистический машинный перевод 51
2.3 ТМ-системы 55
2.4 Сравнение различных типов СМП 56
3 Структурно-семантические трансформации в англоязычном научно техническом тексте при машинном переводе 62
3.1 Основные особенности 62
3.2 Лексические особенности 66
3.3 Синтаксические особенности 78
3.4 Морфологические особенности 88
Заключение 95
Библиография 99
Приложения 103
Схема 1: основные понятия стилистики 103
Схема 2: тропы и фигуры 104
Схема 3: функциональные стили языка 105
Схема 4: особенности научно-технического стиля 106
Образцы проанализированных текстов 107
Отрывок 1 107
Оригинал 107
Перевод, выполненный статистической СМП 109
Перевод, выполненный трансфертной СМП 111
Перевод, выполненный человеком 113
Отрывок 2 116
Оригинал 116
Перевод, выполненный статистической СМП 118
Перевод, выполненный трансфертной СМП 120
Перевод, выполненный человеком 122
Отрывок 3 125
Оригинал 125
Перевод, выполненный статистической СМП 127
Перевод, выполненный трансфертной СМП 129
Перевод, выполненный человеком 131
Таблицы анализа 133
Список сокращений 142
Условные обозначения 142

Файлы: 1 файл

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ.doc

— 3.23 Мб (Скачать)

         The notation is the same as previously used

Преобладание  именных, а не глагольных конструкций даёт возможность большего обобщения, устраняя необходимость указывать время действия.

    Не научно

         when we arrived

    Научно

         at the time of our arrival

Термины, обозначающие вещество или отвлеченное  понятие, употребляются в обеих  числовых формах без сдвига лексического значения и могут определяться числительными;

    Например:

         Normally two horizontal permeabilities are measured. 

В научно-техническом  тексте встречается сравнительно частое употребление настоящего продолженного  и будущего вместо простого настоящего:

  • today we are coming to realize that ...;
  • we are beginning to see that ...;
  • finally, as long as the automaton is running.

Таким образом, всю совокупность морфологических  особенностей можно изобразить в  виде схемы: 
 

1.3.5 Подстили

Обычно говорят от трех подстилях научного стиля: собственно-научный; научно-учебный; научно-популярный.

Жанры собственно-научного подстиля выделяются:

  • монография;
  • диссертация;
  • доклад и др.

Подстиль  отличается строгой, академической  манерой изложения. Тексты этого подстиля пишут «специалисты для специалистов». Этому подстилю противопоставлен научно-популярный подстиль. Он реализуют функцию популяризации научных знаний. Тексты этого подстиля пишут «специалисты для обывателей». Информация преподносится в доступной и занимательной форме. Отличительная черта стиля — это соединение противоположных характеристик текста:

  • логичности и эмоциональности;
  • объективности и субъективности;
  • абстрактности и конкретности.

В отличие  от научной прозы в научно-популярной литературе значительно меньше специальных терминов и других научных средств.

Научно-учебный  подстиль соединяет в себе черты  собственно-научного подстиля и научно-популярного изложения.

Основные  черты:

  • терминологичность;
  • системность в описании научных сведений;
  • логичность;
  • насыщенность иллюстративным материалом;
  • доказательность;
  • доступность.

Задача  этого стиля — быстро и понятно  донести информацию в всей своей

полноте.

Жанры научно-учебного подстиля:

  • учебное пособие;
  • лекция;
  • семинарский доклад;
  • ответ на экзамене.
 

2 К проблеме машинного перевода в современном языкознании

В настоящее  время имеется достаточно широкий  выбор пакетов программ, облегчающих  труд переводчика, которые условно  можно подразделить на две основные группы:

  • электронные словари (electronic dictionary)
  • системы машинного перевода (machine translation system).

Системы машинного перевода (СМП) текстов  с одних естественных языков на другие моделируют работу человека-переводчика.

Их  полезность зависит от того, в какой  степени в них учитываются  объективные законы языка и мышления. Законы эти пока еще изучены плохо. Поэтому, решая задачу машинного перевода, необходимо учитывать опыт межнационального общения и опыт переводческой деятельности, накопленный человечеством. В процессе перевода в качестве основных единиц смысла выступают не отдельные слова, а фразеологические словосочетания, выражающие понятия. Именно понятия являются элементарными мыслительными образами. Только используя их можно строить более сложные образы, соответствующие переводимому тексту. Обычно сравнивая работу машины и человека приводят следующую характеристику. 

На  наш взгляд, она не очень верна, и отчасти предвзята. Для проведения такого сравнения нужно знать  тип СМП и принцип ее работы. Причем, когда говорят о переводе «с помощью вычислительной техники», то часто путают понятия. Вообще, в современной лингвистике можно выделить ряд направлений использования компьютера. 

В этой работе мы будем подробно рассматривать  системы машинного перевода. Ниже расскажем кратко о других направлениях. 

2.1 Основные понятия машинного перевода

На  данный момент выделяют три типа систем машинного перевода. 

Полностью автоматические системы машинного  перевода являются скорее несбыточной  мечтой, чем реальной идей. В этой работе мы их рассматривать не будем. Все системы машинного перевода (MT-системы) работают при участии человека в той или иной мере. TM-системы иногда называют еще «памятью переводчика». Они  являются скорее просто удобным инструментом, нежели элементом автоматизации. 

2.1.1 Развитие машинного перевода

Впервые мысль о возможности машинного  перевода высказал Чарльз Бэббидж (1791-1871), разработавший в 1836-1848 гг. проект цифровой аналитической машины - механического  прототипа электронных цифровых вычислительных машин, появившихся  через 100 лет.

Идея  Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей. Ч. Бэббидж привел эту идею в качестве обоснования для запроса у английского правительства средств, необходимых для физического воплощения аналитической машины, которую ему так и не удалось построить.  

Задача  аксиоматизации лингвистики была выдвинута  одним из виднейших лингвистов московской школы П. С. Кузнецовым как задача формализации грамматики, восходящая к идеям выдающегося русского языковеда Ф. Ф. Фортунатова (1848-1914) Первые эксперименты по машинному переводу, подтвердившие принципиальную возможность его реализации, были проведены в 1954 г в Джорджтаунском университете (г. Вашингтон, США). Вскоре после этого в промышленно развитых странах мира были начаты исследования и разработки, направленные на создание систем машинного перевода (систем МП). И хотя с тех пор прошло полстолетия, проблема машинного перевода все еще не решена на должном уровне. Она оказалась значительно сложнее, чем это представляли себе пионеры и энтузиасты МП конца пятидесятых  начала шестидесятых годов прошлого века. Поэтому, оценивая сегодняшнюю реальность, уместно говорить и о разочарованиях, и о надеждах в этой области.

В 70-х  годах разработку основ технологии машинного перевода продолжила группа специалистов в ВИНИТИ под руководством профессора Г. Г. Белоногова. В результате в 1993 г. была создана промышленная версия системы RETRANS фразеологического машинного перевода с русского языка на английский и обратно, которая применялась в министерствах обороны, путей сообщения, науки и технологий, а также во ВНТИЦ. Практическое применение принципов смыслового анализа текстов потребовалось при создании систем машинного перевода с иероглифических языков (китайского, японского и др.). Вопросы создания таких систем были разработаны в диссертации В. М. Зелко в 80-х годах. Первые коммерческие продукты машинного перевода, нашедшие практическое использование, появились в середине 80-х годов.  

Они были реализованы на персональных компьютерах  и являлись системами прямого  перевода, возможности которых базировались на огромных (по сравнению с первыми системами) словарях, а не на умении анализировать и синтезировать тексты.

2.1.2 Степень реализации СМП

По  степени разработанности отличают следующие классы СМП: 
 

2.1.3 Принципы оценки СМП

Сейчас  достаточно очевидно, что невозможно заменить человека-переводчика машиной. Однако, можно сильно облегчить труд переводчика и повысить его производительность. Для того, чтобы судить на сколько труд переводчика стал эффективнее и проще использует следующие методы оценки СМП. 
 

Методы  отчасти являются относительными и  формального критерия в принципе быть не может. На наш взгляд, наиболее адекватными являются субъективные и статистические методы. Но они применимы только для конкретной команды переводчиков и редакторов. И для каждого человека будут давать сильно разнящиеся показатели. Инженерные и программные методы позволят оценить СМП только на уровне конечного продукта.

На  уровне разработки пользы от них не много.  

2.1.4 Принцип действия СМП

Любая СМП в своей работе (на этапе  эксплуатации) использует формальные шаги представленные на схеме. 

2.2 Подходы к машинному переводу

Системы машинного перевода могут использовать метод перевода основанный на лингвистических правилах. Наиболее подходящие слова из исходного языка просто заменяются словами переводного языка.

Часто утверждается, что для успешного  решения проблемы машинного перевода, необходимо решить проблему понимания текста на естественном языке.

Как правило, метод перевода основанный на правилах использует символическое  представление (посредника), на основе которого создается текст на переводном языке. А если учитывать природу  посредника то можно говорить об интерлингвистическом машинном переводе или трансфертном машинном переводе. Эти методы требуют очень больших словарей с морфологической, синтаксической и семантической информацией и большого набора правил.

Если  у системы машинного перевода будет достаточное количество данных, то можно получить перевод хорошего качества. Основная трудность заключается в формировании этих данных. Например, большие корпуса текста необходимые для статистических методов перевода, для перевода, основанного на грамматике, оказываются недостаточными. Более того, для последних, требуется дополнительное задание грамматики.

Для перевода родственных языков (русский, украинский) может оказаться достаточной  простая замена слов.

Современные системы машинного перевода делят на три большие группы:

  • основанные на правилах;
  • основанные на примерах;
  • статистические.

Далее мы рассмотрим эту классификацию  подробнее. 
 

2.2.1 СМП основанные на правилах

Системы машинного перевода основанные на правилах – общий термин, который обозначает системы машинного перевода на основе лингвистической информации об исходном и переводном языках.

Они состоят из двуязычныхсловарей и  грамматик, охватывающих основные семантические, морфологические, синтаксические закономерности каждого языка. Такой подход к машинному переводу еще называют классическим.

На  основе этих данных исходный текст  последовательно, по предложениям, преобразуется в текст перевода. Часто, такие системы противопоставляют системам машинного перевода, которые основаны на примерах.

Принцип работы таких систем – связь структуры входного и выходного предложения. Перевод при этом получается не особенно хорошего качества. Но на простых примерах работает.

Перевод с английского на немецкий будет  выглядеть как:

         A girl eats an apple.  Ein Madchen isst einen Apfel.

Эти системы делятся на три группы:

  • системы пословного перевода;
  • трансфертные системы;
  • интерлингвистические;
 

Пословный перевод

Такие системы используются сейчас крайне редко из-за низкого качества перевода. Слова исходного текста преобразуются (как есть) в слова переводного текста. Часто такое преобразование происходит без лемматизации и морфологического анализа. Это самый простой метод машинного перевода. Он используется для перевода длинных списков слов (например, каталогов). Так же он может быть использован для составления подстрочечника для TM-систем.

Трансфертные  системы

Как трансфертные системы, так и интерлингвистические, имеют одну и ту же общую идею. Для перевода необходимо иметь посредника, который в себе несет смысл переводимого выражения. В интерлингвистических системах посредник не зависит от пары языков, в то время как в трансфертных – зависит.

Информация о работе Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке