Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке

Автор: Пользователь скрыл имя, 20 Апреля 2012 в 19:56, дипломная работа

Краткое описание

Мы живем в мире информационных технологий, которые прочно вошли в нашу жизнь. Мы пользуемся современными средствами связи. Компьютер превратился в неотъемлемый элемент нашей жизни не только на рабочем месте, но и в повседневной жизни. Быстрое развитие новых информационных технологий свидетельствует о всевозрастающей роли компьютерной техники в мировом информационном пространстве.

Оглавление

Введение 5
1 К определению основных понятий лингвостилистики. 9
1.1 Основные понятия 14
1.2 Функциональные стили 17
1.3 Стилистическая характеристика научно-технического стиля 20
1.3.1 Общие особенности 20
1.3.2 Лексические особенности научно-технического стиля 21
1.3.3 Синтаксические особенности научно-технического стиля 25
1.3.4 Морфологические особенности научно-технического стиля 28
1.3.5 Подстили 31
2 К проблеме машинного перевода в современном языкознании 33
2.1 Основные понятия машинного перевода 35
2.1.1 Развитие машинного перевода 35
2.1.2 Степень реализации СМП 37
2.1.3 Принципы оценки СМП 38
2.1.4 Принцип действия СМП 39
2.2 Подходы к машинному переводу 39
2.2.1 СМП основанные на правилах 41
2.2.2 Системы машинного перевода основанные на примерах 49
2.2.3 Статистический машинный перевод 51
2.3 ТМ-системы 55
2.4 Сравнение различных типов СМП 56
3 Структурно-семантические трансформации в англоязычном научно техническом тексте при машинном переводе 62
3.1 Основные особенности 62
3.2 Лексические особенности 66
3.3 Синтаксические особенности 78
3.4 Морфологические особенности 88
Заключение 95
Библиография 99
Приложения 103
Схема 1: основные понятия стилистики 103
Схема 2: тропы и фигуры 104
Схема 3: функциональные стили языка 105
Схема 4: особенности научно-технического стиля 106
Образцы проанализированных текстов 107
Отрывок 1 107
Оригинал 107
Перевод, выполненный статистической СМП 109
Перевод, выполненный трансфертной СМП 111
Перевод, выполненный человеком 113
Отрывок 2 116
Оригинал 116
Перевод, выполненный статистической СМП 118
Перевод, выполненный трансфертной СМП 120
Перевод, выполненный человеком 122
Отрывок 3 125
Оригинал 125
Перевод, выполненный статистической СМП 127
Перевод, выполненный трансфертной СМП 129
Перевод, выполненный человеком 131
Таблицы анализа 133
Список сокращений 142
Условные обозначения 142

Файлы: 1 файл

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ РФ.doc

— 3.23 Мб (Скачать)

Статистика (вместе с математическими символами):

Параметр  Значение
строки  67
слова 654
символы 5017

 
 

Отрывок 3

Оригинал

Отрывок из «Искусства программирования» (Knuth, 1997: 464). 

Linking automata can easily simulate graph machines, taking at most a bounded number of steps per graph step. Conversely, however, it is unlikely that graph machines can simulate arbitrary linking automata without unboundedly increasing the running time, unless the definition is changed from undirected to directed graphs, in view of the restriction to vertices of bounded degree. The linking model is, of course, quite close to the operations available to programmers on real machines, while the graph model is not.

Some of the most interesting problems to solve for such devices would be to determine how fast they can solve certain problems, or how many nodes they need to solve certain problems (for example, to translate certain formal languages). At the time this chapter was first written, several interesting results of this kind had been obtained (notably by J. Hartmanis and R. E. Stearns) but only for special classes of Turing machines having multiple tapes and read/write heads. The Turing machine model is comparatively unrealistic, so these results tended to have little to do with practical problems.

We must admit that, as the number n of nodes created by a linking automaton approaches infinity, we don't know how to build such a device physically, since we want the machine operations to take the same amount of time regardless of the size of n; if linking is represented by using addresses as in a computer memory, it is necessary to put a bound on the number of nodes, since the link fields have a fixed size. A multitape Turing machine is therefore a more realistic model when n approaches infinity. Yet it seems reasonable to believe that a linking automaton as described above leads to a more appropriate theory of the complexity of algorithms than Turing machines do, even when asymptotic formulas for large n are considered, because the theory is more likely to be relevant for practical values of n. Furthermore when n gets bigger than 1030 or so, not even a one-tape Turing machine is realistic: It could never be built.  

Relevance is more important than realism. Many years have passed since the author wrote most of the comments above, and everybody can be glad that substantial progress has indeed been made on the theory of linking automata (now called pointer machines). But of course much still remains to be done. 

Статистика:

Параметр  Значение
строки  32
слова 393
символы 2383

 
 

Перевод, выполненный статистической СМП

Машинный  перевод отрывка (на основании веб-сервиса Google Переводчик). 

Образцы автоматы могут легко имитировать  графа машин, принимая более ограниченным числом шагов в графе шаг. С  другой стороны, однако, маловероятно, что граф машины могут моделировать произвольные Образцы автоматов  без неограниченно возрастающая время работы, если определение изменяется от неориентированного на ориентированные графы, в силу ограничения на вершины ограниченной степени. Образцы модель, конечно, совсем близко от операций, доступных для программистов на реальных машинах, а граф модель не является.

Некоторые из наиболее интересных задач для  решения таких устройств будет  определить, как быстро они могут  решить некоторые проблемы, или, как  многие узлы им необходимо для решения  определенных задач (например, перевод  некоторых формальных языков). В то время эта глава впервые была написана, несколько интересных результатов такого рода были получены (в частности, Дж. Хартманис и RE Stearns), но только для специальных классов машин Тьюринга, имеющих несколько лент и головок чтения / записи. Модель машины Тьюринга сравнительно нереально, так что эти результаты как правило, имеют мало общего с практическими проблемами.

Мы  должны признать, что, как число n узлов, созданных по Образцы бесконечности  автомата подходы, мы не знаем, как построить  такие устройства физически, так как мы хотим машинных операций принять столько же времени, независимо от размера n, если Образцы представлены с помощью адресов, как в памяти компьютера, необходимо поставить оценку числа узлов, так как ссылка поля имеют фиксированный размер. Тьюринга машина Поэтому более реалистичной модели, когда n стремится к бесконечности. Однако, как представляется разумным полагать, что связь автомата, как описано выше, приводит к более подходящей теории сложности алгоритмов, чем машины Тьюринга делать, даже если асимптотические формулы при больших n считаются, потому что теория, скорее всего, иметь отношение к практической значениях n. Кроме того, когда n становится больше, чем 1030 или около того, даже не одна машина Тьюринга является реалистичной: она никогда не может быть построена. 

Соответствие  является более важным, чем реализм. Много лет прошло с тех пор  автор написал большую часть  комментарии выше, и все может  быть рад, что существенный прогресс действительно были сделаны на теории Образцы автоматов (сейчас он называется указатель машин). Но, конечно, многое еще предстоит сделать. 

Перевод, выполненный трансфертной СМП

Машинный  перевод отрывка (на основании СМП  Промпт): 

Соединение  автоматов может легко моделировать машины графика, беря самое большее ограниченное число шагов на шаг графика. Наоборот, однако, маловероятно, что машины графика могут моделировать произвольные автоматы соединения, неограниченно не увеличивая время выполнения, если определение не изменено от неориентированного до направленных графиков, ввиду ограничения на вершины ограниченной степени. Соединяющаяся модель, конечно, вполне близко к операциям, доступным программистам на реальных машинах, в то время как модель графика нет.

Некоторые из самых интересных проблем решить для таких устройств состояли бы в том, чтобы определить, как быстро они могут решить определенные проблемы, или сколько узлов они должны решить определенные проблемы (например, чтобы преобразовать определенные формальные языки). В то время, когда эта глава была сначала записана, несколько интересных результатов этого вида были получены (особенно Дж. Хартмэнисом и Р. Э. Стернзом), но только для специальных классов Машин Тьюринга, имеющих многократные ленты и комбинированные головки. Модель Машины Тьюринга сравнительно нереалистична, таким образом, эти результаты имели тенденцию иметь мало общего с практическими проблемами.

Мы  должны признать, что, поскольку номер n узлов, создаваемых соединяющимся  автоматом, приближается к бесконечности, мы не знаем, как создать такое устройство физически, так как мы хотим, чтобы машинные операции заняли то же самое количество времени независимо от размера n; если соединение представлено при использовании адресов как в памяти компьютера, необходимо поместить привязанный число узлов, так как у полей ссылки есть фиксированный размер. Машина Тьюринга мультиленты поэтому более реалистическая модель, когда n приближается к бесконечности. Все же кажется разумным полагать, что соединяющийся автомат как описано выше приводит к более соответствующей теории сложности алгоритмов, чем Машины Тьюринга, даже когда асимптотические формулы для большого n рассматривают, потому что теория, более вероятно, будет важна для практических значений n. Кроме того, когда n становится больше чем приблизительно 1030, не, даже Машина Тьюринга с одной лентой реалистична: Это никогда не могло создаваться.  

Уместность  более важна чем реализм. Много  лет передали, так как автор  записал большинство комментариев выше, и все могут радоваться, что значительный прогресс был действительно сделан на теории соединения автоматов (теперь названным машинами указателя). Но конечно много все еще остается быть сделанным. 

Перевод, выполненный человеком

Перевод сделанный профессиональным переводчиком (Кнут Д, 2002:511): 

Связывающие автоматы могут легко моделировать машины графов, используя ограниченное сверху количество шагов на один шаг работы графа. Напротив, маловероятно, чтобы машины графов могли моделировать произвольные связывающие автоматы без неограниченного увеличения времени работы, если не перейти от неориентированных графов к ориентированным, чтобы работать с вершинами с ограниченной степенью. И, конечно, связывающая модель гораздо ближе к операциям, доступным программисту на реальной машине, в отличие от модели с использованием графа.

Самыми  интересными проблемами, которые  предстоит решить для такого рода устройств, являются определение скорости решения поставленных ими задач, т. е. подсчет количества узлов, требуемых  для решения той или иной задачи (например, для трансляции какого-либо формального языка). В то время, когда автор приступил к работе над настоящей главой, были получены интересные результаты такого рода (отметим работы Ю. Хартманиса (J. Hartmanis) и Р. Э. Стирнса (R. Е. Stearns)), но только для специальных классов машин Тьюринга с множеством лент и головок чтения/записи. Модель машины Тьюринга сравнительно нереальна, а потому полученные результаты имеют мало общего с решением практических задач.

Следует признать, что при стремлении количества созданных связывающим автоматом узлов n к бесконечности неизвестно, как построить такое устройство физически, поскольку желательно, чтобы операции машины выполнялись за одно и то же время независимо от размера n. Если связывание представлено с использованием адресов в машинной памяти, необходимо определить границу для количества узлов, поскольку поля связей имеют фиксированный размер. 

Многоленточная  машина Тьюринга поэтому представляет собой более реалистичную модель при стремлении n к бесконечности. Представляется также обоснованной уверенность в том, что описанные выше связывающие автоматы приведут к созданию более приемлемой теории сложности алгоритмов, чем машина Тьюринга, даже при рассмотрении асимптотических формул для больших n, так как эта теория больше подходит для практических значений n. Кроме того, когда n становится больше, чем 1030 или около того, даже одноленточная машина Тьюринга не является реалистичной: она никогда не будет построена. Принципы важнее реалий. Со времени первого написания автором большинства приведенных выше комментариев утекло много воды, и можно порадоваться, что в теории связывающих автоматов (сегодня называемых машинами указателей (pointer machines)) достигнут определенный прогресс, хотя, конечно же, предстоит еще немало сделать в этой области. 

Статистика:

Параметр  Значение
строки  37
слова 338
символы 4489

 
 

Таблицы анализа

Ниже  приведены таблицы анализа всех трех отрывков для каждой СМП. Строки таблицы имеют нумерацию в  виде (n.m), где n – номер отрывка,  
m – номер предложения. 
 
 
 
 
 
 
 
 
 
 

Список  сокращений

ФС  – функциональный стиль.

СМП – системы машинного перевода. 

Условные  обозначения

Условные обозначения, используемые в таблицах аналитической  части.

  • НА – начало абзаца;
  • /* комментарий */  комментарии к отдельным участкам;
  • ***  линейки таблицы, которые хотелось бы обратить особое внимание;
  • {{Термин}} – обозначаются термины;
  • {{Термин}} – обозначаются термины, переведенные с недочетами;
  • Участки, стилистически характерные для научного стиля;
  • Участки, которые стилистически нельзя отнести к научному стилю;
  • Участки, на которые хотелось бы обратить особое внимание;
  • Участки, на в которых имеются недочеты;

Информация о работе Структурно-семантические трансформации в научно-техническом тексте при машинном переводе в современном английском языке