Автор: Пользователь скрыл имя, 20 Апреля 2012 в 19:56, дипломная работа
Мы живем в мире информационных технологий, которые прочно вошли в нашу жизнь. Мы пользуемся современными средствами связи. Компьютер превратился в неотъемлемый элемент нашей жизни не только на рабочем месте, но и в повседневной жизни. Быстрое развитие новых информационных технологий свидетельствует о всевозрастающей роли компьютерной техники в мировом информационном пространстве.
Введение 5
1 К определению основных понятий лингвостилистики. 9
1.1 Основные понятия 14
1.2 Функциональные стили 17
1.3 Стилистическая характеристика научно-технического стиля 20
1.3.1 Общие особенности 20
1.3.2 Лексические особенности научно-технического стиля 21
1.3.3 Синтаксические особенности научно-технического стиля 25
1.3.4 Морфологические особенности научно-технического стиля 28
1.3.5 Подстили 31
2 К проблеме машинного перевода в современном языкознании 33
2.1 Основные понятия машинного перевода 35
2.1.1 Развитие машинного перевода 35
2.1.2 Степень реализации СМП 37
2.1.3 Принципы оценки СМП 38
2.1.4 Принцип действия СМП 39
2.2 Подходы к машинному переводу 39
2.2.1 СМП основанные на правилах 41
2.2.2 Системы машинного перевода основанные на примерах 49
2.2.3 Статистический машинный перевод 51
2.3 ТМ-системы 55
2.4 Сравнение различных типов СМП 56
3 Структурно-семантические трансформации в англоязычном научно техническом тексте при машинном переводе 62
3.1 Основные особенности 62
3.2 Лексические особенности 66
3.3 Синтаксические особенности 78
3.4 Морфологические особенности 88
Заключение 95
Библиография 99
Приложения 103
Схема 1: основные понятия стилистики 103
Схема 2: тропы и фигуры 104
Схема 3: функциональные стили языка 105
Схема 4: особенности научно-технического стиля 106
Образцы проанализированных текстов 107
Отрывок 1 107
Оригинал 107
Перевод, выполненный статистической СМП 109
Перевод, выполненный трансфертной СМП 111
Перевод, выполненный человеком 113
Отрывок 2 116
Оригинал 116
Перевод, выполненный статистической СМП 118
Перевод, выполненный трансфертной СМП 120
Перевод, выполненный человеком 122
Отрывок 3 125
Оригинал 125
Перевод, выполненный статистической СМП 127
Перевод, выполненный трансфертной СМП 129
Перевод, выполненный человеком 131
Таблицы анализа 133
Список сокращений 142
Условные обозначения 142
Постепенно
форму и смысл алгоритм была повреждена;
как пояснил Оксфордский
К 1950
году, слово алгоритм чаще всего
связаны с алгоритмом Евклида, процесс
для нахождения наибольшего общего
делителя двух чисел, который появляется
в «Начал» Евклида
(книга 7, предложений 1 и 2). Это будет Поучительно
выставку алгоритм Евклида здесь:
Алгоритм E (алгоритм Евклида). Даны два натуральных чисел и , найти их наибольший общий делитель, т. е. наибольшее положительное целое число, равномерно делит и .
Е1. [Найти остаток.] Разделите на и быть остаток. (Мы будем иметь .)
Е2. [Это нуль?] Если , алгоритм завершается, является ответом.
E3. [Уменьшить.] Множества
, , и вернитесь к шагу Е1.
Конечно, Евклид не представит свой алгоритм именно таким образом. Формат выше иллюстрирует стиль, в котором все алгоритмы в этой книге будут представлены.
Каждый
алгоритм рассмотрим было уделено выявлению
письмо (E и в предыдущем примере),
и шаги алгоритма обозначены этим
письмом последовал ряд (El, E2, E3). Главы
разделен на пронумерованные разделы,
в разделе алгоритмы, обозначенные буквой
только, но при алгоритмов, упоминаемые
в других разделах, соответствующих номер
раздела прилагается. Например, сейчас
мы находимся в разделе 1.1, в этом разделе
алгоритма Евклида называется алгоритм
E, а в последующих разделах это называется
алгоритм 1.1e.
Перевод, выполненный трансфертной СМП
Машинный
перевод отрывка (на основании СМП
Промпт):
Понятие алгоритма является основным ко всему программированию, таким образом, мы должны начать с тщательного анализа этого понятия. Само слово "алгоритм" довольно интересно; на первый взгляд может выглядеть, как если бы кто-то намеревался записать "логарифм", но смешивал первые четыре буквы. Слово не появлялось в Новом Мировом Словаре Вебстера уже в 1957; мы считаем только более старую форму "десятеричной системой счисления" с ее древним значением, процессом выполнения арифметического использования арабских цифр. Во время Средневековья abacists, вычисленный на абаке и algorists, вычислен десятеричной системой счисления. Ко времени Ренессанса вызывал сомнение источник этого слова, и ранние лингвисты попытались предположить его деривацию, делая комбинации как algiros [болезненный] + arithmos [число]; другие сказали не, слово прибывает от ”Короля Алгора Кастилии.” Наконец, историки математики нашли истинный источник десятеричной системы счисления слова: Это прибывает из имени известного персидского автора учебника, Абу ’Абд Аллах Мухаммед ибн Муса al-KhwarizmT (c. 825) - буквально, ”Родительский элемент Абдуллы, Мохаммеда, сына Моисея, уроженца Khwarizm.” Аральское море в Средней Азии было когда-то известно как Озеро Хваризм, и область Khwarizm расположена в Бассейне реки Amu только к югу от того моря. Аль-Хваризм записал знаменитой книге Kitab aljabr wa’l-muqabala (”Правила восстановления и приравнивания”); другое слово, "алгебра" происходит от заголовка его книги, которая была систематическим исследованием решения линейных и квадратных уравнений. [Для примечаний по жизни al-Khwarizml и работе, см. Х. Земэнека, Примечания Лекции в Информатике 122 A981), 1-81.] Постепенно форма и значение десятеричной системы счисления стали поврежденными; как объяснено Оксфордским английским Словарем, слово ”проходило через многие псевдоэтимологические извращения, включая недавний алгоритм, в котором это со знанием дела перепутано” с греческим корнем арифметики слова. Это изменение от "десятеричной системы счисления" до "алгоритма" не трудно понять ввиду факта, что люди забыли исходную деривацию слова. Ранний немецкий математический словарь, Словарь Vollstk’ndiges mathematisches (Лейпциг: 1747), дал следующее определение для слова Algorithmus: ”Под этим обозначением объединены понятия четырех типов арифметических вычислений, а именно, дополнения, умножения, вычитания, и подразделения.” Латинская фраза algorithmus infinitesimalis тогда использовалась, чтобы обозначить ”способы вычисления с бесконечно небольшими количествами, как изобретено Лейбницем.”
К 1950,
алгоритм слова наиболее часто связывался
с алгоритмом Евклида, процессом для
того, чтобы найти самый большой общий
делитель двух чисел, который появляется
в Элементах Евклида (Книга 7, Суждения
1 и 2). Это будет поучительно, чтобы показать
алгоритм Евклида здесь:
Алгоритм E (алгоритм Евклида). Учитывая два положительных целых числа и , найдите их самый большой общий делитель, то есть, самое большое положительное целое число, которое равномерно делит обоих и .
E1. [Найдите
остаток.] Делятся на и позволяют
быть остатком.
(Мы
будем иметь .)
E2. [Это - нуль?] Если , алгоритм завершается, ; ответ.
E3. [Уменьшить.]
Набор , , и возвращается к шагу E1.
Конечно,
Евклид не представлял свой алгоритм
только этим способом. Формат выше иллюстрирует
стиль, в котором будут представлены
все алгоритмы всюду по этой книге.
Каждому алгоритму, который мы рассматриваем,
дали букву идентификации (E в предыдущем
примере), и шаги алгоритма идентифицированы
этой буквой, сопровождаемой числом (эль,
E2, E3). Главы разделены на пронумерованные
разделы; в пределах раздела алгоритмы
определяются по буквам только, но когда
алгоритмы упомянуты в других разделах,
соответствующее число раздела присоединено.
Например, мы находимся теперь в Разделе
1.1; в пределах этого раздела алгоритм
Евклида вызывают Алгоритмом E, в то время
как в более поздних разделах это упоминается
как Алгоритм 1.1E.
Перевод, выполненный человеком
Перевод
сделанный профессиональным переводчиком
(Кнут Д, 2002:
20):
Понятие
алгоритм является основным для всей
области компьютерного
Постепенно форма и значение слова algorism исказились; как объясняется в словаре Oxford English Dictionary, это слово «претерпело множество псевдоэтимологических искажений, включая последний вариант algorithm, где произошла путаница» с корнем слова греческого происхождения arithmetic. Этот переход от «algorism» к «algorithm» кажется вполне закономерным ввиду того, что происхождение рассматриваемого слова было полностью забыто. В старинном немецком математическом словаре Vollstandiges mathematisches Lexicon (Leipzig, 1747) дается следующее определение слова algorithmus: «Этот термин включает в себя понятие о четырех типах арифметических операций, а именно: о сложении, умножении, вычитании и делении». Латинское выражение algorithmus infinitesimalis в то время использовалось для определения «способов выполнения действий с бесконечно малыми величинами, открытых Лейбницем (Leibniz)».
К 1950
году слово «алгоритм» чаще всего ассоциировалось
с алгоритмом Евклида, который представляет
собой процесс нахождения наибольшего
общего делителя двух чисел. Этот алгоритм
приведен в книге Евклида (Euclid) Начала
(книга 7, предложения 1 и 2). Думаю, имеет
смысл привести здесь описание этого алгоритма.
Алгоритм Е (Алгоритм Евклида). Даны два целых положительных числа и . Требуется найти их наибольший общий делитель, т. е. наибольшее целое положительное число, которое нацело делит оба числа и .
El. [Нахождение остатка.]
Разделим на ., и пусть остаток от деления будет равен . (где .).
Е2. [Сравнение с нулем.]
Если , то выполнение алгоритма прекращается; — искомое значение.
ЕЗ. [Замещение.]
Присвоить
, ,и вернуться к шагу El.
Разумеется, у Евклида этот алгоритм сформулирован не совсем так. Приведенная выше формулировка иллюстрирует стиль, в котором алгоритмы будут представлены на протяжении всей этой книги.
Каждому
рассматриваемому алгоритму присваивается
идентифицирую- щая буква (в предыдущем
примере использовалась буква Е), а шагам
алгоритма — эта же буква в сочетании с
числом (El, Е2, ЕЗ). Главы книги подразделяются
на пронумерованные разделы; внутри раздела
алгоритмы обозначаются только буквами.
Но когда на эти алгоритмы делаются ссылки
из других разделов, то к букве присоединяется
номер соответствующего раздела. Например,
сейчас мы находимся в разделе 1.1; внутри
этого раздела алгоритм Евклида называется «Алгоритм
Е», но
ссылаться на него в последующих разделах
мы будем как на алгоритм 1.1Е.
Статистика (приводятся цифры для оригинального издания, без учета алгоритма Евклида):
Параметр | Значение |
строки | 52 |
слова | 480 |
символы | 4059 |
Отрывок 2
Оригинал
Отрывок
из «Искусства
программирования»
(Knuth, 1997: 282).
As an example of the use of doubly linked lists, we will now consider the writing of a discrete simulation program. "Discrete simulation" means the simulation of a system in which all changes in the state of the system may be assumed to happen at certain discrete instants of time. The "system" being simulated is usually a set of individual activities that are largely independent although they interact with each other; examples are customers at a store, ships in a harbor, people in a corporation. In a discrete simulation, we proceed by doing whatever is to be done at a certain instant of simulated time, then advance the simulated clock to the next time when some action is scheduled to occur.
By contrast, a "continuous simulation" would be simulation of activities that are under continuous changes, such as traffic moving on a highway, spaceships traveling to other planets, etc. Continuous simulation can often be satisfactorily approximated by discrete simulation with very small time intervals between steps; however, in such a case we usually have "synchronous" discrete simulation, in which many parts of the system are slightly altered at each discrete time interval, and such an application generally calls for a somewhat different type of program organization than the kind considered here.
The program developed below simulates the elevator system in the Mathematics building of the California Institute of Technology. The results of such a simulation will perhaps be of use only to people who make reasonably frequent visits to Caltech; and even for them, it may be simpler just to try using the elevator several times instead of writing a computer program. But, as is usual with simulation studies, the methods we will use are of much more interest than the answers given by the program. The methods to be discussed below illustrate typical implementation techniques used with discrete simulation programs.
The Mathematics building has five floors: sub-basement, basement, first, second, and third. There is a single elevator, which has automatic controls and can stop at each floor. For convenience we will renumber the floors 0, 1, 2, 3, and 4.
On each floor there are two call buttons, one for UP and one for DOWN. (Actually floor 0 has only UP and floor 4 has only DOWN, but we may ignore that anomaly since the excess buttons will never be used.) Corresponding to these buttons, there are ten variables CALLUP [ j] and CALLDOWN [ j], 0 <= j <= 4.
There are also variables CALLCAR[j], 0 <= j <= 4, representing buttons within the elevator car, which direct it to a destination floor. When a person presses a button, the appropriate variable is set to 1; the elevator clears the variable to 0 after the request has been fulfilled.
So far we have described the elevator from a user's point of view; the situation is more interesting as viewed by the elevator. The elevator is in one of three states: GOINGUP, G0INGD0WN, or NEUTRAL. (The current state is indicated to passengers by lighted arrows inside the elevator.) If it is in NEUTRAL state and not on floor 2, the machine will close its doors and (if no command is given by the time its doors are shut) it will change to GOINGUP or G0INGD0WN, heading for floor 2. (This is the "home floor," since most passengers get in there.) On floor 2 in NEUTRAL state, the doors will eventually close and the machine will wait silently for another command. The first command received for another floor sets the machine GOINGUP or GOINGDOWN as appropriate; it stays in this state until there are no commands waiting in the same direction, and then it switches direction or switches to NEUTRAL just before opening the doors, depending on what other commands are in the CALL variables. The elevator takes a certain amount of time to open and close its doors, to accelerate and decelerate, and to get from one floor to another. All of these quantities are indicated in the algorithm below, which is much more precise than an informal description can be. The algorithm we will now study may not reflect the elevator's true principles of operation, but it is believed to be the simplest set of rules that explain all the phenomena observed during several hours of experimentation by the author during the writing of this section.