Курсовая: морфологическая и семантическая разметка английско-русского поэтического корпуса

Цели и задачи

Цель исследования состоит в рассмотрении морфологической и семантической разметки англо-русского поэтического корпуса.

Введение и актуальность


При рассмотрении работ зарубежных исследователей, были обнаружены значительные различия в определениях понятия «сопоставительный корпус», который интерпретируется или как двуязычный (мультиязычный), или как моноязычный, или смешанный языковой ресурс, или вызывает ассоциации с параллельными корпусами [20, р. 449].
Дж. Пирсон предлагает рассматривать сопоставительные корпусы как «несколько аналогичных по структуре одноязычных подкорпусов, которые имеют сходную структуру, не включают переводные тексты и обладают аналогичными характеристиками» [9, с. 82]. Исследователь уточняет, что в сопоставительный корпус можно включать текстовые документы только определенного типа, поскольку такой корпус «акцентирует внимание на особых аспектах языка. Он ограничивается главным образом рамками языка для специальных целей какой-либо предметной области, специфическим типом текстов, особой разновидностью языка или языком, используемым членами какой-либо демографической группы (к примеру, тинейджеров)» [9, с. 83].
Некоторые исследователи относят к сопоставительным корпусам иллюстративный материал на двух и более языках, который не содержит переводных текстов, и создается для сопоставления языков [20; 21].
Э. Афли добавляет критерий близкой тематики и содержания текстов: «Сопоставительный корпус – это корпус текстов на двух разных языках, который не содержит параллельных текстов в строгом понимании данного термина, но который содержит аналогичные сведения» [20, р. 448].
В то же время имеется и другая позиция, согласно которой для сопоставительного корпуса допустимым является включение переведенных текстов. К примеру, Г. Лич понимает под сопоставительным корпусом коллекцию данных (текстов) на нескольких языках, отобранных независимо друг от друга, но которые зачастую содержат части, являющиеся переводными [22, р. 276]. А. Мак Энери заостряет внимание на том, что такие корпусы применяются в разных целях (исследования перевода, сопоставительные исследования) и формируются, основываясь на различных критериях и принципах: сопоставительные подкорпусы должны быть приблизительно одинакового объема, включать одни и те же жанры, предметные области и хронологические периоды. Для параллельных корпусов данные требования являются нерелевантными [23, р. 452].
Многие ученые определяют сопоставительный корпус как моноязыковой, сформированный на нескольких подкорпусах [20; 21; 23]. Тем не менее и в этом вопросе отсутствует единая позиция. Э. Афли отмечает, что один из корпусов должен содержать письменные тексты на одном языке, а другой – тексты, переведенные на этот язык, что важно для исследования трансформаций, которые появляются в процессе перевода [20, р. 449]. А. Мак Энери подразумевает под сопоставительным корпусом объединение нескольких корпусов текстов одного языка, которые представляют разные типы речи и разные тематики [23, р. 454]. Г. Лич убежден, что понятие сопоставительного корпуса распространяется только на переводные (выровненные) корпусы [22, р. 278].
Возможно, этот вид корпусов было бы логично и оправданно использовать с теми целями, на которые указывает ученый, но в исследованиях, ориентированных на сопоставление языков, они вряд ли будут приемлемыми. В этой связи М. Флудерник отмечает, что источники оказывают сильное влияние на перевод. В действительности лексика и различные обороты переводного текста обнаруживают тесную взаимосвязь с текстом-источником» [9, с. 13].
Н.В. Козлова полагает, что не совсем правомерно объединять столь разные по содержанию и целям корпусы под понятием «сопоставительный корпус» и предлагает следующую типологию, которая позволяет провести их более точную дифференциацию в соответствии с принципом количества языков и которая учитывает сферы их применения и функции [9, с. 84]:
1) одноязычные сравнительно-сопоставительные корпусы, которые охватывают корпусы оригинальных и непараллельных переводных текстов на одном языке; диахронические корпусы, разрабатываемые для сопоставления языка, к примеру, XVII и XXI столетий, корпусы национальных вариантов одного языка, обслуживающие исследования языковых явлений, осуществляющихся в рамках одного языка, и некоторых аспектов перевода;
2) многоязычные корпусы: параллельные (выровненные) корпусы, то есть корпусы, включающие тексты, содержащие предложения на одном языке и соответствующие им предложения на втором, третьем, разрабатываемые для изучения разных аспектов перевода, а также для обучения методам и приемам перевода; сопоставительные корпусы, которые представлены текстовыми массивами на двух и более языках, и относятся к одному (или более, в зависимости от поставленных задач) типу речи, функциональному стилю, дискурсу, сфера использования которых ограничивается сопоставительными исследованиями с возможностью дальнейшего применения результатов в практике преподавания языков; в комбинации с параллельными корпусами могут использоваться для исследований перевода; комбинированные корпусы, включающие моноязычные подкорпусы и подкорпусы текстов на разных языках, объединяющие рассмотренные характеристики.
Содержание, структура и область применения такого типа корпусов зависит от комплекса задач, которые ставит перед собой исследователь [7, с. 26]. Таким образом, необходимо относить сопоставительные корпусы к многоязычным корпусам и отграничивать их от параллельных и комбинированных корпусов, выполняющих другие функции. Важно отметить, что сопоставительные корпусы обладают многими преимуществами. В первую очередь, это преимущества практического характера, поскольку корпусы данного типа в отличие от параллельных корпусов имеют более высокое качество, которое не зависит от субъективного фактора – личности переводчика и качества перевода. Также материал для них является более доступным.
Сопоставительные корпусы имеют важное и ценное преимущество: они не связаны друг с другом, тексты одного корпуса не являются переводными, а потому применение сопоставительного корпуса позволяет получить непосредственный доступ к реальному употреблению слов в каждом языке и, соответственно, избежать смещений, вызываемых переводом.

Заключение и вывод


В процессе исследования было определено ключевые понятия корпусной лингвистики, рассмотрена типология корпусов; раскрыта сущность поэтического подкорпуса Национального корпуса русского и английского языков как инструмента лингвистики; рассмотрены лингвистические типы разметки поэтического подкорпуса в русском и английском языках.
Было определено, что корпус – это представленный в электронном виде, главным образом, размеченный для анализа в лингвистических целях, обеспеченный сравнительно простой в использовании поисковой системой репрезентативный массив неотредактированных текстов, которые представляют, как можно большее количество языковых вариантов. В период становления корпусной лингвистики вопросов компьютеризации этого направления обозначено не было, и ученые говорили о возможности пренебречь языковой вариативностью, то есть социальной, территориальной, возрастной, профессиональной, гендерной, индивидуальной и различными дифференциациями языка.
С появлением электронных корпусов многообразие форм существования языка стало более наглядным, возможности исследования языковых данных значительно расширились. Роль языкового корпуса для лингвистического анализа сложно переоценить. Использование корпуса позволяет не только многократно ускорить исследование, но также и существенно повысить его достоверность и эффективность за счет увеличившегося охвата рассматриваемого материала. Снижение трудоемкости исследования на основании методов статистики способствовало расширению возможностей корпусного анализа в сравнении с докорпусным периодом. Разработка диахронических корпусов, в которых присутствуют тексты, относящиеся к временному промежутку в несколько веков, сделало возможным определить изменения и механизмы развития языка.
Национальные корпуса языков представляют практическую ценность для исследований в области языка не только на всех его уровнях, но и в аспекте изучения разных жанров. Присутствие во многих национальных корпусах подкорпусов параллельных текстов существенно расширило возможности проведения сопоставительных исследований языков и предоставляет ценный материал для исследований в области перевода.
Таким образом, можно говорить об образовании новой дисциплины – корпусной лингвистики, которая имеет свой особым образом отобранный и размеченный материал и соответствующие инструменты, использующиеся для его анализа.
Также было определено, что терминология корпусной лингвистики еще в полной мере не установилась. Это является естественным, если принимать во внимание ее недавнее происхождение. Корпусная лингвистика как отдельное направление лингвистической науки сформировалась и получила развитие в Великобритании и США. Следовательно, ее терминология складывалась и продолжает формирование и развитие в недрах английского языка. Вследствие этого, русская корпусная терминология строится на базе англоязычной.

Нужна похожая работа?

Оставь заявку на бесплатный расчёт

Смотреть все Еще 421 дипломных работ