Читаем Слово как улика. Всё, что вы скажете, будет использовано против вас полностью

Слово как улика. Всё, что вы скажете, будет использовано против вас

Между ! и ? немало сходств и на уровне правописания, например intensions, coarse (вместо intentions, course), ряд почти или совсем тождественных словосочетаний, например for a so-called rape и for the so-called rape («для так называемого изнасилования») и так далее. Однако ошибки правописания требуют иного рода категоризации по сравнению с остальными категориями примечательности, и эту тему я сейчас развивать не стану. Приведенные мной примеры – лишь небольшая выборка сходств, найденных мной в этих текстах. В каждом случае я составляю «таблицу соответствий», в которой перечисляю соответствия между известными и исследуемыми текстами в отношении некоторого типа сходства. Пример приведен в таблице 19.4.

Таблица 19.4. Примерная таблица соответствий известных и исследуемых текстов

Соответствия разных типов имеют разную значимость. Так, точные совпадения длинных придаточных предложений и целых предложений более значимы, чем совпадения описок. Макет и стиль документа важны меньше всего, даже меньше орфографических соответствий (правописания, расстановки апострофов и заглавных букв). Суть использования соответствующих свойств в том, что каждое заявляемое соответствие должно быть основано на понятии маркированности, то есть значимого систематического отличия от нормы. Например, если и известный нам автор, и кандидат на авторство пишут receive как recieve

(«получать»), то это может считаться маркированным, но вряд ли эта маркированность значительна. Около 2% популяции пишут receive неправильно. Это не так уж и необычно. Когда мы ищем маркированные особенности, нам нужно установить, имеем ли мы дело со структурами необычными и структурами просто непринятыми. Это и есть два типа маркированности.

Синтаксическая примечательность – почва более надежная, чем исследование черт более поверхностного уровня вроде макета документа: будучи носителями английского языка, мы знаем, что форма dog the («собака», артикль следует за существительным, а не перед ним) маркирована, так как нарушает простое, легко наблюдаемое грамматическое правило. Более глубокие семантический и идиоматический типы маркированности менее надежны просто потому, что они относятся к иному слою лингвистической организации, чем синтаксические структуры (см. Chaski, 2001: 40). В настоящем случае мое мнение таково, что и известному, и анонимному авторам были свойственны одни и те же тенденции, а именно нарушение хронологической, синтаксической и идиоматической последовательности. Обоим наборам текстов свойственны проблемы и симптомы одних и тех же типов. Следующий вопрос заключается в исчислении сходств и различий. Для того чтобы его провести, я, следуя работе упомянутого лингвиста Карола Часки, подсчитал количество маркированных конструкций для каждого типа явлений, синтаксических и прочих. Также было важно составить список контрпримеров. Нужно помнить, что задачей лингвиста не является доказать что-либо. Его задача – выявление и показ, а не доказывание.

Как судебный лингвист судит о полученных результатах? Точно так же, как и любой другой ученый. Если вы адекватно проверили свои результаты и свой метод и способны подтвердить их статистически, то вы можете положиться на них с большой степенью уверенности. Я использую слово «уверенность» в его неспециальном смысле. Это не то же самое, что «степень уверенности» в статистике. Статистическая «степень уверенности» – это вероятность ошибочности заявления о совпадении авторства. Одним из инструментов, которым я пользуюсь при вынесения суждения, является таблица рейтинга важности, приведенная под номером 19.5. В ней дан иерархический порядок разных типов маркированности.

Таблица 19.5. Таблица рейтинга важности типов стилевых черт

Из этой таблицы следует: если у нас есть два текста, написанные предположительно независимо друг от друга, со значимым количеством синтаксических соответствий, то они, скорее всего, более значимы, чем, скажем, соответствия в макете документа. Обычно лингвисты пользуются десятибалльной шкалой, хотя некоторые из них сегодня предпочитают более сложные статистические вычисления, такие как байесовские отношения вероятности. В завершение процесса лингвист высказывает свое мнение относительно того, существует ли значимая степень сходства между двумя наборами текстов. В данном случае я был вполне уверен в своем заключении и оценил свое мнение на восемь из десяти. Лучше всегда соблюдать осторожность. Вероятность восемь из десяти – это довольно много. Девять баллов – редкость, и я не слышал, чтобы кто-нибудь давал оценку «десять».

Читаем Слово как улика. Всё, что вы скажете, будет использовано против вас полностью

Слово как улика. Всё, что вы скажете, будет использовано против вас

Таблица 19.4. Примерная таблица соответствий известных и исследуемых текстов

Таблица 19.5. Таблица рейтинга важности типов стилевых черт

Похожие книги

Все жанры