Между ! и ? немало сходств и на уровне правописания, например intensions, coarse (вместо intentions, course), ряд почти или совсем тождественных словосочетаний, например for a so-called rape и for the so-called rape («для так называемого изнасилования») и так далее. Однако ошибки правописания требуют иного рода категоризации по сравнению с остальными категориями примечательности, и эту тему я сейчас развивать не стану. Приведенные мной примеры – лишь небольшая выборка сходств, найденных мной в этих текстах. В каждом случае я составляю «таблицу соответствий», в которой перечисляю соответствия между известными и исследуемыми текстами в отношении некоторого типа сходства. Пример приведен в таблице 19.4.
Соответствия разных типов имеют разную значимость. Так, точные совпадения длинных придаточных предложений и целых предложений более значимы, чем совпадения описок. Макет и стиль документа важны меньше всего, даже меньше орфографических соответствий (правописания, расстановки апострофов и заглавных букв). Суть использования соответствующих свойств в том, что каждое заявляемое соответствие должно быть основано на понятии маркированности, то есть значимого систематического отличия от нормы. Например, если и известный нам автор, и кандидат на авторство пишут receive как
Синтаксическая примечательность – почва более надежная, чем исследование черт более поверхностного уровня вроде макета документа: будучи носителями английского языка, мы знаем, что форма dog the («собака», артикль следует за существительным, а не перед ним) маркирована, так как нарушает простое, легко наблюдаемое грамматическое правило. Более глубокие семантический и идиоматический типы маркированности менее надежны просто потому, что они относятся к иному слою лингвистической организации, чем синтаксические структуры (см. Chaski, 2001: 40). В настоящем случае мое мнение таково, что и известному, и анонимному авторам были свойственны одни и те же тенденции, а именно нарушение хронологической, синтаксической и идиоматической последовательности. Обоим наборам текстов свойственны проблемы и симптомы одних и тех же типов. Следующий вопрос заключается в исчислении сходств и различий. Для того чтобы его провести, я, следуя работе упомянутого лингвиста Карола Часки, подсчитал количество маркированных конструкций для каждого типа явлений, синтаксических и прочих. Также было важно составить список контрпримеров. Нужно помнить, что задачей лингвиста не является
Как судебный лингвист судит о полученных результатах? Точно так же, как и любой другой ученый. Если вы адекватно проверили свои результаты и свой метод и способны подтвердить их статистически, то вы можете положиться на них с большой степенью уверенности. Я использую слово «уверенность» в его неспециальном смысле. Это не то же самое, что «степень уверенности» в статистике. Статистическая «степень уверенности» – это вероятность ошибочности заявления о совпадении авторства. Одним из инструментов, которым я пользуюсь при вынесения суждения, является таблица рейтинга важности, приведенная под номером 19.5. В ней дан иерархический порядок разных типов маркированности.
Из этой таблицы следует: если у нас есть два текста, написанные предположительно независимо друг от друга, со значимым количеством синтаксических соответствий, то они, скорее всего, более значимы, чем, скажем, соответствия в макете документа. Обычно лингвисты пользуются десятибалльной шкалой, хотя некоторые из них сегодня предпочитают более сложные статистические вычисления, такие как байесовские отношения вероятности. В завершение процесса лингвист высказывает свое мнение относительно того, существует ли значимая степень сходства между двумя наборами текстов. В данном случае я был вполне уверен в своем заключении и оценил свое мнение на восемь из десяти. Лучше всегда соблюдать осторожность. Вероятность восемь из десяти – это довольно много. Девять баллов – редкость, и я не слышал, чтобы кто-нибудь давал оценку «десять».