Математический расчет показывает, что соотношение, отражающее закон Ципфа, лежит как раз посредине между 20 % вероятности для каждой буквы (случайность) и 96 % против 1 % соответственно (стереотипный сигнал). В случае подобной сбалансированности ожидается, что А будет встречаться вдвое чаще, чем В, и втрое чаще, чем С, и т. д. Для сигнала всего из пяти букв распределение будет примерно таким: 44 % А, 22 % В, 14 % С, 11 % D и 9 % Е. По-видимому, эти вероятности отражают объективно сбалансированный способ передачи сигнала — не слишком сложный и не слишком простой. Вот почему, как считается, закон Ципфа так широко распространен. Он обеспечивает уровень сложности, достаточный для передачи информации, но не избыточный.
Любопытная вещь происходит, когда мы проверяем на соответствие закону Ципфа сигналы животных. Они почти всегда смещены в сторону «простоты» — слишком стереотипны для языка. И это логично: птичье пение действительно более однообразно, чем поэзия Шекспира. Как бы красиво ни пели птицы, их песни никогда не станут языком — они слишком просты, слишком стереотипны, они не соответствуют закону Ципфа и не попадают в точку равновесия между простотой и сложностью. Однако некоторые животные способны на большее. Мой коллега Лоренс Дойл из Института SETI стал одним из первых, кто предложил использовать коммуникацию животных для проверки методов распознавания инопланетных сигналов. Он обнаружил, что общение дельфинов приближается к закону Ципфа настолько, насколько это возможно. В ходе собственных исследований я обнаружил это свойство и у сигналов косаток. Весьма интригующий факт.
Однако сей факт вовсе не означает, что у дельфинов или косаток есть речь, и это является главной проблемой с поисками критериев определения языка и, в частности, с применением закона Ципфа. «Ложных тревог» наверняка будет много. Например, баланс простоты и сложности, сформулированный в законе Ципфа, не только является признаком языка, но и, по-видимому, может применяться более широко. Возможно, другой вид сумел приспособить его для иных, не связанных с языком целей. Косатки, безусловно, передают друг другу сложную информацию, но этой информации не обязательно быть настоящей речью, чтобы соответствовать закону Ципфа. Более того, некоторые другие виды, включая певчих птиц, от которых не принято ожидать больших лингвистических успехов, тоже до некоторой степени следуют закону Ципфа. Я бы предположил, что баланс простоты и сложности по закону Ципфа может быть предпосылкой для того, чтобы коммуникативная система развилась в настоящий язык, но сам по себе он не может быть критерием инопланетного языка. Этот закон может действовать по многим другим причинам.
Серьезное ограничение применимости закона Ципфа состоит в том, что он касается только частотности слов, а язык — это нечто гораздо большее, чем просто частота употребления союза «и». Информация содержится не только в самих словах, но и в отношениях между ними. Как мы убедились, предложение «Пух и Пятачок пошли охотиться и чуть не поймали Буку» — лингвистически правильное, а «чуть пошли поймали и Буку не Пятачок и Пух охотиться» — бессмыслица, хотя оба они подчиняются закону Ципфа. Возможно, нам предстоит открыть аналог закона Ципфа, применимый к грамматической сложности, но пока этого не произошло. На беду, мои собственные изыскания показывают, что даже грамматика человеческих языков сложнее, чем предсказывает Ципф, поэтому наш поиск универсальных признаков языка продолжается. И тем не менее закон Ципфа как минимум дает нам первый фильтр — он позволяет отбросить сигналы, которые слишком просты или слишком сложны, чтобы быть речью.
Все наши поиски критериев определения языка пока что сосредоточены на последовательностях слов или символов. Конечно, так устроен наш собственный язык, и это вовсе не будет предвзятостью, если мы скажем, что у нас просто нет других типов настоящего языка для испытания разработанных нами алгоритмов. Нет смысла изобретать тест на признаки визуального языка каракатиц, потому что нам неизвестно, как может выглядеть настоящий визуальный язык. Однако в этой области ведутся активные исследования, и вполне разумно предположить, что теория информации в той или иной форме применима к языку картинок, как и к языку предложений. Изображения, в конце концов, можно сжать в случайные последовательности, как и текстовые файлы, а это значит, что их сложность можно измерить количественно так же, как сложность предложений. Это и есть, по моему мнению, самые многообещающие направления для исследований в рамках проекта SETI, даже если мы так и не встретимся с живыми инопланетянами.