Читаем Забытая цивилизация в долине Инда полностью

Вот как эта работа велась. Протоиндийские тексты содержали в общей сложности около 6000 символов, сгруппированных в весьма короткие последовательности, в среднем по 5–6 знаков каждая, — об этом уже говорилось в предыдущей главе, но чтобы не рвать нить рассуждений, здесь придётся повториться. Поскольку общий объём текстов был весьма мал и к тому же представлен не в виде длинного связного текста, а в виде коротких, отрывочных сообщений, а о его языковой принадлежности можно было лишь смутно гадать, то и задача на первом этапе исследования текстов сводилась к тому, чтобы дать ограниченный анализ конструкции текстов и попытаться установить некоторые особенности языковой группы, к которой эти тексты принадлежали. Выполнение задачи началось с составления каталога знаков, «транскрибирования» символов цифрами, выявления разных вариантов написаний знаков — аллографов и т. п. Готовя тексты для работы над ними с помощью вычислительной техники, математики-программисты должны были чётко знать, как и для чего будут использоваться полученные ими результаты. М. А. Пробст, отдавший этому занятию немало сил и времени, вспоминал в этой связи изречение Б. Паскаля, который сравнивал математику с жёрновом на мельнице: в зависимости от того, как поставлен жёрнов, получится или мука, или труха [32, с. 14]. Поэтому предварительно нужно было решить много вопросов, на посторонний взгляд звучащих тривиально, но в действительности весьма коварных, ибо от правильного ответа зависела правильность программы, от неё — правильность результатов, от них — правильность выводов, от них — правильность дешифровки.

Одним из таких «простых» вопросов был такой: что считать знаком текста? Совпадает ли он со знаком системы? Интуитивно мы полагаем знаком текста самую малую его часть. Но и эти «мелкие» части оказываются достаточно велики, чтобы появляться в тексте самостоятельно, без сопутствующего набора других таких же частей. В неизвестном тексте — к тому же небольшого объёма — трудно проверить самостоятельность распределения частей текста. В небольшом тексте некоторые знаки, например, могут встречаться только в паре, тогда именно пару нужно принять за знак текста, хотя каждый из знаков пары может являться знаком системы текстов, т. е. иметь в ней самостоятельное распределение. Значит, знаком протоиндийского текста может считаться наиболее мелкая его часть, имеющая самостоятельное распределение. Такой «простой» ответ на «простой» вопрос потребовал немалого труда.

Возможности решения лингвистических задач, как, впрочем, и других, в случае протоиндийских текстов с самого начала были существенно ограничены их малым объёмом: нечего было и думать о том, чтобы дать полную формальную грамматику языка этих текстов. О смысловой интерпретации и переводе их речи на этом этапе работы не возникало — и не было полной уверенности, что об этом когда-нибудь можно будет заговорить.

Языковой текст — это совокупность единиц, связанных между собой определёнными соотношениями: это — связи внутри слова между фонемами, морфемами, связи между словами в словосочетании, предложении и т. п. Связи действуют в близких друг к другу единицах текста, эти близкие связи надлежало выявить в первую очередь. Для этого прежде всего нужно знать позицию элементов в тексте, а также распределение частот этих элементов по позициям в тексте. Отсюда понятно, почему метод позиционной статистики явился важнейшим инструментом исследования текстов на языке, тогда ещё не известном.

Первое, что нужно было сделать, — разбить текст, записанный сплошь без словоразделов, на отдельные блоки, соответствующие словам или, точнее, словоформам. Слово — единица традиционной грамматической теории и осознаётся таковым всеми, кто обладает даром речи. Термин «слово» может быть использован в лингвистике в разных значениях: фонологическом, грамматическом, семантическом и орфографическом. Говоря о выделении слова в сплошном тексте, мы имеем в виду его орфографическое значение, ибо слово отличается от всякой иной цепочки знаков цельностью и выделимостью.

Перейти на страницу:
Нет соединения с сервером, попробуйте зайти чуть позже