Если подробнее, то работает это так. Мы вычисляем погрешность (иными словами, ошибку) для любого конкретного набора значений для четырех параметров, то есть разницу между соответствующей синусоидой и реальными данными во всех 27 точках года. Естественный критерий при выборе наилучшей кривой – чтобы общая ошибка по всем 27 точкам была настолько мала, насколько это возможно. Однако при этом общая ошибка – не самая удачная вещь, потому что нам не нужно, чтобы отрицательные ошибки компенсировали положительные и в результате складывалось ложное впечатление, что кривая подходит хорошо, хотя в реальности это не так. Отклонения вниз так же плохи, как и вверх, и от обоих нужно избавляться; нельзя допускать, чтобы они компенсировали друг друга. По этой причине математики рассматривают не ошибки, а
Все это приводит к крайне важному общему выводу: именно закономерности в первую очередь и обеспечивают сжатие. Сжать можно только данные, следующие какому-то шаблону. Со случайными данными это не получится. К счастью, многие вещи, которые интересны людям – отпечатки пальцев, песни и лица, – хорошо структурированы и обладают закономерностями. Подобно тому как продолжительность дня следует простой синусоиде, фотография лица включает брови, дефекты кожи, скулы и прочие характерные признаки. В песнях есть мелодия, гармония, ритмы и динамика. В отпечатках имеются гребни, петли и завитки. Будучи людьми, мы мгновенно распознаем эти закономерности. Компьютеры тоже можно научить их распознавать. Синусоиды идеально подходят для отображения периодических закономерностей, но менее пригодны для представления более резко локализованных особенностей, таких как края ноздрей или родинок.
Для этой цели исследователи, работающие в различных областях, придумали кривые, которые называются вейвлетами[171]
. Эти маленькие волны более локализованы, чем синусоиды. Они не распространяются в обоих направлениях, а сильно сконцентрированы во времени и пространстве.Вейвлеты внезапно появляются, несколько раз колеблются, а затем исчезают. Они похожи на сигналы кардиомониторов или всплески активности, регистрируемые сейсмографами при землетрясениях. Они идеально подходят для изображения резкого всплеска при регистрации мозговых волн, толстого мазка на картине Ван Гога или морщины на лице.
ФБР использовало вейвлеты[172]
для преобразования файлов с отпечатками пальцев. Со времени внедрения практики применения отпечатков в начале XX века они хранились в виде чернильных оттисков на бумажных носителях. К середине 1990-х фонды разрослись примерно до двух миллионов карточек и занимали почти половину гектара офисных площадей. Когда ФБР решило оцифровать эти досье, специалисты превратили их в полутоновые изображения с 256 уровнями серого цвета и разрешением в 500 точек на дюйм, вполне достаточным для улавливания всех мелких завитков, петель, краев гребней, разветвлений и прочих идентифицирующих деталей.Проблема, однако, заключалась в том, что в то время на одной оцифрованной карте содержалось примерно 10 мегабайт данных, что делало невозможной быструю отправку таких файлов местным полицейским участкам. Не забывайте, что это происходило в середине 1990-х, когда самыми передовыми технологиями были модемы и факсы, а передача 10-мегабайтного файла занимала часы. К тому же обмениваться такими файлами, когда в качестве носителей чаще всего применялись дискеты на 1,5 мегабайта, достаточно трудно. Растущие требования по ускорению обработки ежедневно появляющихся тридцати тысяч новых карт с отпечатками и запросов о срочных проверках привели к острой необходимости модернизации системы. ФБР нуждалось в способе сжать файлы без искажений.