Каким образом? Да сканером, разумеется. Приобрети в контору несколько сканеров и попроси админа расставить их по всем отделам. (Для подобной задачи годятся сами обычные любительские сканеры, а эти устройства сейчас стоят едва ли дороже обеда на двоих в очень среднем ресторанчике Нью-Йорка. Да, покупая сканер, прикажи админу убедиться, что на нём есть автоподатчик, - это сократит время сканирования многостраничных документов в разы.) После этого заставь всех сотрудников каждую бумажку сканировать и заносить получившийся файл в полагающуюся папку на сервере.
Но тут нужно четко усвоить один важный момент. Если документ сканировать как есть, без обработки, то он получается в виде графического файла – то есть обычной картинки. Хранить его в таком виде – крайне неудобно, потому что, во-первых, такой текст нельзя отредактировать, во-вторых, по нему нельзя ничего искать, и в-третьих, он получается огромных размеров.
Чтобы всего этого избежать, при сканировании документа проводится волшебная штука под названием OCR – оптическое распознавание текста (англ. - optical character recognition). Работает она очень просто (то есть со стороны пользователя выглядит это всё очень просто). Сразу после сканирования текста специальная программа анализирует получившийся графический файлик и пытается там распознать буквы, цифры и символы. Если текст чёткий и нерукописный (пишущая машинка, компьютерная распечатка), то его, как правило, можно распознать почти со 100-процентной точностью и перевести в любой из стандартных текстовых форматов – да хоть в тот же Word. В случае, если в тексте встречаются картинки – иллюстрации, логотипы, ручные подписи, печати – то они так и остаются обычными картинками.
В результате получается обычный вордовский файл, с которым уже можно делать всё, что угодно: редактировать, печатать, менять в нем иллюстрации и так далее и тому подобное. Кроме того, и это очень важно, в нем можно производить поиск различных строк, что особенно актуально, когда нужно срочно найти необходимый документ по заданной строке среди десятков, сотен и тысяч файлов.
Современными программными средствами OCR производится практически автоматически. Дошло уже до того, что работников уже можно вообще не обучать технологиям сканирования и распознавания: они просто кладут листочек в сканер, нажимают на нём кнопочку, а он запускает специальную программу сканирования-распознавания (в России для этих целей в основном используют систему Fine Reader, хотя существуют и другие программы, решающие подобные задачи), которая сканирует и распознает текст. Пользователю при этом остается только дать имя своей боли – то есть имя получившемуся файлу Word, - и указать, в какую папку на сервере поместить этот документ. Уверяю тебя, это вполне по силам даже секретарше-блондинке с огромными сис… систематическими знаниями. Хотя чтобы система была логичной, дай команду админу научить всех давать файлам значимые имена. Искать что-то в папке со сто сорока файлами doc1.doc открывая их подряд, так у секретарши и на тебя времени не хватит.
Что с безопасностью? Всё то же! Отсканированные документы, если их содержимое не должно быть доступно посторонним, сохраняются на секретном PGP-диске. При этом если оригинал по каким причинам обязательно нужно сохранить, он отправляется в соответствующий сейф. И тут всё очень логично: как только документ понадобится, его можно будет почти мгновенно найти на секретном диске. До секретного диска враги, как мы предполагаем, не доберутся. До сейфа, надеемся, тоже, потому что вон он какой здоровый, да ещё и снабжен шикарным замком!
Ну и кроме того, далеко не все документы нужно в обязательном порядке хранить. Вполне достаточно иметь их электронные копии…
Перед прочтением сжечь