Вся разница между двумя примерами заключается в том, как получается указатель на строку. В первом примере он является результатом приведения типа строки к PChar
UniqueString
. В результате этого для S1
выделяется в динамической памяти другая область, чем для S2
, и манипуляции с содержимым S1
больше не затрагивают S2
.Неявный вызов UniqueString
UniqueString
оказываются излишними. Например, если выполняется посимвольная модификация строки в цикле, UniqueString
будет вызываться на каждой итерации цикла, хотя достаточно одного вызова — перед началом цикла. Поэтому в тех случаях, когда производительность критична, посимвольную модификацию строки лучше выполнять низкоуровневыми методами, обращаясь к символам через указатели и обеспечив уникальность строки самостоятельно. Что же касается скорости получения указателя, то тут наиболее быстрым является приведение переменной типа AnsiString
к типу Pointer
, т. к. это вообще не приводит к генерации дополнительного кода. Приведение к типу PChar
работает медленнее потому, что выполняется неявный вызов функции _LStrToPChar
, а получение адреса первого символа снижает производительность из-за неявного вызова UniqueString
.Еще раз напомним, что низкоуровневые операции с указателями небезопасны в том смысле, что компилятор почти не способен указать разработчику на ошибки в коде, если такие будут. Поэтому применять быстрые низкоуровневые средства доступа к отдельным символам строки следует только тогда, когда в этом действительно есть необходимость.
3.3.6. Нулевой символ в середине строки
Хотя символ #0
AnsiString
, он уже не является признаком ее конца, т. к. длина строки хранится отдельно. Это позволяет размещать символы #0
и в середине строки. Но нужно учитывать, что полноценное преобразование такой строки в PChar
невозможно — это иллюстрируется примером Zero на компакт-диске (листинг 3.32).#0
procedure TForm1.Button1Click(Sender: TObject);
var
S1, S2, S3: string;
P: PChar;
begin
S1:= 'Test'#0'Test';
S2:= S1;
UniqueString(S2);
P:= PChar(S1);
S3:= P;
Label1.Caption:= IntToStr(Length(S2));
Label2.Caption:= IntToStr(Length(S3));
end;
В первую метку будет выведено число 9 (длина исходной строки), во вторую — 4. Мы видим, что при копировании одной строки AnsiString
#0
в середине строки — не помеха (вызов UniqueString
добавлен для того, чтобы обеспечить реальное копирование строки, а не только копирование указателя). А вот как только мы превращаем эту строку PChar
, информация о ее истинной длине теряется, и при обратном преобразовании компилятор ориентируется на символ #0
, в результате чего строка "обрубается".Потеря куска строки после символа #0
ShortString
или AnsiString
в PChar
, даже неявное. Например, все API-функции работают с нуль-терминированными строками, а визуальные компоненты — просто обертки над этими функциями, поэтому вывести с их помощью на экран строку, содержащую #0
, целиком невозможно. Но главный "подводный камень", связанный с символом #0
в середине строки, заключается в том, что целый ряд стандартных функций для работы со строками AnsiString
на самом деле вызывают API-функции (или даже библиотечные функции Delphi, предназначенные для работы с PChar
, что приводит к игнорированию "хвоста" после #0
. Следующий код (листинг 3.33. пример ZeroFind на компакт-диске) иллюстрирует эту проблему.AnsiPos
#0
procedure TForm1.Button1Click(Sender: TObject);
begin
Label1.Caption:= IntToStr(AnsiPos('Z', 'A'#0'Z'));
end;