Для работы со строками в последних версиях Delphi разработчикам доступно большое количество функций, помимо которых ещё есть помощники для работы со строками, такие как TStringHelper, TStringBuilder и TRegEx. Во всём этом разнообразии бывает сложно найти нужную функцию. Я попытался разобраться, что есть в Delphi 10.1 Berlin для работы со строками и как этим всем пользоваться.
Итак, прежде чем начнём разбираться с функциями, замечу, что начиная с Delphi XE3, появился помощник TStringHelper, и теперь работать со строками можно как с записями. Т.е., если вы определили переменную со строкой (на картинке снизу – это myStr), то вы можете поставить точку и посмотреть, какие функции доступны. Это очень удобно.
Кстати аналогичные помощники появились и для работы с типами Single, Double и Extended: TSingleHelper, TDoubleHelper и TExtendedHelper.
Ну и конечно, помимо помощника TStringHelper, никуда не делся класс TStringBuilder, который используется для работы со строкой как с массивом, и который является полностью совместимым с .NET классом StringBuilder.
А для работы с текстовыми документами незаменимым окажется класс TRegEx, который является обёрткой над библиотекой PCRE, позволяющий использовать регулярные выражения для поиска, замены подстрок и расщепления текста на части.
Все приведённые в статье примеры сделаны с помощью Delphi 10.1 Berlin, поэтому в других версиях Delphi их работа не гарантируется.
Вот основные моменты, которые мы рассмотрим в статье:
Строки в Delphi
В последних версиях Delphi тип string, обозначающий строку, является псевдонимом встроенного типа System.UnicodeString. Т.е. когда вы объявляете переменную str: string, то автоматически вы объявляете переменную типа UnicodeString.
Кстати, на платформе Win32 вы можете использовать директиву «{$H-}», которая превратит тип string в ShortString. С помощью этого способа вы можете использовать старый 16-битный код Delphi или Turbo Pascal в ваших проектах.
Обратите внимание, что кроме типа UnicodeString и ShortString в Delphi есть и другие типы строк, такие как AnsiString и WideString, однако дальше в статье мы будем рассматривать только работу со строками типа string.
Более глубокое изучение строк в Delphi вы можете начать с прочтения документации здесь.
Конечно, начнём мы с инициализации строк. Итак, рассмотрим объявление переменной с типом string.
В этой строчке кода мы объявляем переменную s с типом string, т.е., как было написано выше, по умолчанию с типом UnicodeString. Объявленные переменные с типом UnicodeString, в которые не присвоено значение, всегда гарантированно содержат строку нулевой длины. Чтобы теперь в переменной s была нужная нам строка, нужно просто присвоить переменной другое значение, например:
Это самый простой и часто используемый способ инициализации. Кроме этого есть ряд полезных функций, которые пригодятся вам для инициализации строк в некоторых ситуациях (здесь и далее я буду давать полный код проекта консольного Win32 приложения):
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils, System.StrUtils;
var
str1, str2, str3, str4, str5, str6: string;
arr4: array of char;
begin
try
//Способ 1: инициализируем строку повторяющимися символами.
//В результате в str1 будет строка "ААААА".
str1 := StringOfChar('А', 5);
//Способ 2: инициализируем строку повторяющимися символами.
//В результате в str2 будет строка "ААААА".
str2 := string.Create('А', 5);
//Способ 3: инициализируем строку повторяющимися подстроками.
//В результате в str3 будет строка "ХаХаХаХаХа".
str3 := DupeString('Ха', 5);
//Способ 4: инициализируем строку символами из массива.
//В результате в str4 будет строка "Абвгд"
arr4 := ['А', 'б', 'в', 'г', 'д'];
str4 := string(arr4);
//Способ 5: инициализируем строку символами из массива.
//В результате в str5 будет строка "Абвгд"
str5 := string.Create(['А', 'б', 'в', 'г', 'д']);
//Способ 6: инициализируем строку символами из массива (берём только часть символов).
//В результате в str6 будет строка "бвг"
str6 := string.Create(['А', 'б', 'в', 'г', 'д'], 1, 3);
//Отображаем результат.
Writeln(str1);
Writeln(str2);
Writeln(str3);
Writeln(str4);
Writeln(str5);
Writeln(str6);
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Для изменения регистра строк в Delphi есть функции LowerCase, UpperCase, TStringHelper.ToLower, TStringHelper.ToUpper, TStringHelper.ToLowerInvariant и TStringHelper.ToUpperInvariant. В нижний регистр строки меняют функции LowerCase, TStringHelper.ToLower и TStringHelper.ToLowerInvariant, остальные – в верхний. Обратите внимание, что функции LowerCase и UpperCase не работают с кириллицей. Функции TStringHelper.ToUpperInvariant и TStringHelper.ToLowerInvariant всегда работают независимо от текущей пользовательской локали. Вот примеры использования функций:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils;
begin
try
//В нижний регистр меняются только латинские буквы. Результат будет 'АбВгД - abcde'.
Writeln(LowerCase('АбВгД - AbCdE'));
//В верхний регистр меняются только латинские буквы. Результат будет 'АбВгД - ABCDE'.
Writeln(UpperCase('АбВгД - AbCdE'));
//В нижний регистр меняются и русские и латинские буквы. Результат будет 'абвгд - abcde'.
Writeln('АбВгД - AbCdE'.ToLower);
//В верхний регистр меняются и русские и латинские буквы. Результат будет 'АБВГД - ABCDE'.
Writeln('АбВгД - AbCdE'.ToUpper);
//Указываем локаль при изменении регистра. Результат будет 'АБВГД - ABCDE'.
Writeln('АбВгД - AbCdE'.ToUpper(TLanguages.GetLocaleIDFromLocaleName('ru-RU')));
//В нижний регистр меняются и русские и латинские буквы. Результат будет 'абвгд - abcde'.
Writeln('АбВгД - AbCdE'.ToLowerInvariant);
//В верхний регистр меняются и русские и латинские буквы. Результат будет 'АБВГД - ABCDE'.
Writeln('АбВгД - AbCdE'.ToUpperInvariant);
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Здесь конечно самый простой вариант – это использование оператора +. Но есть и другие варианты, например, функция Concat. А если вам нужно в цикле добавлять в конец одной строки большое количество других строк, то здесь пригодится метод Append класса TStringBuilder. Вот пример использования перечисленных способов:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils;
var
str1, str2, str3, str4: string;
stringBuilder: TStringBuilder;
begin
try
//Способ 1: используем оператор +.
str1 := 'Абвг' + 'деёжз' + 'иклмн' + 'опрст';
// Способ 2: используем функцию Concat.
str2 := Concat('Абвг', 'деёжз', 'иклмн', 'опрст');
// Способ 3: используем функцию TStringHelper.Join.
str3 := String.Join('', ['Абвг', 'деёжз', 'иклмн', 'опрст']);
// Способ 4: используем TStringBuilder.
// Способ 4: используем TStringBuilder.
stringBuilder := TStringBuilder.Create;
try
stringBuilder
.Append('Абвг')
.Append('деёжз')
.Append('иклмн')
.Append('опрст');
str4 := stringBuilder.ToString;
finally
stringBuilder.Free;
end;
//Отображаем результат.
Writeln(str1);
Writeln(str2);
Writeln(str3);
Writeln(str4);
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Во всех четырёх переменных, после выполнения нашей программы, будет следующая строка: «Абвгдеёжзиклмнопрст». Четвёртый способ выглядит более громоздким, но у такого способа есть три преимущества. Во-первых, при большом количестве конкатенаций этот способ даст выигрыш по времени по сравнению с первыми тремя способами. Во-вторых, при создании объекта TStringBuilder вы сразу можете задать нужный размер массива для хранения строки, если он конечно известен. Это тоже даст выигрыш по времени. В-третьих, функция Append принимает на вход не только строки, но и другие типы, такие как Integer и Single, автоматически преобразуя их в строку.
Третий способ удобно использовать, если нужно сложить строки, находящиеся в массиве или списке. К тому же здесь первым параметром можно задать строку-разделитель, которая будет вставлена между строками, взятыми из массива. Вот пример, в котором формируется строка со списком городов, разделённых запятыми:
str3 := String.Join(', ', ['Москва', 'Санкт-Петербург', 'Севастополь']);
В результате выполнения этой функции получится строка «Москва, Санкт-Петербург, Севастополь».
Для того чтобы вставить внутрь строки подстроку вы можете использовать процедуру Insert или функцию TStringHelper.Insert. У класса TStringBuilder тоже есть аналогичная функция. Кстати, функция TStringBuilder.Insert, кроме строк умеет вставлять и другие типы, такие как Integer и Single, автоматически преобразуя их в строку. Вот пример использования:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils;
var
str1, str2: string;
stringBuilder: TStringBuilder;
begin
try
//В результате вставки получится строка 'Абв--гд'
str1 := 'Абвгд';
Insert('--', str1, 4);
Writeln(str1);
//В результате вставки получится строка 'Абв--гд'
str2 := 'Абвгд';
Writeln(str2.Insert(3, '--')); //Будет отображено 'Абв--гд'.
Writeln(str2); //Здесь тоже будет отображено 'Абв--гд'.
//В результате вставки получится строка 'Абв--гд'
stringBuilder := TStringBuilder.Create('Абвгд');
try
stringBuilder.Insert(3, '--');
Writeln(stringBuilder.ToString);
finally
stringBuilder.Free;
end;
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Обратите внимание, в процедуре Insert нумерация символов начинается с 1, а в функциях TStringHelper.Insert и TStringBuilder.Insert – с 0. Все приведённые способы меняют строку, хранящуюся в переменной.
Допустим, вам нужно удалить из строки часть символов. Здесь нам помогут процедура Delete и функция TStringHelper.Remove. У класса TStringBuilder тоже есть функция Remove. Вот примеры использования:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils;
var
str1, str2, str3: string;
stringBuilder: TStringBuilder;
begin
try
//Способ 1: используем функцию Delete.
str1 := 'Абвгд';
Delete(str1, 2, 2);
//Способ 2: используем функцию TStringHelper.Remove.
str2 := 'Абвгд';
str2 := str2.Remove(1, 2);
//Способ 3: удаляем символы внутри TStringBuilder.
stringBuilder := TStringBuilder.Create('Абвгд');
try
stringBuilder.Remove(1, 2);
str3 := stringBuilder.ToString;
finally
stringBuilder.Free;
end;
//Отображаем результат.
Writeln(str1);
Writeln(str2);
Writeln(str3);
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Во всех трёх способах из строки «Абвгд» получится строка «Агд». Обратите внимание, что в процедуре Delete нумерация символов начинается с 1, а в функциях Remove – с 0.
Также интересно, что функция TStringHelper.Remove не трогает исходную строку. Вместо этого она возвращает новую строку с удалёнными символами. Именно поэтому мы присваиваем результат обратно в переменную. Процедура Delete работает по-другому: она меняет исходную строку.
Помимо приведённых здесь вариантов, для удаления части строки можно использовать функции замены подстроки, просто для этого искомая подстрока заменяется на пустую, например, StringReplace(str1, substr1, '').
Здесь идёт речь о том, что часть длиной строки нужно скопировать в новую строку или массив символов. Для этого в Delphi есть функции LeftStr, RightStr, Copy, TStringHelper.Substring и TStringHelper.CopyTo. А в классе TStringBuilder – только функция CopyTo. Есть также функция MidStr в юните System.StrUtils, которая работает аналогично функции Copy, поэтому в примере её не будет.
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils, System.StrUtils;
var
str1, str2, str3, str4: string;
arr5: array of char;
arr6: TCharArray;
stringBuilder: TStringBuilder;
begin
try
//Способ 1: копируем три символа слева.
//В результате в строке str2 будет "Абв".
str1 := LeftStr('Абвгдеёжз', 3);
//Способ 2: копируем три символа справа.
//В результате в строке str3 будет "ёжз".
str2 := RightStr('Абвгдеёжз', 3);
//Способ 3: копируем символы из середины.
//В результате в строке str1 будет "вгд".
str3 := Copy('Абвгдеёжз', 3, 3);
//Способ 4: копируем символы из середины.
//В результате в строке str4 будет "вгд".
str4 := 'Абвгдеёжз'.Substring(2, 3);
//Способ 5: копируем часть строки в массив символов.
//В результате в массиве arr5 будет ['в', 'г', 'д'].
SetLength(arr5, 3);
'Абвгдеёжз'.CopyTo(2, arr5, 0, 3);
//Способ 6: копируем часть символов из TStringBuilder в массив символов.
//В результате в массиве arr6 будет ['в', 'г', 'д'].
stringBuilder := TStringBuilder.Create('Абвгдеёжз');
try
SetLength(arr6, 3);
stringBuilder.CopyTo(2, arr6, 0, 3);
finally
stringBuilder.Free;
end;
//Отображаем результат.
Writeln(str1);
Writeln(str2);
Writeln(str3);
Writeln(str4);
Writeln(string(arr5));
Writeln(string(arr6));
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Первые два способа копируют часть строки слева (функция LeftStr) или справа (RightStr). Остальные четыре способа подходят, как для копирования части строки слева или справа, так и из середины.
В способах 3-6 из примера мы получим сроку «вгд» или массив ['в', 'г', 'д']. Обратите внимание, что в функциях Copy и MidStr нумерация символов начинается с 1, а во всех остальных с 0. Исходная строка или массив символов во всех четырёх способах не меняется.
Конечно, сравнивать строки можно с помощью операторов =, <, <=, >, >= и <>. Но кроме этого существуют ещё много функций: StrComp, StrIComp, StrLComp, StrLIComp, CompareStr, CompareText, TStringHelper.Compare, TStringHelper.CompareOrdinal, TStringHelper.CompareTo, TStringHelper.CompareText, SameStr, SameText, TStringHelper.Equals и TStringBuilder.Equals. Функции SameText, StrIComp, CompareText, TStringHelper.CompareText и TStringHelper.Compare умеют производить регистронезависимое сравнение строк, остальные функции и операторы - регистрозависимое.
Третьим параметром в функциях CompareText и SameText можно указать, что нужно использовать для сравнения строк пользовательскую локаль. В этом случае вы сможете сравнивать строки с русскими буквами независимо от регистра, если конечно в ОС используется русский язык.
Самая продвинутая здесь функция – это TStringHelper.Compare. С помощью неё можно сравнивать не только целые строки, но и части строк. Здесь можно настроить зависимость от регистра, включить игнорирование символов и знаков препинания или сравнение цифр как чисел и т.д.
Операторы, а также функции TStringHelper.Equals и TStringBuilder.Equals, в результате сравнения, отдадут вам True, если условие верно, и False, если условие не верно. Функции CompareStr, CompareText, TStringHelper.Compare, TStringHelper.CompareTo, TStringHelper.CompareOrdinal и TStringHelper.CompareText работают по-другому. Они сравнивают строки с точки зрения сортировки. Функции возвращают отрицательное число, если строка, указанная в первом параметре, сортируется до строки, указанной во втором параметре, положительное число - если первая строка сортируется после второй и 0 – если строки равны.
Функции SameStr, SameText, TStringHelper.Equals и TStringBuilder.Equals сравнивают строки на соответствие.
Итак, вот примеры использования вышеперечисленных функций и операторов:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils, System.StrUtils, Winapi.Windows;
var
stringBuilder1, stringBuilder2: TStringBuilder;
begin
try
//Сравнение строк с помощью операторов (регистрозависимое).
//В результате будет TRUE (т.е. строка 1 сортируется до строки 2).
Writeln('Арбуз' < 'Банан');
//В результате будет TRUE (т.е. строка 1 сортируется после строки 2).
Writeln('Арбуз' > 'Арбалет');
//В результате будет TRUE (т.е. строка 1 сортируется до строки 2 или строки равны).
Writeln('Арбуз' <= 'арбуз');
//В результате будет FALSE (т.е. строки не равны).
Writeln('Арбуз' = 'арбуз');
//Сравнение с помощью регистрозависимых функций.
//Результат будет FALSE.
Writeln('Арбуз'.Equals('арбуз'));
//Результат будет TRUE.
Writeln('Банан'.Equals('Банан'));
//Результат будет FALSE.
Writeln(SameStr('Арбуз', 'арбуз'));
//Результат будет TRUE.
Writeln(SameStr('Банан', 'Банан'));
//Результат будет -1 (т.е. строка 1 сортируется до строки 2).
Writeln(string.CompareOrdinal('Арбуз', 'Банан'));
//Результат будет -1 (т.е. строка 1 сортируется до строки 2).
Writeln(StrComp('Арбуз', 'Банан'));
//Сравниваем только первые 2 символа. Результат будет -1 (т.е. строка 1 сортируется до строки 2).
Writeln(StrLComp('Арбуз', 'Банан', 2));
//Результат будет -1 (т.е. строка 1 сортируется до строки 2).
Writeln('Арбуз'.CompareTo('Банан'));
//Результат будет 19 (т.е. строка 1 сортируется после строки 2).
Writeln('Арбуз'.CompareTo('Арбалет'));
//Результат будет -1 (т.е. строка 1 сортируется до строки 2).
Writeln(CompareStr('Арбуз', 'Банан'));
//Результат будет 19 (т.е. строка 1 сортируется после строки 2).
Writeln(CompareStr('Арбуз', 'Арбалет'));
//Сравнение с помощью регистроНЕзависимых функций (работает только для латинских букв).
//Результат будет FALSE.
Writeln(SameText('Арбуз', 'арбуз'));
//Результат будет -32 (т.е. строка 1 сортируется до строки 2).
Writeln(StrIComp('Арбуз', 'арбуз'));
//Сравниваем только первые 2 символа. Результат будет -32 (т.е. строка 1 сортируется до строки 2).
Writeln(StrLIComp('Арбуз', 'арбуз', 2));
//Результат будет -32 (т.е. строка 1 сортируется до строки 2).
Writeln(CompareText('Арбуз', 'арбуз'));
//Результат будет -32 (т.е. строка 1 сортируется до строки 2).
Writeln(string.CompareText('Арбуз', 'арбуз'));
//Результат будет 0 (т.е. строки 1 и 2 равны).
Writeln(string.CompareText('Watermelon', 'watermelon'));
//Результат будет 0 (т.е. строки 1 и 2 равны).
Writeln(StrIComp('Watermelon', 'watermelon'));
//Сравниваем только первые 2 символа. Результат будет 0 (т.е. строки 1 и 2 равны).
Writeln(StrLIComp('Watermelon', 'watermelon', 2));
//Результат будет 0 (т.е. строки 1 и 2 равны).
Writeln(CompareText('Watermelon', 'watermelon'));
//Сравнение с помощью регистроНЕзависимых функций (использование пользовательской локали).
//Результат будет TRUE.
Writeln(SameText('Арбуз', 'арбуз', TLocaleOptions.loUserLocale));
//Результат будет 0 (т.е. строки 1 и 2 равны).
Writeln(CompareText('Арбуз', 'арбуз', TLocaleOptions.loUserLocale));
//Сравнение с помощью функции TStringHelper.Compare.
//Регистрозависимое сравнение. В результате будет 1 (т.е. строка 1 сортируется после строки 2).
Writeln(string.Compare('Арбуз', 'арбуз'));
//РегистроНЕзависимое сравнение. В результате будет 0 (т.е. строки 1 и 2 одинаковые).
Writeln(string.Compare('Арбуз', 'арбуз', true));
//РегистроНЕзависимое сравнение с игнорированием символов и знаков препинания.
//В результате будет 0 (т.е. строки 1 и 2 одинаковые).
Writeln(string.Compare('Арбуз!', '-арбуз',
[TCompareOption.coIgnoreSymbols, TCompareOption.coIgnoreCase]));
//Сравнение цифр как чисел, а не как строки.
//В результате будет -1 (т.е. первое число меньше чем второе).
Writeln(string.Compare('2', '10', [TCompareOption.coDigitAsNumbers]));
//Сравнение цифр как строки.
//В результате будет 1 (т.е. строка 1 сортируется после строки 2).
Writeln(string.Compare('2', '10'));
//РегистроНЕзависимое сравнение с определённым языком и регионом. В результате будет 0 (т.е. строки 1 и 2 одинаковые).
Writeln(string.Compare('Арбуз', 'арбуз', true, TLanguages.GetLocaleIDFromLocaleName('ru-RU')));
//Сравнение двух строк в двух экземплярах класса TStringBuilder (регистрозависимое).
stringBuilder1 := TStringBuilder.Create('Арбуз');
try
stringBuilder2 := TStringBuilder.Create('арбуз');
try
//Результат будет FALSE.
Writeln(stringBuilder1.Equals(stringBuilder2));
//Результат будет TRUE.
stringBuilder2.Clear;
stringBuilder2.Append('Арбуз');
Writeln(stringBuilder1.Equals(stringBuilder2));
finally
stringBuilder2.Free;
end;
finally
stringBuilder1.Free;
end;
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Теперь давайте посмотрим, как можно найти подстроку (определённую последовательность символов) в строке. Здесь у вас есть большой выбор функций, которые возвращают либо индекс найденной подстроки, либо true или false в зависимости от того, найдена подстрока в строке или нет. Итак, давайте перечислим все функции для поиска подстроки:
В первую очередь – это функция Pos, которая ищет подстроку, начиная с указанного номера символа. Функция осуществляет регистрозависимый поиск. Здесь нумерация символов начинается с 1. Если подстрока найдена, то возвращается номер первого символа найденной подстроки, иначе – 0. Есть также функция PosEx (в юните System.StrUtils), которая работает абсолютно также. Вот пример использования функции Pos:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils;
begin
try
//Поиск с первого символа. В результате отобразится 8.
Writeln(Pos('строка', 'Первая строка, вторая строка', 1));
//Поиск с десятого символа. В результате отобразится 23.
Writeln(Pos('строка', 'Первая строка, вторая строка', 10));
//Поиск несуществующей подстроки. В результате отобразится 0.
Writeln(Pos('третья', 'Первая строка, вторая строка', 1));
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Аналогично функции Pos работают и функции IndexOf и LastIndexOf помощника TStringHelper. Они также осуществляют регистрозависимый поиск. Функция IndexOf ищет подстроку (или символ) с начала и до конца строки, а функция LasIndexOf – наоборот, т.е. с конца и до начала. Если подстрока найдена, то функции возвращают индекс первого символа найденной подстроки в строке. Здесь нумерация символов начинается с 0. Если подстрока не найдена, то функции возвращают -1. Также при поиске вы можете задать начало и интервал поиска. Вот примеры использования этих функций:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils;
begin
try
//Поиск с начала строки. В результате отобразится 7.
Writeln('Первая строка, вторая строка'.IndexOf('строка'));
//Поиск с десятого символа до конца. В результате отобразится 22.
Writeln('Первая строка, вторая строка'.IndexOf('строка', 9));
//Поиск несуществующей подстроки. В результате отобразится -1.
Writeln('Первая строка, вторая строка'.IndexOf('третья'));
//Поиск с начала только среди первых 10-ти символов. В результате отобразится -1.
Writeln('Первая строка, вторая строка'.IndexOf('строка', 0, 10));
//Поиск с начала только среди первых 20-ти символов. В результате отобразится 7.
Writeln('Первая строка, вторая строка'.IndexOf('строка', 0, 20));
//Поиск с конца строки. В результате отобразится 22.
Writeln('Первая строка, вторая строка'.LastIndexOf('строка'));
//Поиск с двадцать третьего символа и до начала. В результате отобразится 7.
Writeln('Первая строка, вторая строка'.LastIndexOf('строка', 22));
//Поиск с конца только среди последних 10 символов. В результате отобразится -1.
Writeln('Первая строка, вторая строка, третья'.LastIndexOf('строка', 36, 10));
//Поиск с конца только среди последних 20 символов. В результате отобразится 22.
Writeln('Первая строка, вторая строка, третья'.LastIndexOf('строка', 36, 20));
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Теперь рассмотрим функции для проверки, есть ли подстрока в строке, и не важно, в каком месте. Для этого есть функции ContainsStr и ContainsText в юните System.StrUtils, а также функция Contains в помощнике TStringHelper.Contains. Функции ContainsStr и TStringHelper.Contains – регистрозависимые, а функция ContainsText – нет. Вот примеры использования этих функций:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils, System.StrUtils;
begin
try
//В результате отобразится TRUE.
Writeln(ContainsStr('Раз, два, три, четыре, пять', 'Раз'));
//В результате отобразится FALSE.
Writeln(ContainsStr('Раз, два, три, четыре, пять', 'Два'));
//В результате отобразится TRUE.
Writeln(ContainsText('Раз, два, три, четыре, пять', 'Три'));
//В результате отобразится TRUE.
Writeln('Раз, два, три, четыре, пять'.Contains('четыре'));
//В результате отобразится FALSE.
Writeln('Раз, два, три, четыре, пять'.Contains('Пять'));
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Дополнительно есть функции проверяющие, наличие определённой подстроки в начале или в конце текста. Это функции StartsStr, StartsText, EndsStr и EndsText в юните System.StrUtils, а также функции StartsWith, EndsWith и EndsText у помощника TStringHelper. Функции StartsStr и EndsStr регистрозависимые, функции StartsText, EndsText и TStringHelper.EndsText регистронезависимые, а у функций TStringHelper.StartsWith и TStringHelper.EndsWith есть второй параметр для выбора режима поиска. Учтите, что регистронезависимый поиск в функции TStringHelper.StartsWith работает только с буквами латинского алфавита. По умолчанию поиск в функциях TStringHelper.StartsWith и TStringHelper.EndsWith регистрозависимый.
Обратите внимание, что регистронезависимый поиск в функциях StartsText, EndsText и TStringHelper.EndsText и TStringHelper.EndsWith ведётся для текущей локали. Т.е. если на компьютере будет установлена английская локаль, то регистронезависимый поиск по русскому тексту работать не будет.
Вот примеры использования функций:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils, System.StrUtils;
begin
try
//Ищем подстроку в начале строки. Результат будет TRUE.
Writeln(StartsStr('Раз', 'Раз, два, три'));
//Ищем подстроку в начале строки. Результат будет FALSE.
Writeln(StartsStr('раз', 'Раз, два, три'));
//Ищем подстроку в начале строки. Результат будет FALSE.
Writeln(StartsStr('два', 'Раз, два, три'));
//Ищем подстроку в начале строки. Результат будет TRUE.
Writeln(StartsText('Раз', 'Раз, два, три'));
//Ищем подстроку в начале строки. Результат будет TRUE.
Writeln(StartsText('раз', 'Раз, два, три'));
//Ищем подстроку в начале строки. Результат будет FALSE.
Writeln(StartsText('два', 'Раз, два, три'));
//Ищем подстроку в начале строки. Результат будет TRUE.
Writeln('Раз, два, три'.StartsWith('Раз'));
//Ищем подстроку в начале строки. Результат будет FALSE.
Writeln('Раз, два, три'.StartsWith('раз'));
//Ищем подстроку в начале строки. Результат будет FALSE (для кириллицы).
Writeln('Раз, два, три'.StartsWith('раз', true));
//Ищем подстроку в начале строки. Результат будет TRUE (для латиницы).
Writeln('One, two, three'.StartsWith('one', true));
//Ищем подстроку в начале строки. Результат будет FALSE.
Writeln('Раз, два, три'.StartsWith('два'));
//Ищем подстроку в конце строки. Результат будет TRUE.
Writeln(EndsStr('три', 'Раз, два, три'));
//Ищем подстроку в конце строки. Результат будет FALSE.
Writeln(EndsStr('Три', 'Раз, два, три'));
//Ищем подстроку в конце строки. Результат будет FALSE.
Writeln(EndsStr('два', 'Раз, два, три'));
//Ищем подстроку в конце строки. Результат будет TRUE.
Writeln(EndsText('три', 'Раз, два, три'));
//Ищем подстроку в конце строки. Результат будет TRUE.
Writeln(EndsText('Три', 'Раз, два, три'));
//Ищем подстроку в конце строки. Результат будет FALSE.
Writeln(EndsText('два', 'Раз, два, три'));
//Ищем подстроку в конце строки. Результат будет TRUE.
Writeln(string.EndsText('три', 'Раз, два, три'));
//Ищем подстроку в конце строки. Результат будет TRUE.
Writeln(string.EndsText('Три', 'Раз, два, три'));
//Ищем подстроку в конце строки. Результат будет FALSE.
Writeln(string.EndsText('два', 'Раз, два, три'));
//Ищем подстроку в конце строки. Результат будет TRUE.
Writeln('Раз, два, три'.EndsWith('три'));
//Ищем подстроку в конце строки. Результат будет FALSE.
Writeln('Раз, два, три'.EndsWith('Три'));
//Ищем подстроку в конце строки. Результат будет TRUE.
Writeln('Раз, два, три'.EndsWith('Три', true));
//Ищем подстроку в конце строки. Результат будет FALSE.
Writeln('Раз, два, три'.EndsWith('два'));
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
И конечно самые продвинутые условия для поиска подстрок можно задавать при помощи регулярных выражений. Для этого есть функции TRegEx.Match и TRegEx.Matches. Вот несколько примеров использования этих функций:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils, System.RegularExpressions;
var
regEx: TRegEx;
match: TMatch;
matches: TMatchCollection;
begin
try
//Ищем в строке любой IP-адрес, с начала строки.
regEx := TRegEx.Create('\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b');
match := regEx.Match('В этой строке два IP-адреса 192.168.1.1 и 192.168.1.15');
//Найдена ли подстрока. Результат будет TRUE.
Writeln(match.Success);
//Номер первого символа найденной подстроки. Результат будет 29.
Writeln(match.Index);
//Длина найденной подстроки. Результат будет 11.
Writeln(match.Length);
//Найденная подстрока. Результат будет 192.168.1.1.
Writeln(match.Value);
//Ищем следующий IP-адрес в этой же строке.
match := match.NextMatch;
//Найдена ли следующая подстрока. Результат будет TRUE.
Writeln(match.Success);
//Номер первого символа найденной подстроки. Результат будет 43.
Writeln(match.Index);
//Длина найденной подстроки. Результат будет 12.
Writeln(match.Length);
//Найденная подстрока. Результат будет 192.168.1.15.
Writeln(match.Value);
//Ищем следующий IP-адрес в этой же строке.
match := match.NextMatch;
//Найдена ли следующая подстрока. Результат будет FALSE.
Writeln(match.Success);
//Ищем адреса почтовых ящиков в тексте, игнорируя регистр.
regEx := TRegEx.Create('\b[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,}\b', [roIgnoreCase]);
matches := regEx.Matches('В этой Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
строке Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
содержатся три Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
почтовых адреса.');
//В результате будет выдано три адреса:
//Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
//Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
//Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
for match in matches do
Writeln(match.Value);
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Примеры и описание регулярных выражений смотрите на сайте библиотеки PCRE.
Случается, что нужно найти определённые символы в строке. Конечно, для этого вы можете воспользоваться функциями для поиска подстроки, о которых было написано выше, но есть и специальные функции, позволяющие найти первый попавшийся в строке символ из нескольких искомых. Это функции помощника TStringHelper: IndexOfAny, IndexOfAnyUnquoted и LastIndexOfAny. Функции IndexOfAny и IndexOfAnyUnquoted ищут, перебирая символы сначала до конца строки, а функция LastIndexOfAny – наоборот. Во всех функциях можно указать интервал поиска. Функция IndexOfAnyUnquoted умеет игнорировать символы, заключенные в кавычки, скобки и т.п. Вот пример использования этих функций:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils, System.StrUtils, Winapi.Windows;
begin
try
//Ищем символ 'р' или 'о'. В результате будет 2.
Writeln('Это строка!'.IndexOfAny(['р', 'о']));
//Ищем символ 'р' или 'о' начиная с пятого символа. В результате будет 6.
Writeln('Это строка!'.IndexOfAny(['р', 'о'], 4));
//Ищем символ 'р' или 'о' с пятого по шестой символ. В результате будет -1.
Writeln('Это строка!'.IndexOfAny(['р', 'о'], 4, 2));
//Ищем символ 'р' или 'о' с конца строки. В результате будет 7.
Writeln('Это строка!'.LastIndexOfAny(['р', 'о']));
//Ищем символ 'р' или 'о' начиная с пятого символа и до начала. В результате будет 2.
Writeln('Это строка!'.LastIndexOfAny(['р', 'о'], 4));
//Ищем символ 'р' или 'о' с пятого по третий символ. В результате будет 2.
Writeln('Это строка!'.LastIndexOfAny(['р', 'о'], 4, 3));
//Ищем символ 'р' или 'о', но не среди символов заключенных в кавычки. В результате будет 8.
Writeln('"Это" строка!'.IndexOfAnyUnquoted(['р', 'о'], '"', '"'));
//Ищем символ 'р' или 'о', но не среди символов заключенных в скобки, в том числе вложенных. В результате будет 17.
Writeln('(Это (вторая)) строка!'.IndexOfAnyUnquoted(['р', 'о'], '(', ')'));
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Для поиска и замены подстроки (или символа) в строке можно использовать функции StringReplace, ReplaceStr и ReplaceText, TStringHelper.Replace, TStringBuilder.Replace и TRegEx.Replace. Функции ReplaceStr и TStringBuilder.Replace – регистрозависимые, функция ReplaceText – регистронезависимая, в функциях StringReplace, TStringHelper.Replace и TRegEx.Replace зависимость от регистра настраивается флажком rfIgnoreCase. Функции TRegEx.Replace ищут подстроку, используя регулярные выражения. В функции TStringBuilder.Replace можно задать диапазон поиска подстроки. Вот примеры использования этих функций:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils, System.StrUtils, System.RegularExpressions;
var
stringBuilder: TStringBuilder;
regEx: TRegEx;
begin
try
//Ищет все подстроки в строке и заменяет их на новые (регистрозависимый поиск).
//В результате будет 'Раз, два, три, два'.
Writeln(ReplaceStr('Раз, четыре, три, четыре', 'четыре', 'два'));
//Ищет все подстроки в строке и заменяет их на новые (регистрозависимый поиск).
//В результате будет 'Раз, Четыре, три, два'.
Writeln(ReplaceStr('Раз, Четыре, три, четыре', 'четыре', 'два'));
//Ищет все подстроки в строке и заменяет их на новые (регистронезависимый поиск).
//В результате будет 'Раз, два, три, два'.
Writeln(ReplaceText('Раз, четыре, три, четыре', 'четыре', 'два'));
//Ищет все подстроки в строке и заменяет их на новые (регистронезависимый поиск).
//В результате будет 'Раз, два, три, два'.
Writeln(ReplaceText('Раз, Четыре, три, четыре', 'четыре', 'два'));
//Ищет только первую подстроку в строке и заменяет её на новую.
//В результате будет 'Раз, два, три, четыре'.
Writeln(StringReplace('Раз, четыре, три, четыре', 'четыре', 'два', []));
//Ищет все подстроки в строке и заменяет их на новые.
//В результате будет 'Раз, два, три, два'.
Writeln(StringReplace('Раз, четыре, три, четыре', 'четыре', 'два', [rfReplaceAll]));
//Пример регистрозависимого поиска и замены подстрок.
//В результате будет 'Раз, Четыре, три, два'.
Writeln(StringReplace('Раз, Четыре, три, четыре', 'четыре', 'два', [rfReplaceAll]));
//Пример регистронезависимого поиска и замены подстрок.
//В результате будет 'Раз, два, три, два'.
Writeln(StringReplace('Раз, Четыре, три, четыре', 'четыре', 'два', [rfReplaceAll, rfIgnoreCase]));
//Ищет все подстроки в строке и заменяет их на новые
//(т.к. по умолчанию установлен флаг rfReplaceAll).
//В результате будет 'Раз, два, три, два'.
Writeln('Раз, четыре, три, четыре'.Replace('четыре', 'два'));
//Ищет только первую подстроку в строке и заменяет её на новую
//(т.к нет флага rfReplaceAll).
//В результате будет 'Раз, два, три, четыре'.
Writeln('Раз, четыре, три, четыре'.Replace('четыре', 'два', []));
//Пример регистрозависимого поиска и замены подстрок
//(т.к. по умолчанию не установлен флаг rfIgnoreCase).
//В результате будет 'Раз, Четыре, три, два'.
Writeln('Раз, Четыре, три, четыре'.Replace('четыре', 'два'));
//Пример регистронезависимого поиска и замены подстрок
//(т.к. установлен флаг rfIgnoreCase).
//В результате будет 'Раз, два, три, четыре'.
Writeln('Раз, Четыре, три, четыре'.Replace('четыре', 'два', [rfIgnoreCase]));
stringBuilder := TStringBuilder.Create;
try
//Ищет все подстроки в строке и заменяет их на новые.
//Результат будет 'Раз, два, три, два'.
stringBuilder.Append('Раз, четыре, три, четыре');
Writeln(stringBuilder.Replace('четыре', 'два').ToString);
//Ищет все подстроки в строке и заменяет их на новые.
//Результат будет 'Раз, Четыре, три, два'.
stringBuilder.Clear;
stringBuilder.Append('Раз, Четыре, три, четыре');
Writeln(stringBuilder.Replace('четыре', 'два').ToString);
//Ищет все подстроки начиная с 4-го символа в пределах 10-ти символов и заменяет их на новые.
//Результат будет 'Раз, два, три, четыре'.
stringBuilder.Clear;
stringBuilder.Append('Раз, четыре, три, четыре');
Writeln(stringBuilder.Replace('четыре', 'два', 3, 10).ToString);
finally
stringBuilder.Free;
end;
//Ищем и убираем HTML тэги из строки.
//В результате получится: Здесь содержатся выделенное и подчёркнутое слова и ссылка.
regEx := TRegEx.Create('<([A-Z][A-Z0-9]*)\b[^>]*>(.*?)</\1>', [roIgnoreCase]);
Writeln(regEx.Replace('Здесь содержатся <b>выделенное</b> и <u>подчёркнутое</u> слова и <a href="http://www.proghouse.ru">ссылка</a>.', '\2'));
//Ищем определённое слово и заменяем его звёздочками.
//В результате получится: Закрываем *** слова звёздами. *** слов не будет! *** слово - это ***!
regEx := TRegEx.Create('плох[ио][емх]?', [roIgnoreCase]);
Writeln(regEx.Replace('Закрываем плохие слова звёздами. Плохих слов не будет! Плохое слово - это плохо!', '***'));
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Для такой часто встречающейся операции, как удаление пробелов и управляющих символов в начале и в конце строки, есть несколько функций: Trim, TrimLeft, TrimRight, TStringHelper.Trim, TStringHelper.TrimLeft и TStringHelper.TrimRight. При вызове функций TStringHelper.Trim, TStringHelper.TrimLeft и TStringHelper.TrimRight вы можете перечислить, какие символы нужно удалять. Вот пример использования этих функций:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils;
begin
try
//Удаляем пробелы и управляющие символы в начале и конце строки.
//Результат будет 'Строка без лишних пробелов и управляющих символов!'.
Writeln(Trim(#13#10' Строка без лишних пробелов и управляющих символов! '#13#10));
//Удаляем пробелы и управляющие символы в начале и конце строки.
//Результат будет 'Строка без лишних пробелов и управляющих символов!'.
Writeln(#13#10' Строка без лишних пробелов и управляющих символов! '#13#10.Trim);
//Удаляем только символы #13 и #10 в начале и конце строки.
//Результат будет ' Строка без лишних пробелов и управляющих символов! '.
Writeln(#13#10' Строка без лишних пробелов и управляющих символов! '#13#10.Trim([#13, #10]));
//Удаляем пробелы и управляющие символы только в начале строки.
//Результат будет 'Строка без лишних пробелов и управляющих символов! '#13#10.
Writeln(TrimLeft(#13#10' Строка без лишних пробелов и управляющих символов! '#13#10));
//Удаляем пробелы и управляющие символы только в начале строки.
//Результат будет 'Строка без лишних пробелов и управляющих символов! '#13#10.
Writeln(#13#10' Строка без лишних пробелов и управляющих символов! '#13#10.TrimLeft);
//Удаляем пробелы и управляющие символы только в конце строки.
//Результат будет #13#10' Строка без лишних пробелов и управляющих символов!'.
Writeln(TrimRight(#13#10' Строка без лишних пробелов и управляющих символов! '#13#10));
//Удаляем пробелы и управляющие символы только в конце строки.
//Результат будет #13#10' Строка без лишних пробелов и управляющих символов!'.
Writeln(#13#10' Строка без лишних пробелов и управляющих символов! '#13#10.TrimRight);
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
И напоследок ещё пара интересных функций, которые умеют дополнять строку пробелами или другими символами, пока она не станет нужной длины. Это функции TStringHelper.PadLeft и TStringHelper.PadRight. С помощью этих функций, например, для лучшего восприятия можно добавить пробелы в начало чисел, которые вы выдаёте столбиком в консоли или дополнить числа ведущими нулями. Вот пример использования этих функций:
program Project1;
{$APPTYPE CONSOLE}
{$R *.res}
uses
System.SysUtils;
begin
try
//Дополняем числа пробелами. В результате получится:
//' 123'
//'12345'
//' 1234'
Writeln('123'.PadLeft(5));
Writeln('12345'.PadLeft(5));
Writeln('1234'.PadLeft(5));
//Дополняем числа нулями. В результате получится.
//'00123'
//'12345'
//'01234'
Writeln('123'.PadLeft(5, '0'));
Writeln('12345'.PadLeft(5, '0'));
Writeln('1234'.PadLeft(5, '0'));
//Дополняем строки чёрточками, чтобы сделать красивое содержание.
//В результате получится:
//'Вступление --------- стр. 1'
//'Доклад ------------- стр. 2'
//'Выводы ------------- стр. 7'
//'Заключение --------- стр. 9'
Writeln('Вступление '.PadRight(20, '-') + ' стр. 1');
Writeln('Доклад '.PadRight(20, '-') + ' стр. 2');
Writeln('Выводы '.PadRight(20, '-') + ' стр. 7');
Writeln('Заключение '.PadRight(20, '-') + ' стр. 9');
Readln;
except
on E: Exception do
Writeln(E.ClassName, ': ', E.Message);
end;
end.
Вместо заключения
Итак, в статье я постарался собрать все возможные функции Delphi, которые постоянно нужны при работе со строками. Надеюсь, вы найдёте в этой статье что-то новое и интересное для себя. Если я упустил что-то важное на ваш взгляд, просьба не держать это в себе, а написать об этом в комментариях.
Комментарии
Pos тоже ищет с указанной позиции. Посмотрите справку по функциям Pos и PosEx.
На мой взгляд TStringBuilder совершенно бесполезен, учитывая что весь функционал продублирован другими, более удобными методами, где не надо создавать отдельный объект.
Кстати случайно обнаружил в последних версиях дельфей наличие модулей, которые инкапсулируют кучу Win32 вызовов, например IOUtils. Так что обзор по новым модулям был бы полезен
Готов обзор по юниту IOUtils: www.proghouse.ru/programming/126-ioutils
RSS лента комментариев этой записи