Теоретический материал (Паскаль)
Сайт: | Информатикс |
Курс: | Типы данных |
Книга: | Теоретический материал (Паскаль) |
Напечатано:: | Гость |
Дата: | Пятница, 27 Июнь 2025, 18:04 |
Тип данных char. Операции над символами
В большинстве применений компьютера алфавитно-цифровая информация используется наряду с числовой. Прежде чем мы сможем написать программу, которая манипулирует алфавитно-цифровыми знаками (литерами), нам потребуется тип данных для их представления. Для этих целей в языке Паскаль предусмотрен тип данных char.
Так же, как переменная типа integer может хранить одно целое число, переменная типа char может хранить один символ.
Например,
Var
|
Первый оператор присваивания записывает в переменную Alpha литеру р.
Второй делает Alpha равной литере плюса (+).
Третий делает Alpha равной символу 3. Заметим, что символ 3 отличается от целого числа 3 тем, что символ не может быть использован в арифметических операциях.
Четвертый оператор присваивания делает Alpha равной литере пробела. Хотя литера пробела при печати не изображается, она является обыкновенным значением типа char.
Последний оператор присваивания делает Alpha равной литере апострофа, это специальный случай, так как знак апострофа используется для ограничения значения типа char.
Мы будем пользоваться множеством литер, находящимся в таблице кодов, называемой ASCII - американский стандартный код обмена информацией.
Все символы упорядочены, т.к. имеют свой личный номер. Важно, что соблюдаются следующие отношения:
'A' < 'B' < 'C' < ... < 'X' < 'Y' < 'Z' '0' < '1' < '2' < ... < '7' < '8' < '9'
Для проверки равенства или неравенства переменных типа char могут использоваться операторы сравнения.
Задача. Написать программу, которая считывает две литеры и печатает больше, равна или меньше первая литера второй.
Program Sravnenie;
|
Так как char - порядковый тип, то к его значениям применимы следующие функции.
Succ - возвращает следующий символ литерного множества;
Pred - возвращает предыдущий символ литерного множества;
Ord - возвращает значение кода литеры;
Chr - возвращает значение литеры по ее коду, является обратной по отношению к функции Ord.
Например,
Succ('0')='1' - символ, следующий за символом 0, равен символу 1.
Pred('3')='2' - символ, предшествующий символу 3, равен 2;
Chr(65)='A' - символ, соответствующий коду 65, равен А;
Ord('A')=65 - код символа А равен 65.
Строка. Тип данных string. Строковые переменные, их описание. Длина строки. Операции над строками
Строка (string) - это последовательность литер. Литерные строки уже использовались нами в качестве аргументов операторa write при изучении темы "Ввод-вывод". Теперь познакомимся с ними подробнее.
Тип данных (string) определяет строки с максимальной длиной 255 символов. Переменная этого типа может принимать значения переменной длины.
Например,
MaxLine : string;
|
Строковая переменная может иметь атрибут длины, определяющий ее максимальную длину.
Текущая длина строковой переменной может быть определена с помощью встроенной функции Length. Для заданного значения типа string эта функция возвращает целое значение, показывающее количество литер в строке.
Выражения, в которых операндами служат строки, называются строковыми выражениями.
Над строками определены следующие операции:
1. Операция конкатенации (+) применяется для сцепления нескольких строк в одну.
Например,
SumStr := 'Турбо '+'Паскаль '+'7.0'
2. Операции отношения (=, <>, >, <, >=, <=) проводят посимвольное сравнение двух строк слева направо до первого несовпадающего символа. Большей считается та строка, в которой первый несовпадающий символ имеет больший номер в стандартной таблице обмена информацией. Результат выполнения операций отношения над строками всегда имеет булевский тип.
Например, выражение 'MS-DOS'<'MS-Dos' имеет значение True
Если строки имеют различную длину, но в их общей части символы совпадают, считается, что более короткая строка меньше, чем более длинная.
Строки считаются равными, если они совпадают по длине и содержат одни и те же символы на соответствующих местах в строке.
Для присваивания строковой переменной результата строкового выражения используется оператор присваивания. Если значение переменной после выполнения оператора присваивания превышает по длине максимально допустимую при описании величину, то все лишние символы справа отбрасываются.
Допускается смешение в одном выражении операндов строкового и символьного типа.
К отдельным символам строки можно обратиться по номеру (индексу) данного символа в строке.
Например, чтобы обратиться к третьему символу строки SumStr надо записать SumStr[3]. Запись SumStr[0] дает значение текущей длины строки.
Для эффективного программирования алгоритмов обработки текстов необходимо хорошо понимать внутреннюю структуру представления строк в памяти. Строки реализованы достаточно просто. Для хранения строковых переменных выделяется количество байтов памяти, на единицу большее максимальной длины строки. Начальный байт этой памяти отводится для хранения текущей длины строки, следующие байты - для символов самой строки. Так как элементы строк стандартно нумеруются целыми числами, начиная с единицы, байт с длиной строки можно считать нулевым ее элементом. Такая структура памяти допускает прямой доступ к ее элементам.
Важно отметить, что имеется возможность динамически управлять текущей длиной строки. Следующая программа показывает автоматическое изменение длины строки после тех или иных операций с нею. Обратите внимание, что общий (определяемый с помощью стандартной функции SizeOf) размер памяти, отведенной для хранения строки все время остается неизменным.
Program StringLength;
|
Внимание! При решении задач со строковыми переменными Вы можете столкнуться с распространенной трудно обнаруживаемой ошибкой, когда после присваивания некоторым элементам строки символов ни содержимое, ни длина строки не изменяются. Разберемся, с чем это связано.
Очень важно понимать, что при доступе к некоторому элементу строки значение ее текущей длины не проверяется. Это иллюстрирует следующая программа:
Program StringElements;
|
Присваивание пятому элементу строки некоторого значения не изменяет длину строки, что подтверждает вывод на экран ее содержимого и длины (конечно само присваивание реально произошло, но на значение текущей длины строки в нулевом байте это никакого влияния не оказало). Работа с элементами строки без учета ее текущей длины и является ошибкой программиста. Посмотрите следующую программу:
Program StringElements2;
|
Предполагается, что данная программа должна сформировать строку из 26 символов, содержимым которой является последовательность заглавных букв латинского алфавита. Однако вызов процедуры writeln показывает, что содержимым переменной Str будет строка из одного символа 'А'. Природа совершенной ошибки заключается в том, что присваивание значений элементам строки не влияет на текущую длину, которая была установлена равной 1 при первом присваивании. Поэтому правильной будет следующая программа:
Program stringElements3;
|
Операция конкатенации, как и все стандартные операции, работающие со строками, в отличие от поэлементного присваивания, изменяет длину строки, что дает корректный результат. Кроме того, вторая программа работает непосредственно с символами букв. Наконец, не следует забывать инициализировать строку перед ее заполнением (первый оператор программы). В противном случае, так как начальная длина строки является неопределенной, можно получить произвольный результат; не стоит рассчитывать на то, что в нулевом байте стоит ноль.
Для обработки строковых данных можно использовать встроенные процедуры и функции:
- Delete (Str, Poz, N) - удаление N символов строки Str, начиная с позиции Poz.
- Insert (What, Where, Poz) - вставка строки What в строку Where, начиная с позиции Poz.
- Copy (Str, Poz, Nstr) - выделяет подстроку длиной Nstr, начиная с позиции Poz, из строки Str.
- Concat (Str1, Str2, ..., StrN) - выполняет сцепление строк в том порядке, в каком указаны в списке параметров.
- Pos (What, Where) - обнаруживает первое появление подстроки What в строке Where.
- UpCase (Ch) - преобразует строчную букву в прописную.
- Str (Number, Stroka) - преобразует число в строку.
- Val (Stroka, Number, Code) - преобразует строку в число и выдает код правильности преобразования.
Стандартные функции для работы со строками (Сoncat, Сopy, Length, Pos, UpCase)
Функция Length
Встроенная функция Length (длина) позволяет определить фактическую длину текстовой строки, хранящейся в указанной переменной (а не величину предельного размера строки, установленную при декларации):
Program DemoFunctionLength; |
Примечание. При подсчете фактической длины строки учитываются все входящие в нее символы, в том числе и пробелы.
Функция Upcase
Функция Upcase позволяет преобразовывать символ любой литеры из строчного в прописной. Эта функция рассчитана на обработку отдельного символа, поэтому для обработки строки символов с помощью этой функции приходится организовывать цикл.
Program DemoFunctionUpcase; |
В результате работы программы на терминал выдается строка, содержащая большие английские буквы и маленькие русские.
Примечание. Русские литеры не могут обрабатываться этой функцией.
Для того, чтобы преобразовать в заглавные строчные буквы русского алфавита, применяют оператор выбора Case:
. . . |
Функция Copy
Функция Copy позволяет копировать фрагмент некоторой строки из одной переменной в другую. Вызывая эту функцию, нужно указать следующие параметры:
- имя строки, из которой должен извлекаться копируемый фрагмент,
- позицию в строке, начиная с которой будет копироваться фрагмент,
- число копируемых символов.
Program DemoFunctionCopy; |
Примечание. Если начальная или конечная позиции копируемого текста находятся вне пределов исходной строки символов, то сообщение об ошибке не выдается. Результатом выполнения операции в первом случае будет строка нулевой длины, во втором - фрагмент от начальной позиции копирования до конца исходной строки.
Функция Pos
C помощью функции Pos Вы можете осуществить поиск некоторого фрагмента в строке. Если заданный фрагмент в строке присутствует, то функция возвращает номер позиции, с которой он начинается. Если фрагмент не найден, то функция возвращает нуль.
Program DemoFunctionPos; |
Примечание. Функция Pos требует полного совпадения искомого фрагмента и фрагмента строки, в которой производится поиск, причем большие и маленькие буквы считаются различными символами.
Функция Concat
Функция Concat (Str1, Str2, ..., StrN) выполняет конкатенацию (или сцепление) строк Str1, Str2, ..., StrN в том порядке, в каком они указаны в списке параметров. Общее количество символов всех сцепленных строк не должно превышать 255.
Program DemoFunctionConcat; |
Стандартные процедуры для работы со строками (Delete, Insert, Str, Val)
Процедура Insert
Процедура Insert вставляет в исходную строку, начиная с указанной позиции, какую-либо другую строку. Оператор Insert(Word1, Word2, 5) указывает, что строку Word1 необходимо вставить в строку Word2, начиная с 5-ой позиции.
Процедура Delete
Процедура Delete удаляет из исходной строки фрагмент определенной длины, начиная с указанной позиции. Так, оператор Delete(Word1, 2, 3) удаляет из указанной строки фрагмент длиной в три символа, начиная со второго.
Процедура Str
Общий вид Str(Chislo, Stroka)
Процедура Str преобразовывает числовое значение переменной Chislo в строковую переменную Stroka. После первого параметра может указываться формат, аналогичный формату вывода.
Program DemoProcedureStr;
|
Процедура Val
Общий вид Val(Stroka, Chislo, Code)
Процедура Val преобразует значение строки Stroka в величину целочисленного или вещественного типа и помещает результат в Chislo. Значение строковой переменной Stroka не должно содержать пробелов в начале и в конце. Code – целочисленная переменная. Если во время операции преобразования ошибки не обнаружено, значение Code равно нулю, если же ошибка обнаружена, Code будет содержать номер позиции первого ошибочного символа, а значение Chislo будет не определено.
Program DemoProcedureVal;
|