Что такое лексема в программировании
Перейти к содержимому

Что такое лексема в программировании

  • автор:

Учебники. Программирование для начинающих.

Programm.ws — это сайт, на котором вы можете почитать литературу по языкам программирования , а так-же посмотреть примеры работающих программ на С++, ассемблере, паскале и много другого..

Программирование — в обычном понимании, это процесс создания компьютерных программ.
В узком смысле (так называемое кодирование) под программированием понимается написание инструкций — программ — на конкретном языке программирования (часто по уже имеющемуся алгоритму — плану, методу решения поставленной задачи). Соответственно, люди, которые этим занимаются, называются программистами (на профессиональном жаргоне — кодерами), а те, кто разрабатывает алгоритмы — алгоритмистами, специалистами предметной области, математиками.
В более широком смысле под программированием понимают весь спектр деятельности, связанный с созданием и поддержанием в рабочем состоянии программ — программного обеспечения ЭВМ. Более точен современный термин — «программная инженерия» (также иначе «инженерия ПО»). Сюда входят анализ и постановка задачи, проектирование программы, построение алгоритмов, разработка структур данных, написание текстов программ, отладка и тестирование программы (испытания программы), документирование, настройка (конфигурирование), доработка и сопровождение.

Pascal

Borland Pascal 7.0 & Objects. Руководство по языку

Глава 2. Лексемы

Лексемы — это минимальные значимые единицы текста в программе, написанной на Паскале. Они представлены такими категориями как специальные символы, идентификаторы, метки, числа и строковые константы.

Программа, написанная на Паскале, состоит из лексем и разделителей, причем разделитель представляет собой пробел или комментарий. Две соседние лексемы, если они представляют собой зарезервированное слово, идентификатор, метку или число, должны быть отделены друг от друга одним и несколькими разделителями.

Примечание: Разделители не могут быть частью лексем, за исключением строковых констант.

Специальные символы

Borland Pascal использует следующие подмножества набора символов кода ASCII:

* Буквы — буквы английского алфавита от A до Z и от a до z.

* Цифры — арабские цифры от 0 до 9.

* Шестнадцатиричные цифры — арабские цифры от 0 до 9, буквы от A до F и буквы от a до f.

* Разделители — символ пробела (ASCII 32) и все управляющие символы кода ASCII (ASCII 0-31), включая символ конца строки или символ возврата (ASCII 13).

ЪДДДї ЪДДДї ЪДДДї ЪДДДї

і A і . і Z і і a і . і z і

АДВДЩ АДВДЩ АДВДЩ АДВДЩ

АДДДДДДДД>і цифра іДДДДДДДДДДДДДДДДДДДДДДДДДї

і АДДДДДДДДДДДЩ і

ЪДДДї ЪДДДї ЪДДДї ЪДДДї і

і A і .. і F і і a і . і f і і

АДВДЩ АДВДЩ АДВДЩ АДВДЩ і

Специальные символы и зарезервированные слова представляют собой символы, имеющие одно или несколько фиксированных значений.

Специальными символами являются следующие одиночные символы:

Следующие пары символов также представляют собой специальные символы:

Кроме того, некоторые специальные символы являются знаками операций. Левая квадратная скобка ([) эквивалентна паре символов, состоящей из левой круглой скобки и точки ((.). Аналогично правая квадратная скобка (]) эквивалентна паре символов, состоящей из точки и правой круглой скобки (.)).

Зарезервированные слова и стандартные директивы Borland Pascal

Следующие слова являются зарезервированными в Borland Pascal:

Зарезервированные слова Borland Pascal Таблица 1.1

and exports mod shr

array file nil string

asm for not then

begin function object to

case goto of type

const if or unit

consatructor implementation packed until

destructor in procedure uses

div inherited program var

do inline record while

downto interface repeat with

else label set xor

end library shl

В настоящем руководстве зарезервированные слова записаны строчными буквами. Однако, для Borland Pascal безразличен регистр клавиатуры, поэтому вы можете использовать в своей программе бук- вы как нижнего, так и верхнего регистра.

Далее приведены стандартные директивы Borland Pascal. В отличие от зарезервированных слов пользователь может их переопределить. Однако делать это не рекомендуется.

Стандартные директивы Borland Pascal Таблица 1.2

absolute far name resident

assembler forward near virtual

export index private

external interrupt public

Идентификаторы

Идентификаторы выступают в качестве имен констант, типов, переменных, процедур, модулей, программ и полей в записях.

Идентификатор может иметь любую длину, однако только первые его 63 символа являются значимыми. Идентификатор должен начинаться с буквы и не может содержать пробелов. После первого символа идентификатора можно использовать буквы, цифры и символы подчеркивания (значение ASCII $5F). Как и в зарезервированных словах, в идентификаторах можно использовать как строчные, так и прописные буквы (компилятор их не различает).

Идентификатор должен начинаться с буквы и не должен содержать пробелов. После первого символа допускаются буквы, цифры и символ подчеркивания (ASCII $5F). Как и зарезервированные слова, идентификаторы безразличны к регистру клавиатуры.

Когда имеется несколько мест с указанием одного и того же идентификатора, для задания нужного идентификатора необходимо уточнить этот идентификатор с помощью идентификатора модуля. Например, для уточнения идентификатора Ident с помощью идентификатора модуля UnitName следует записать UnitNamt.Ident. Такой комбинированный идентификатор называется уточненным идентификатором.

Примечание: Модули описываются в Главе 7 «Руководства пользователя» и в Главе 10 данного руководства.

Идентификатор ДДВДДД>і буква іДДДДДДДДДДДДДДДДДДДДДДДДДВД>

і АДДДДДДДДДДДЩ ^ ^ і

і ЪДДДДДДДДДДДДДї і і і

АД>і символ ГДЩ і ЪДДДДДДДДДДДДДї і

іподчеркиванияі ГДДДґ буква і

АДДДДДДДДДДДДДЩ і АДДДДДДДДДДДДДЩ і

і ЪДДДДДДДДДДДДДї і

і АДДДДДДДДДДДДДЩ і

і ЪДДДДДДДДДДДДДї і

символ подчеркиванияДДДДД>і _ іДДДДД>

идентификатор программы ЪДДДДДДДДДДДДДї

идентификатор модуля ДДДДД>іидентификаторіДДДД>

идентификатор поля АДДДДДДДДДДДДДЩ

уточненный ДДВДДДДДДДДДДДДДДДДДДДДДДДДДДДґ идентификатор ГДД>

идентификатор і ^ АДДДДДДДДДДДДДДДЩ

і ЪДДДДДДДДДДДДДї ЪДДДї і

і модуля і АДДДЩ

Приведем несколько примеров идентификаторов:

Числа

Для чисел, представляющих собой константы целого и вещественного типа, используется обычная десятичная запись. Целая константа в шестнадцатиричном формате имеет в качестве префикса знак доллара ($). Техническое обозначение (E или е с показателем степени) в вещественных типах читается, как «на десять в степени».

Например, 7E-2 означает 7х10^-2, а 12.25E+6 или 12.25E6 оба обозначают 12.25х10^+6. Синтаксические диаграммы для записи чисел приведены ниже.

шестнадцатиричных ^ і цифра і і

цифр і АДДДДДДДДДДДДДДДДДЩ і

последовательность ДДДДДДДД>і цифра ГДДДДДДДВДДД>

цифр ^ АДДДДДДДДДДДДДДДДДЩ і

целые без знака ДДДДВДДДД>іпоследовательностьГДДДДДДДДДДД>

і АДДДДДДДДДДДДДДДДДДЩ і

і ЪДДДї ЪДДДДДДДДДДДДДДБДДДї

АДДДЩ ішестнадцатиричных і

знак ДВДДД>і + ГДДДДДДД>

вещественное без знака

і ЪДДДДДДДДДДї ЪДДДї ЪДДДДДДДДДДї

ітельность і і АДДДЩ ітельность і і ^

і цифр і і і цифр і і і

АДДДДДДДДДДЩ і АДДДДДДДДДДЩ і і

і v ЪДДДДДДДДДДї і

і ЪДДДї ЪДДДДДДДДДДДДДДДДДДї

АДДДДДДДВД>і E ГДДДДДВДДДДДДДДДДДД>іпоследовательностьГДД>

і АДДДЩ ^ і ^ і цифр і

і ЪДДДї і і ЪДДДДї і АДДДДДДДДДДДДДДДДДДЩ

АД>і е ГДЩ АД>ізнакГДДЩ

число без знака

АДДДДДДДДДДДВД>іцелое без знакаГДДДДДДДД>

і ЪДДДДДДДДДДДДї і

число со знаком

АДДДДДДДДВДДДДДДДДДДДДДДДД>ічисло без знакаГДДДД>

Числа с десятичными точками или показателями степени представляют собой константы вещественного типа. Остальные десятичные числа обозначают константы целого типа. Они должны принимать значения в диапазоне от -2147483648 до 2147483647.

Шестнадцатиричные числа обозначают константы целочисленного типа. Они должны находиться в диапазоне от $00000000 до $FFFFFFFF. Окончательный знак значения определяется шестнадцатиричной записью.



Метки

Меткой является последовательность цифр в диапазоне от 0 до 9999. Начальные нули не являются значащими. Метки используются с операторами перехода goto.

Метка ДДДДДДДВДДДДДДДД>і последовательность ГДДДДДДДДДД>

і АДДДДДДДДДДДДДДДДДДДДДДЩ і

і ЪДДДДДДДДДДДДДї і

Как расширение стандартного Паскаля, Borland Pascal позволяет использовать в качестве меток идентификаторы функций.

Строки символов

Строка символов представляет собой последовательность, содержащую ноль и более символов из расширенного набора символов кода ASCII, записанную в одной строке программы и заключенную в одиночные кавычки (апострофы). Строка символов, ничего не содержащая между апострофами, называется нулевой строкой. Два последовательных апострофа в строке символов обозначают один символ — апостроф. Атрибут длины строки символов выражается действительным количеством символов между апострофами, например:

В качестве расширения стандартного Паскаля, Borland Pascal разрешает вставлять в строку символов управляющие символы. Символ # с целой константой без знака в диапазоне от 0 до 255 обозначает соответствующий этому значению символ в коде ASCII. Между символом # и целой константой не должно быть никаких разделителей.

Аналогично, если несколько управляющих символов входит строку символов, то между ними не должно быть разделителей.

Приведем несколько примеров строк символов:

строка символов ДДДДВДД>і строка в кавычках ГДДДВДВ>

^ і АДДДДДДДДДДДДДДДДДДДДДДЩ і і

і і ЪДДДДДДДДДДДДДДДДДДДДДДї і і

і АДД>і управляющая строка ГДДДЩ і

і АДДДДДДДДДДДДДДДДДДДДДДЩ і

строка ДДДДДД>і ‘ ГДДДДДДДДДДДДДДВДДДД>і ‘ ГДДДД>

в кавычках АДДДЩ ^ ЪДДДДДДї і АДДДЩ

символ строки ДДДВДД>ілюбой символ, кроме ‘ ГДДДДДДД>

і АДДДДДДДДДДДДДДДДДДДДДДЩ і

і ЪДДДї ЪДДДї і

АДДДДДДД>і ‘ ГДДДДДД>і ‘ ГДДДДДЩ

символ строки ДДДДДД>і # ГД>і беззнаковое целое ГДВДД>

^ АДДДЩ АДДДДДДДДДДДДДДДДДДДЩ і

Примечание: CR — символ возврата каретки.

Длина символьной строки — это фактическое число символов в строке. Строка символов любой длины совместима с любым строковым типом и, при разрешении директивой расширенного синтаксиса, с типом PChar.. Кроме того, строка символов с длиной, равной 1, совместима с любым типом Char. Строка символов длиной n, где n больше или равен 1, допустима для любого строкового типа и упакованных массивов из n символов.



Комментарии

Следующие конструкции представляют собой комментарии и поэтому игнорируются компилятором:

(* любой текст, не содержащий звездочку/правую круглую

Примечание: Общее описание директив компилятора дано в Главе 2 «Справочного руководства программиста».

Строки программы

В Borland Pascal строки программы имеют максимальную длину в 126 символов.

что такое лексема языка программирования

Лексема языка программирования является основным строительным блоком для создания программного кода. В простых словах, лексема представляет собой минимальную единицу языка программирования, которая имеет свое значение и используется для составления инструкций в программе.

Лексемы могут представлять различные элементы программного кода, такие как идентификаторы, ключевые слова, операторы, константы и разделители. Каждая лексема имеет свое семантическое значение и правила использования в контексте языка программирования.

Идентификаторы являются одним из типов лексем и используются для именования переменных, функций и других элементов программы. Они могут состоять из букв, цифр и некоторых специальных символов, в зависимости от языка программирования. Идентификаторы служат для уникальной идентификации элементов программы, их объявления и обращения к ним в коде.

Ключевые слова являются зарезервированными словами, имеющими специальное значение в языке программирования. Они используются для определения особых действий и операций в программе. Примеры ключевых слов могут включать “if”, “for”, “while” и “return”.

Операторы являются символами или комбинациями символов, которые выполняют определенные операции или выражают отношения между значениями. Примерами операторов являются математические операторы (+, -, *, /), операторы присваивания (=) и операторы сравнения (>,

Константы представляют фиксированные значения, которые не могут быть изменены во время выполнения программы. Примерами констант могут быть числа, строки или логические значения (true, false).

Разделители используются для разделения элементов программы и обозначения границ различных конструкций. Примерами разделителей являются скобки (), фигурные скобки <>, кавычки “” и точка с запятой ;.

В контексте языка программирования, лексемы играют важную роль, так как они помогают в создании структуры и синтаксически правильного кода. Компиляторы и интерпретаторы используют лексемы для анализа и выполнения программного кода.

В заключение, лексема языка программирования — это минимальная единица языка, имеющая свое значение и правила использования. Они включают идентификаторы, ключевые слова, операторы, константы и разделители. Понимание лексем помогает программистам создавать структурированный и синтаксически правильный код, что способствует успешному выполнению программы.

Ключевой запрос: “что такое лексема языка программирования”.

Лексема

Лексема — последовательность допустимых символов языка программирования, имеющая смысл для транслятора. Транслятор рассматривает программу как последовательность лексем.

См. также: Синтаксис языков программирования Трансляторы

Финансовый словарь Финам .

Синонимы:

  • Лек
  • Лексикографическая база данных

Смотреть что такое «Лексема» в других словарях:

  • ЛЕКСЕМА — [ Словарь иностранных слов русского языка
  • лексема — ы, ж. lexème m. < lexis слово, выражение, оборот речи. лингв. Единица словаря языка в совокупности ее словоизменительных форм и значений. Ляпсус. Наиболее вероятным кажется здесь французское и польское посредничество, которое вообще… … Исторический словарь галлицизмов русского языка
  • Лексема — ассоциативная группа, составляющаяся из отдельных слов (см. «Слово отд.»). Всякое слово может быть сходно с другим словом или целиком или какой либо своей частью (или частями). С другой стороны, сходство может быть в звуках или в значении или в… … Литературная энциклопедия
  • ЛЕКСЕМА — (от греч. lexis слово выражение), единица лексического уровня языка, слово во всей совокупности его лексических значений … Большой Энциклопедический словарь
  • ЛЕКСЕМА — ЛЕКСЕМА, ы, жен. В языкознании: отдельное слово во всей системе его значений и форм. | прил. лексемный, ая, ое. Л. анализ. Толковый словарь Ожегова. С.И. Ожегов, Н.Ю. Шведова. 1949 1992 … Толковый словарь Ожегова
  • лексема — сущ., кол во синонимов: 3 • прототермин (1) • слово (72) • терминоид (1) Словарь с … Словарь синонимов
  • Лексема — ЛЕКСЕМА ассоциативная группа, составляющаяся из отдельных слов (см. «Слово отд.»). Всякое слово может быть сходно с другим словом или целиком или какой либо своей частью (или частями). С другой стороны, сходство может быть в звуках или в… … Словарь литературных терминов
  • ЛЕКСЕМА — ЛЕКСЕМА. 1. Основная единица лексического строя языка, слово, рассматриваемое как единица номинации. 2. Звуковая или графическая сторона слова, воспринимаемая независимо от его содержания … Новый словарь методических терминов и понятий (теория и практика обучения языкам)
  • лексема — лексема. Произносится [лексэма] … Словарь трудностей произношения и ударения в современном русском языке
  • лексема — Языковая конструкция, по соглашению представляющая элементарную синтаксическую единицу. [ГОСТ 28397 89] Тематики языки программирования EN (lexical) tokenlexical unit … Справочник технического переводчика
  • Обратная связь: Техподдержка, Реклама на сайте
  • �� Путешествия

Экспорт словарей на сайты, сделанные на PHP,

WordPress, MODx.

  • Пометить текст и поделитьсяИскать в этом же словареИскать синонимы
  • Искать во всех словарях
  • Искать в переводах
  • Искать в ИнтернетеИскать в этой же категории

Поделиться ссылкой на выделенное

Прямая ссылка:

Нажмите правой клавишей мыши и выберите «Копировать ссылку»

Что такое лексема в программировании

24 февраля 2011

В информатике процесс аналитического разбора входной последовательности символов с целью получения на выходе последовательности символов, называемых «токенами». Группа символов входной последовательности, идентифицируемая на выходе процесса как токен, называется лексемой. В процессе лексического анализа производится распознавание и выделение лексем из входной последовательности символов.

Как правило, лексический анализ производится с точки зрения определённого формального языка или набора языков. Язык, а точнее его грамматика, задаёт определённый набор лексем, которые могут встретиться на входе процесса.

Традиционно принято организовывать процесс лексического анализа, рассматривая входную последовательность символов как поток символов. При такой организации процесс самостоятельно управляет выборкой отдельных символов из входного потока.

Распознавание лексем в контексте грамматики обычно производится путём их идентификации согласно идентификаторам токенов, определяемых грамматикой языка. При этом любая последовательность символов входного потока, которая согласно грамматике не может быть идентифицирована как токен языка, обычно рассматривается как специальный токен-ошибка.

Каждый токен можно представить в виде структуры, содержащей идентификатор токена и, если нужно, последовательность символов лексемы, выделенной из входного потока.

Цель такой конвертации обычно состоит в том, чтобы подготовить входную последовательность для другой программы, например для грамматического анализатора, и избавить его от определения лексических подробностей в контекстно-свободной грамматике.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *