Рабочий пример простого парсера математических выражений

Время создания: 16.07.2021 10:02

Автор: Xintrea

Текстовые метки: c++, парсер, математическое, выражение, синтаксическое дерево, польская нотация, parser, библиотека

Раздел: Компьютер - Программирование - Язык C++ (Си++)

Запись: xintrea/mytetra_syncro/master/base/1626418975ycq3zktswn/text.html на raw.github.com

Иногда в проекте на Си++ необходимо иметь небольшой математический парсер. Он может пригодиться, например, для разбора математических выражений, которые прописываются в XML-конфиге программы.

Наиболее простые способы это сделать - либо воспользоваться C/C++ биндингами к скриптовым языкам программирования (например, можно интегрировать вызовы функций LUA или Perl), либо включить в проект готовую системную или стороннюю библиотеку математического парсинга (например, muparser, ExprTk или CMathParser). Однако бывают ситуации, когда сделать это невозможно: например, программа пишется для сертифицированной среды, в которой нет нужных библиотек и инструментов, а сторонние запрещены; либо использование ПО предполагается на очень ограниченных встраиваемых системах. Именно для таких ситуаций хорошо бы иметь небольшой самописный математический парсер.

В Интернете есть много информации по методам создания математических парсеров. Но, к сожалению, нет готового компактного решения, которое содержало бы в себе основной базис. Можно найти куски реализации того или иного аспекта разбора и преобразования математического выражения, но готовые реализации "всего вместе" можно пересчитать по пальцам. И эти реализации, зачастую, могут иметь фундаментальные странности - например тот же CMathParser заточен только под Windows и без правки исходного кода не будет работать в Linux, достаточно посмотреть на его заголовки:

#include <Windows.H>

#include <StdIO.H>

#include <StdLib.H>

#include <Math.H>

#include <Float.H>

#include <Limits.H>

Ниже приведен рабочий пример математического парсера, который умеет работать с целыми и вещественными числами, и поддерживает четыре основных математических действия - сложение, вычитание, умножение, деление. Парсер имеет стандартный математический приоритет операций. Так же в этом парсере поддерживаются круглые скобки и запись отрицательного числа. Переменные и константы не поддерживаются, но парсер настолько прост, что их внедрение не представляет особого труда, если возникнет такая задача.

Данный парсер содержит выдернутые из интернета реализации абстрактного синтаксического дерева (AST) и генератора прямой польской нотации (а не обратной, просто потому что первым рабочим примером была найдена именно эта парочка). Вычисление итогового значения по прямой польской нотации дописано самостоятельно с использованием библиотеки Qt, просто потому что в ней есть готовые удобные контейнерные классы, да и целевой проект написан на Qt. Перевод с Qt на STD этой части кода пусть будет домашним упражнением для студентов факультетов информатики.

Заголовок math_parser.h

#include <algorithm>

#include <iostream>

#include <string>

#include <cctype>

#include <iterator>

using namespace std;

// Представление математического выражения в виде дерева

class Exp

{

public:

Exp(){}

virtual ~Exp(){}

virtual void release(){}

virtual string print(){ return ""; }

static float calculate(string &exp);

static float calculate(const QString &exp);

private:

static Exp* strToExp(string &str); // Построитель абстрактного дерева из строки

};

// Конечный элемент абстрактного дерева

class Term : public Exp

{

public:

Term(string v) : val(v){}

void release(){}

string print();

private:

string val;

};

// Узел абстрактного дерева

class Node : public Exp

{

public:

Node(char op, Exp* left, Exp* right) : op(op), l_exp(left), r_exp(right){}

~Node(){}

void release();

string print();

private:

char op; // Возможные значения +, -, *, /

Exp *l_exp;

Exp *r_exp;

};

Реализация math_parser.cpp

#include <QString>

#include <QStringList>

#include <QDebug>

#include "math_parser.h"

using namespace std;

// Преобразование обычного (инфиксного) математического выражения в польскую нотацию

Exp* Exp::strToExp(string &str)

{

int level = 0;

// Обработка + или -

for(int i=str.size()-1; i>=0; --i){

char c = str[i];

if(c == ')'){

++level;

continue;

}

if(c == '('){

--level;

continue;

}

if(level > 0) continue;

if((c == '+' || c == '-') && i != 0 ){ // Если i==0 тогда s[0] содержит знак

string left(str.substr(0, i));

string right(str.substr(i+1));

return new Node(c, strToExp(left), strToExp(right));

}

// Обработка * или /

for(int i=str.size()-1; i>=0; --i){

char c = str[i];

if(c == ')'){

++level;

continue;

}

if(c == '('){

--level;

continue;

}

if(level>0) continue;

if(c == '*' || c == '/'){

string left(str.substr(0,i));

string right(str.substr(i+1));

return new Node(c, strToExp(left), strToExp(right));

}

// Рекурсивная обработка выражений в скобках

if(str[0] == '('){

for(int i=0; i<static_cast<int>(str.size()); ++i){

if(str[i] == '('){

++level;

continue;

}

if(str[i] == ')'){

--level;

if(level == 0){

string exp(str.substr(1, i-1));

return strToExp(exp);

}

continue;

}

} else // Иначе скобок нет, строка рассмативается как конечный узел

return new Term(str);

cerr << "Error: never execute point" << endl;

return nullptr;

}

// Высчитывание результата математического выражения из QString

float Exp::calculate(const QString &exp)

{

// Для последующей передачи ссылки на std::string, строка должна существовать

string text=exp.toStdString();

return Exp::calculate( text );

}

// Высчитывание результата математического выражения из std::string

float Exp::calculate(string &exp)

{

// Удаление лишних пробелов

exp.erase(remove_if(exp.begin(), exp.end(), ::isspace), exp.end());

// Построение дерева

Exp *tree = Exp::strToExp(exp);

if(!tree)

{

qDebug() << "Incorrect math expression: " << QString(exp.c_str());

return 0;

}

// Получение прямой польской нотации с пробелами и скобками

QString polkaNote=tree->print().c_str();

// qDebug() << "Infix: " << QString(exp.c_str());

// qDebug() << " Polka notation: "<< QString(tree->print().c_str());

// Очистка дерева

tree->release();

delete tree;

// ---------------------------------

// Обработка прямой польской нотации

// ---------------------------------

// Убираются скобки, в прямой польской нотации для алгоритма прохода по выражению они не нужны

polkaNote=polkaNote.remove("(");

polkaNote=polkaNote.remove(")");

// Список частей выражения в польской нотации

QStringList chunks=polkaNote.split(" ", QString::SkipEmptyParts);

// qDebug() << chunks;

// Алгоритм: пробегать по списку от конца к началу.

// Если найден оператор, справа от него берутся два операнда и расчитывается значение.

// Расчитанное значение кладется в список на место оператора, операнды удаляются из списка

// Действие повторяется, пока размер списка не станет равным единице,

// и в нем будет итоговое значение

const QStringList availableOperation=QStringList() << "+" << "-" << "*" << "/";

while(chunks.length() > 1)

{

int pointer = chunks.length();

QString symbol = "";

{

--pointer;

symbol=chunks[pointer];

}

while( !availableOperation.contains(symbol) );

float result = 0;

if(symbol == "+")

{

result = chunks[pointer+1].toFloat() + chunks[pointer+2].toFloat();

}

else if (symbol=="-")

{

if( chunks.length()!=2 )

{

result = chunks[pointer+1].toFloat() - chunks[pointer+2].toFloat();

}

else

{

// В конце расчета может возникнуть ситуация {"-", "число"}

result = 0 - chunks[pointer+1].toFloat();

}

else if (symbol=="*")

{

result = chunks[pointer+1].toFloat() * chunks[pointer+2].toFloat();

}

else if (symbol=="/")

{

result = chunks[pointer+1].toFloat() / chunks[pointer+2].toFloat();

}

// Результат кладется на место оператора

chunks[pointer]=QString::number(result);

// Удаляются операнды

chunks.removeAt(pointer+1); // Левый

if(chunks.length()>pointer)

{

chunks.removeAt(pointer+1); // Правый

}

return chunks[0].toFloat();

}

string Term::print()

{

return string(" ")+val+string(" ");

}

string Node::print()

{

return string("(")+op+string(" ")+l_exp->print()+r_exp->print()+string(")");

}

void Node::release(){

l_exp->release();

r_exp->release();

delete l_exp;

delete r_exp;

}

Использование:

#include "math_parser.h"

...

QString mathExpression="1+2*3";

float result=Exp::calculate( mathExpression );

Кстати, неплохая теория (правда, с примерами на Паскале), изложена вот в этой статье: Практика разбора математических выражений: прямая польская запись.

Что касается обратной польской записи, то весьма компактный парсер на C++ приведен в статье Разбор математических выражений. Обратная польская нотация.

Для тех кому нужна поддержка именованных констант (переменных), можно посмотреть статью Еще один пример простого парсера математических выражений, с поддержкой именованных констант.

Так же в этом разделе:

MyTetra Share v.0.67