Имеется вполне структурированный текст, в удобочитаемом для человека виде (срез биллинга сотового оператора), текст содержит, как и просто всякие пояснения, так и таблицы. Подскажите какой нибудь разумный алгоритм для анализа и разбора текста по шаблонам, в данном случае не имеются в виду только регулярные выражения, а методика комбинированная с ними, что нибудь в духе "макро-шаблонов" (название выдумано гипотетически).
frug: Анализ текста по шаблонам
Ну, раздели эту процедуру на два этапа:
1. отдели текст от таблиц;
2. отдельно текст, отдельно таблицы регэкспами рагребай.
Это в общих чертах понятно, просто не хотелось бы велосипед изобретать (хотя почему нет ? :-) )
Вот подумал, может кто стандартные общепринятые технологии знает.
парсеров навалом, для использования в любых языках. bison для c, boost::spirit для c++, pyparser для питона.
grep| awk?
perl + regexp?
[blockquote]mitix говорит...
>> perl + regexp?[/blockquote]
[blockquote]в данном случае не имеются в виду только регулярные выражения, а методика комбинированная с ними, что нибудь в духе "макро-шаблонов"[/blockquote]
Может быть я не ясно выразился, но имел в виду какую-нибудь стандартную библиотеку или методику разбора сложно структурированного текста, не отрицая регулярных выражений, но комбинированную с ними.
[blockquote]grep| awk?[/blockquote] sed тоже хорош...
Нашел одну прогу по тематике - [link=http://freshmeat.net/projects/asciireportstoopenofficespreadsheet/]republic[/link]

Последние комментарии
10 лет 17 недель назад
10 лет 36 недель назад
10 лет 46 недель назад
10 лет 46 недель назад
11 лет 35 недель назад
11 лет 35 недель назад
11 лет 36 недель назад
11 лет 36 недель назад
11 лет 36 недель назад
11 лет 38 недель назад