Имеется вполне структурированный текст, в удобочитаемом для человека виде (срез биллинга сотового оператора), текст содержит, как и просто всякие пояснения, так и таблицы. Подскажите какой нибудь разумный алгоритм для анализа и разбора текста по шаблонам, в данном случае не имеются в виду только регулярные выражения, а методика комбинированная с ними, что нибудь в духе "макро-шаблонов" (название выдумано гипотетически).
frug: Анализ текста по шаблонам
Ну, раздели эту процедуру на два этапа:
1. отдели текст от таблиц;
2. отдельно текст, отдельно таблицы регэкспами рагребай.
Это в общих чертах понятно, просто не хотелось бы велосипед изобретать (хотя почему нет ? :-) )
Вот подумал, может кто стандартные общепринятые технологии знает.
парсеров навалом, для использования в любых языках. bison для c, boost::spirit для c++, pyparser для питона.
grep| awk?
perl + regexp?
[blockquote]mitix говорит...
>> perl + regexp?[/blockquote]
[blockquote]в данном случае не имеются в виду только регулярные выражения, а методика комбинированная с ними, что нибудь в духе "макро-шаблонов"[/blockquote]
Может быть я не ясно выразился, но имел в виду какую-нибудь стандартную библиотеку или методику разбора сложно структурированного текста, не отрицая регулярных выражений, но комбинированную с ними.
[blockquote]grep| awk?[/blockquote] sed тоже хорош...
Нашел одну прогу по тематике - [link=http://freshmeat.net/projects/asciireportstoopenofficespreadsheet/]republic[/link]
Последние комментарии
9 лет 42 недели назад
10 лет 9 недель назад
10 лет 19 недель назад
10 лет 19 недель назад
11 лет 8 недель назад
11 лет 8 недель назад
11 лет 9 недель назад
11 лет 9 недель назад
11 лет 10 недель назад
11 лет 11 недель назад