frug: Анализ текста по шаблонам

8 сообщений / 0 new
Последнее сообщение
Гость
frug: Анализ текста по шаблонам

Имеется вполне структурированный текст, в удобочитаемом для человека виде (срез биллинга сотового оператора), текст содержит, как и просто всякие пояснения, так и таблицы. Подскажите какой нибудь разумный алгоритм для анализа и разбора текста по шаблонам, в данном случае не имеются в виду только регулярные выражения, а методика комбинированная с ними, что нибудь в духе "макро-шаблонов" (название выдумано гипотетически).

cin
Не в сети
Зарегистрирован: 21/09/2010

Ну, раздели эту процедуру на два этапа:
1. отдели текст от таблиц;
2. отдельно текст, отдельно таблицы регэкспами рагребай.

frug (не проверено)

Это в общих чертах понятно, просто не хотелось бы велосипед изобретать (хотя почему нет ? :-) )
Вот подумал, может кто стандартные общепринятые технологии знает.

faber (не проверено)

парсеров навалом, для использования в любых языках. bison для c, boost::spirit для c++, pyparser для питона.

wlads
Не в сети
Зарегистрирован: 20/09/2010

grep| awk?

mitix (не проверено)

perl + regexp?

frug (не проверено)

[blockquote]mitix говорит...
>> perl + regexp?[/blockquote]
[blockquote]в данном случае не имеются в виду только регулярные выражения, а методика комбинированная с ними, что нибудь в духе "макро-шаблонов"[/blockquote]
Может быть я не ясно выразился, но имел в виду какую-нибудь стандартную библиотеку или методику разбора сложно структурированного текста, не отрицая регулярных выражений, но комбинированную с ними.
[blockquote]grep| awk?[/blockquote] sed тоже хорош...

frug (не проверено)

Нашел одну прогу по тематике - [link=http://freshmeat.net/projects/asciireportstoopenofficespreadsheet/]republic[/link]

RSS-материал