frug: Анализ текста по шаблонам

8 сообщений / 0 new

Для комментирования войдите или зарегистрируйтесь

Втр, 20/02/2007 - 15:33

Гость

frug: Анализ текста по шаблонам

Имеется вполне структурированный текст, в удобочитаемом для человека виде (срез биллинга сотового оператора), текст содержит, как и просто всякие пояснения, так и таблицы. Подскажите какой нибудь разумный алгоритм для анализа и разбора текста по шаблонам, в данном случае не имеются в виду только регулярные выражения, а методика комбинированная с ними, что нибудь в духе "макро-шаблонов" (название выдумано гипотетически).

ср, 21/02/2007 - 11:41

cin

Не в сети

Зарегистрирован: 21/09/2010

Ну, раздели эту процедуру на два этапа:
1. отдели текст от таблиц;
2. отдельно текст, отдельно таблицы регэкспами рагребай.

ср, 21/02/2007 - 15:14

frug (не проверено)

Это в общих чертах понятно, просто не хотелось бы велосипед изобретать (хотя почему нет ? :-) )
Вот подумал, может кто стандартные общепринятые технологии знает.

сб, 24/02/2007 - 14:55

faber (не проверено)

парсеров навалом, для использования в любых языках. bison для c, boost::spirit для c++, pyparser для питона.

сб, 24/02/2007 - 17:00

wlads

Не в сети

Зарегистрирован: 20/09/2010

grep| awk?

вс, 25/02/2007 - 12:35

mitix (не проверено)

perl + regexp?

вс, 25/02/2007 - 14:28

frug (не проверено)

[blockquote]mitix говорит...
>> perl + regexp?[/blockquote]
[blockquote]в данном случае не имеются в виду только регулярные выражения, а методика комбинированная с ними, что нибудь в духе "макро-шаблонов"[/blockquote]
Может быть я не ясно выразился, но имел в виду какую-нибудь стандартную библиотеку или методику разбора сложно структурированного текста, не отрицая регулярных выражений, но комбинированную с ними.
[blockquote]grep| awk?[/blockquote] sed тоже хорош...

пт, 11/05/2007 - 20:40

frug (не проверено)

Нашел одну прогу по тематике - [link=http://freshmeat.net/projects/asciireportstoopenofficespreadsheet/]republic[/link]

frug: Анализ текста по шаблонам

Вход в систему

Найти

Навигация

Теги

Новое на форуме

Последние комментарии

Лучшее от Линуксцентра: