Показать сообщение отдельно
  #1  
Старый 13.08.2008, 20:03
FreeUser FreeUser вне форума
Начинающий
 
Регистрация: 13.08.2008
Сообщения: 119
Репутация: 10
По умолчанию Довольно сложный вопрос

У меня такая проблема. Ребят, помогите кто сможет.
Задача: Есть документы формата MS Word 97-2003 (*.doc).
В каждый документ помещено несколько статей. Каждая статья отделена от предыдущей Заголовком. Задание: выяснить, сколько статей в каждом документе, и сохранить их каждую, в отдельный документ TXT. Названием для этого TXT должен стать заголовок статьи.

Пример:
Document1.doc
Произвольный заголовок 1
Произвольный текст статьи

Произвольный заголовок 2
Произвольный текст статьи

Результат работы программы:

1.Произвольный заголовок 1.txt
2.Произвольный заголовок 2.txt

Я уже весь день сегодня промучался. Не знаю как и сделать. Т.е. были мысли сначала конвертить данный *.doc в html через компонент Word, а потом по тегам (компонент при конверте как я понял на экспериментах форматирование сохраняет) <p> и </p> вычлинять куски текста и сохранять. Но моих знаний тут не хватает. Помогите пожалуйста кто может. Спасибо.
Ответить с цитированием