Форум по Delphi программированию

Delphi Sources



Вернуться   Форум по Delphi программированию > Все о Delphi > [ "Начинающим" ]
Ник
Пароль
Регистрация <<         Правила форума         >> FAQ Пользователи Календарь Поиск Сообщения за сегодня Все разделы прочитаны

Ответ
 
Опции темы Поиск в этой теме Опции просмотра
  #1  
Старый 13.08.2008, 20:03
FreeUser FreeUser вне форума
Начинающий
 
Регистрация: 13.08.2008
Сообщения: 119
Репутация: 10
По умолчанию Довольно сложный вопрос

У меня такая проблема. Ребят, помогите кто сможет.
Задача: Есть документы формата MS Word 97-2003 (*.doc).
В каждый документ помещено несколько статей. Каждая статья отделена от предыдущей Заголовком. Задание: выяснить, сколько статей в каждом документе, и сохранить их каждую, в отдельный документ TXT. Названием для этого TXT должен стать заголовок статьи.

Пример:
Document1.doc
Произвольный заголовок 1
Произвольный текст статьи

Произвольный заголовок 2
Произвольный текст статьи

Результат работы программы:

1.Произвольный заголовок 1.txt
2.Произвольный заголовок 2.txt

Я уже весь день сегодня промучался. Не знаю как и сделать. Т.е. были мысли сначала конвертить данный *.doc в html через компонент Word, а потом по тегам (компонент при конверте как я понял на экспериментах форматирование сохраняет) <p> и </p> вычлинять куски текста и сохранять. Но моих знаний тут не хватает. Помогите пожалуйста кто может. Спасибо.
Ответить с цитированием
  #2  
Старый 13.08.2008, 22:13
lmikle lmikle вне форума
Модератор
 
Регистрация: 17.04.2008
Сообщения: 8,096
Версия Delphi: 7, XE3, 10.2
Репутация: 49089
По умолчанию

Если формат заголовка известен, то можно прямо через ОЛЕ-фитоматизацию найти заголовки, выделить текст между ними и забрать его к себе (возможно, придется через буфер обмена).

Ну а уж как сохранять документ в текстовый файл, думаю, разберешься.

Делали подобную штуку, но на C#. Так что смотри в эту сторону.
Ответить с цитированием
  #3  
Старый 14.08.2008, 07:22
Burka Burka вне форума
Начинающий
 
Регистрация: 10.06.2007
Сообщения: 163
Репутация: 10
По умолчанию

если заголовки имеют тип "заголовок N" то думаю можно по типу определить. Например когда в ворде создаешь Оглавление, то нужно отметить заголовки этип типом и выбрать пункт "вставка-ссылка-оглавление и указатели".
Скорей всего этим методом можно воспользоватся в своих целях, только надо узнать можно ли обратится к нему из стандартных типов делфи или придется напрямую обратится к dll-библиотеке.
Ответить с цитированием
  #4  
Старый 14.08.2008, 08:03
FreeUser FreeUser вне форума
Начинающий
 
Регистрация: 13.08.2008
Сообщения: 119
Репутация: 10
По умолчанию

Да я понимаю алгоритм действия. Я знаю, что надо найти заголовки, скопировать их в переменную типа string x1, выделить текст, скопировать его в x2. Создать текстовый документ и file name=x1. А потом открыть его на запись и записать в него x2. Ребят, я методов реализации не знаю. Т.е. куски кода мне нужны. Еще проблема в том, что это надо делать не для 1 документа. А для группы. Т.е. в open.dialog должна открываться пачка файлов. А 1 там будет или 1000 этого никто не знает. Вернее я знаю, что я буду открывать, я программу под себя пишу. Но штук по 15-20 буду. И в этом для меня тоже проблема. На винграде дале ссылку на такой документ. Я почитал и совсем запутался. Я честно признаюсь - я новичек. Я что-то знаю. Стараюсь. Но не вытянуть мне сейчас это одному. Поэтому и прошу помочь вас мне разобраться.

Последний раз редактировалось FreeUser, 14.08.2008 в 08:27.
Ответить с цитированием
  #5  
Старый 14.08.2008, 08:20
FreeUser FreeUser вне форума
Начинающий
 
Регистрация: 13.08.2008
Сообщения: 119
Репутация: 10
По умолчанию

Да, забыл. Есть еще там одно. Формат заголовка не известен. Т.е. может быть так:
Глава1. Заголовок главы1.

Параграф1. Заголовок параграфа1.
Текст Параграфа1.

Параграф2.Заголовок параграфа2.
Текст Параграфа1.

То есть в названия файлов помещается в данном случае не название главы, а название параграфа. Видимо тут надо считать количество символов между заголовками. Т.е. если например символов менее 500 (в моих документах нет менее 500, а если, есть то это аннотация главы, т.е. ее в любом случае необходимо игнорировать), то такой текст надо пропускать, до следующего заголовка.
Ответить с цитированием
  #6  
Старый 14.08.2008, 09:16
Burka Burka вне форума
Начинающий
 
Регистрация: 10.06.2007
Сообщения: 163
Репутация: 10
По умолчанию

Ну найди закономерности для начала, без нее автоматизация не возможна.

Например шрифт у заголовков другой, количество "энтеров" после текста и тд. а с вордом как работать это уже другое дело.
Ответить с цитированием
  #7  
Старый 14.08.2008, 10:03
FreeUser FreeUser вне форума
Начинающий
 
Регистрация: 13.08.2008
Сообщения: 119
Репутация: 10
По умолчанию

Закономерности:

Все эти заголовки Глав и Параграфов - это не вручную проставленные произвольные Тип шрифта и Размеры оного, а выбранные из меню заголовков (это важно!). Т.е. у Word в шаблонах есть понятие (именно так и называется) "Заголовок 1", "Заголовок 2". Выделил любой текст, нажал на кнопку "Заголовок 1" и Word уже сам применил к нему форматирование, заданное заранее(форматирование не содержит стандартов. У одного пользователя в "Заголовок 1" размер шрифта может стоять "1", а у другого "7". Но сам Ворд ставит "флаг" о том, что данный текст принадлежит классу "Заголовок"). Т.е. если навести курсор на текст, Word напишет - "Заголовок 1". Если бы была возможна конструкция

x=zagolovok;
Till EOF do
If flag = x then MsgBox ('Naiden zagolovok')

То мы могли бы понять что найден заголовок. Т.е. сам Ворд знает что он нашел заголовок. Заголовок может быть любого цвета и размера. Но Ворд в месте существования этого заголовка знает о его наличии. Но это знание применить я пока не в силах.

Последний раз редактировалось FreeUser, 14.08.2008 в 20:39.
Ответить с цитированием
  #8  
Старый 14.08.2008, 21:29
Burka Burka вне форума
Начинающий
 
Регистрация: 10.06.2007
Сообщения: 163
Репутация: 10
По умолчанию

поищи такие темы в инете
http://yandex.ru/yandsearch?clid=958...BD%D0%B8%D0%B5
Ответить с цитированием
Ответ


Delphi Sources

Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB-коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход


Часовой пояс GMT +3, время: 01:07.


 

Сайт

Форум

FAQ

Соглашения

Прочее

 

Copyright © Форум "Delphi Sources" by BrokenByte Software, 2004-2025