![]() |
|
|
Регистрация | << Правила форума >> | FAQ | Пользователи | Календарь | Поиск | Сообщения за сегодня | Все разделы прочитаны |
![]() |
|
Опции темы | Поиск в этой теме | Опции просмотра |
#1
|
|||
|
|||
![]() У меня такая проблема. Ребят, помогите кто сможет.
Задача: Есть документы формата MS Word 97-2003 (*.doc). В каждый документ помещено несколько статей. Каждая статья отделена от предыдущей Заголовком. Задание: выяснить, сколько статей в каждом документе, и сохранить их каждую, в отдельный документ TXT. Названием для этого TXT должен стать заголовок статьи. Пример: Document1.doc Произвольный заголовок 1 Произвольный текст статьи Произвольный заголовок 2 Произвольный текст статьи Результат работы программы: 1.Произвольный заголовок 1.txt 2.Произвольный заголовок 2.txt Я уже весь день сегодня промучался. Не знаю как и сделать. Т.е. были мысли сначала конвертить данный *.doc в html через компонент Word, а потом по тегам (компонент при конверте как я понял на экспериментах форматирование сохраняет) <p> и </p> вычлинять куски текста и сохранять. Но моих знаний тут не хватает. Помогите пожалуйста кто может. Спасибо. |
#2
|
|||
|
|||
![]() Если формат заголовка известен, то можно прямо через ОЛЕ-фитоматизацию найти заголовки, выделить текст между ними и забрать его к себе (возможно, придется через буфер обмена).
Ну а уж как сохранять документ в текстовый файл, думаю, разберешься. Делали подобную штуку, но на C#. Так что смотри в эту сторону. |
#3
|
|||
|
|||
![]() если заголовки имеют тип "заголовок N" то думаю можно по типу определить. Например когда в ворде создаешь Оглавление, то нужно отметить заголовки этип типом и выбрать пункт "вставка-ссылка-оглавление и указатели".
Скорей всего этим методом можно воспользоватся в своих целях, только надо узнать можно ли обратится к нему из стандартных типов делфи или придется напрямую обратится к dll-библиотеке. |
#4
|
|||
|
|||
![]() Да я понимаю алгоритм действия. Я знаю, что надо найти заголовки, скопировать их в переменную типа string x1, выделить текст, скопировать его в x2. Создать текстовый документ и file name=x1. А потом открыть его на запись и записать в него x2. Ребят, я методов реализации не знаю. Т.е. куски кода мне нужны. Еще проблема в том, что это надо делать не для 1 документа. А для группы. Т.е. в open.dialog должна открываться пачка файлов. А 1 там будет или 1000 этого никто не знает. Вернее я знаю, что я буду открывать, я программу под себя пишу. Но штук по 15-20 буду. И в этом для меня тоже проблема. На винграде дале ссылку на такой документ. Я почитал и совсем запутался. Я честно признаюсь - я новичек. Я что-то знаю. Стараюсь. Но не вытянуть мне сейчас это одному. Поэтому и прошу помочь вас мне разобраться.
Последний раз редактировалось FreeUser, 14.08.2008 в 08:27. |
#5
|
|||
|
|||
![]() Да, забыл. Есть еще там одно. Формат заголовка не известен. Т.е. может быть так:
Глава1. Заголовок главы1. Параграф1. Заголовок параграфа1. Текст Параграфа1. Параграф2.Заголовок параграфа2. Текст Параграфа1. То есть в названия файлов помещается в данном случае не название главы, а название параграфа. Видимо тут надо считать количество символов между заголовками. Т.е. если например символов менее 500 (в моих документах нет менее 500, а если, есть то это аннотация главы, т.е. ее в любом случае необходимо игнорировать), то такой текст надо пропускать, до следующего заголовка. |
#6
|
|||
|
|||
![]() Ну найди закономерности для начала, без нее автоматизация не возможна.
Например шрифт у заголовков другой, количество "энтеров" после текста и тд. а с вордом как работать это уже другое дело. |
#7
|
|||
|
|||
![]() Закономерности:
Все эти заголовки Глав и Параграфов - это не вручную проставленные произвольные Тип шрифта и Размеры оного, а выбранные из меню заголовков (это важно!). Т.е. у Word в шаблонах есть понятие (именно так и называется) "Заголовок 1", "Заголовок 2". Выделил любой текст, нажал на кнопку "Заголовок 1" и Word уже сам применил к нему форматирование, заданное заранее(форматирование не содержит стандартов. У одного пользователя в "Заголовок 1" размер шрифта может стоять "1", а у другого "7". Но сам Ворд ставит "флаг" о том, что данный текст принадлежит классу "Заголовок"). Т.е. если навести курсор на текст, Word напишет - "Заголовок 1". Если бы была возможна конструкция x=zagolovok; Till EOF do If flag = x then MsgBox ('Naiden zagolovok') То мы могли бы понять что найден заголовок. Т.е. сам Ворд знает что он нашел заголовок. Заголовок может быть любого цвета и размера. Но Ворд в месте существования этого заголовка знает о его наличии. Но это знание применить я пока не в силах. Последний раз редактировалось FreeUser, 14.08.2008 в 20:39. |
#8
|
|||
|
|||
![]() поищи такие темы в инете
http://yandex.ru/yandsearch?clid=958...BD%D0%B8%D0%B5 |