Многократный Парсинг Блоков

Uniq! · #1 12.08.2012, 21:16

Использую: TPerlRegEx

Задача: разобрать конечное количество однообразных блоков страницы.

Пример блока:

Код HTML:

  <tr class="even">
    <td align="right">1</td>
    <td><a href="/m13/en/1.html">Ajani, Caller of the Pride</a></td>
    <td>Planeswalker — Ajani (Loyalty: 4)</td>
    <td>1WW</td>
    <td>Mythic Rare</td>
    <td>D. Alexander Gregory</td>
    <td><img src="http://magiccards.info/images/en.gif" alt="English" width="16" height="11" class="flag2"> Magic 2013</td>
  </tr>

Код ВСЕЙ страницы получаю по средствам str: = TIdHttp.Get('url.html'); (сомнительно, что это грамотно в этом случае

)

Собственно регулярка вот:

Код HTML:

                <td><a href="/m13/en/1.html">Ajani, Caller of the Pride</a></td>
RegEx.RegEx := '<td><a href="/m13/en/(.*?).html">(.*?)</a></td>';

Вытащить надо естественно каждую колонку ( <td> ... </td> )

Код:

cNum := RegEx.Group[1]; \\ номер элемента
cName := RegEx.Group[2]; \\ имя элемента

Как быть с остльным? cType(Planeswalker ), cSubType(Ajani), cCmC(1WW)

lmikle · #2 12.08.2012, 23:39

Цитата:

Сообщение от Uniq!

Использую: TPerlRegEx
Задача: разобрать конечное количество однообразных блоков страницы.

А не проще загрузить это дело в любой DOM-парсер и потом просто "пробежаться" по коллекции?

Pyro · #3 13.08.2012, 08:05

метод scan по всем td, получится список, пройтись циклом

Код:

if (i mod column_count) == 3 then //вроде 4 колонка
//...

Uniq! · #4 13.08.2012, 21:42

Цитата:

Сообщение от lmikle

А не проще загрузить это дело в любой DOM-парсер и потом просто "пробежаться" по коллекции?

Спасибо за наводочку.
Гугл и вики уже помогли чем смогли. От разнообразия глаза разбежались. Для простотырешения вопроса, посоветуйте? МБ даже есть уже включённый ДОМпарсер в XE2 ?

lmikle · #5 13.08.2012, 23:27

MSHTML не подходит?
А если код удовлетворяет спецификации xhtml, то можно просто в TXMLDocument засунуть.

Опции темы	Поиск в этой теме
Версия для печати Отправить на Email	Поиск в этой теме: Расширенный поиск
Опции просмотра
Линейный вид Комбинированный вид Древовидный вид

	Сайт	Форум	FAQ	Соглашения	Прочее
	Новости Исходники Компоненты Статьи Добавить исходник Поиск	Правила Поиск Сообщения за сегодня Пользователи Кто на форуме?	Delphi FAQ - 5000 статей DRKB - 4500 статей (ZIP-архив) Справочник функций и процедур Delphi Delphi Programming Guide Indy in Depth. Глубины Indy	Конфиденциальность Соглашение пользователя Правила обработки cookie	О сайте Donate Контакты

Этот пользователь сказал Спасибо lmikle за это полезное сообщение:
Uniq! (13.08.2012)

Этот пользователь сказал Спасибо lmikle за это полезное сообщение:
Uniq! (14.08.2012)